Anthropic 的新「思考」工具讓 Claude 能夠在複雜的工具使用情況下暫停並進行反思
簡單來說 Anthropic 引入了「思考」工具,該工具允許 Claude 在得出最終答案之前添加額外的思考步驟(並具有自己指定的空間)。
專門從事人工智慧安全和研究的公司, 人類的 推出了「思考」工具,為複雜任務過程中的結構化思考提供了專用的空間。該工具使 Claude 在得出最終答案之前能夠加入額外的思考步驟——具有自己指定的空間。
儘管這概念看似與擴展思維相似,但還是存在著關鍵的差異。在克勞德開始回應之前,他會進行深入的思考,深入考慮並改進其方法。相較之下,「思考」工具是在 Claude 開始產生回應後使用的,允許它暫停並評估是否已收集繼續進行所需的所有資訊。這在涉及長時間的工具呼叫或與使用者進行多步驟對話的任務中尤其有用。
當 Claude 無法從使用者查詢中獲得足夠的資訊並且需要處理外部資料(例如來自工具呼叫的結果)時,「Think」工具特別有效。工具背後的推理不如擴展思考過程那麼全面,而更著重於整合任務過程中出現的新資訊。
Anthropic 建議對更簡單的場景使用擴展思維,例如非連續的工具呼叫或直接的指令。它對於編碼、數學和物理等任務也非常有效,因為 Claude 不需要依賴外部工具。該工具更適合更複雜的任務,其中 Claude 必須仔細分析工具輸出,在政策繁重的環境中遵循詳細指南,或做出相互依存的連續決策,而錯誤可能會產生後果。
實施「思考」工具的最佳實踐
為了最大限度地發揮 Claude 的「Think」工具的優勢,Anthropic 根據其 τ-bench 實驗推薦了以下實施實踐。
最有效的策略是提供關於何時以及如何使用「思考」工具的明確指示。這在τ-bench航空領域尤為明顯,特定領域的範例大大增強了模型應用「思考」工具的有效性。這些範例應包括幾個方面的指導,例如:概述推理過程中預期的細節程度,將複雜的指令分解為可操作的步驟,提供處理常見場景的決策樹,並幫助評估是否已收集所有必要的資訊。
此外, 人類的 發現對於長或複雜的指令,將它們放在系統提示中比將它們包含在工具描述本身中更有效。透過提供更廣泛的背景,這使得模型能夠將思考過程更好地融入其整體行為中。
將「Think」工具整合到Claude實作中相對簡單,並且可以帶來改進。該公司建議從具有挑戰性的用例開始,特別是那些 Claude 在長鏈工具呼叫中難以遵守政策或進行複雜推理的用例。使用者可以從新增工具開始 defi並實施特定於該領域的客製化的「思考」工具。這個過程需要最少的編碼但有助於更結構化的推理。使用者還應考慮在系統提示中加入有關何時以及如何使用該工具的說明,以及與領域相關的範例。
一旦工具到位,鼓勵用戶透過觀察其使用情況來監控和改進其使用情況 克勞德 運用到實踐中。他們可以調整提示以促進更有效的思考模式。新增工具在效能方面幾乎沒有缺點。除非 Claude 選擇使用它,否則它不會改變外部行為,而且它不會幹擾現有的工具或工作流程。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
兩名佛羅里達州16歲少年因400萬美元加密貨幣綁架和盜竊面臨22項重罪指控
簡要報導 根據當地媒體報導,兩名青少年因涉嫌在拉斯維加斯持槍綁架一名男子並盜取價值400萬美元的加密貨幣和NFT而面臨成人重罪指控。第三名青少年也面臨指控,但據信已不在國內。記錄顯示,其中一名青少年聘請了一位知名的辯護律師。

高盛將IBIT持股增加28%,而貝萊德的比特幣ETF在2025年創下最長資金流入紀錄
簡要概述 高盛在2025年第一季度將其持股量增加28%後,現已成為IBIT(貝萊德現貨比特幣ETF)的最大持股者。IBIT連續20天的淨流入是2025年所有現貨比特幣ETF中最長的一次,期間吸引了超過50億美元的資金流入。

ArbitrumDAO 選擇 Franklin Templeton、Spiko 和 WisdomTree 作為 STEP 2 合作夥伴,以擴大現實世界資產的鏈上應用
簡單來說 ArbitrumDAO 已批准其穩定財政捐贈計畫的下一階段,向富蘭克林鄧普頓、Spiko 和 WisdomTree 管理的代幣化美國國債資產分配 35 萬 ARB。

Vana 推出 Vana Academy,支持數據資本業務並推動 AI 數據經濟
簡單來說 Vana 推出了 Vana Academy,這是一個為期九週的項目,旨在透過指導參與者完成以數據為中心的業務建立流程來支持新興人工智慧數據經濟項目的發展。

加密貨幣價格
更多








