Cyber、EigenLayer、Sentient、RootData 等聯合推出 Crypto AI Benchmark Alliance,樹立 Crypto AI 新標杆
通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。
Cyber、EigenLayer、Sentient 等 14 家區塊鏈與人工智慧項目方今日共同宣布成立 Crypto AI Benchmark Alliance(CAIBA)。這一開源、社區驅動的聯盟將致力於為加密行業的 AI 模型與智能體建立透明、可信的評測標準。
首批發起成員------Alchemy、Cyber、Dune、EigenLayer、Goldsky、IOSG、LazAI、Magic Newton、Metis、MyShell、OpenGradient、RootData、Sentient 與 Thirdweb------會一起合作貢獻數據集、工具與專業知識,共同搭建評測框架。每一套基準將包含任務、參考答案及評分腳本,並在 GitHub、Hugging Face 等平台以開放許可證(許可範圍允許時)發布。
隨著 AI 在加密領域的應用不斷擴張,從交易策略到研究助手無所不包,傳統 AI 基準已難以反映該行業的獨特需求。CAIBA 旨在彌補這一空白,推出面向加密場景的專業評測。
"透明而嚴格的測試至關重要,"Cyber 聯合創始人 Ryan Li 表示,"模型不僅要答對題,還必須可靠執行,讓用戶在決策時更有信心。"
聯盟首個成果 a Benchmark for Crypto AI Agents(CAIA) 現已上線,它從三大維度衡量 AI 能力:
- 知識(Knowledge):精確回答協議、代幣等問題
- 規劃(Planning):制定多步驟任務方案
- 行動(Action):借助區塊瀏覽器和 API 完成操作
CAIA 覆蓋了代幣經濟學、鏈上分析、項目研究及交易流程等場景,評測對象包括 GPT-4o、Claude 4、Gemini 2.5、DeepSeek-R1 等通用大模型,以及多款加密原生模型。
通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。聯盟已在開發更多基準,並歡迎新成員加入。開發者、研究者和協議團隊可提交模型參與評測,或提出全新任務。
關於 Crypto AI Benchmark Alliance(CAIBA)
Crypto AI Benchmark Alliance 是一個社區治理的開放聯盟,專注於制定面向加密場景的 AI 評測標準。通過開放數據集、可復現任務與公共排行榜,CAIBA 為開發者、研究者和協議提供工具,衡量並改進區塊鏈應用中的 AI 系統。了解詳情,請訪問 caiba.ai 。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
Aethir Edge 將於 2.0 月 13 日發布 Tokenomics XNUMX,為貢獻者引入永續獎勵系統
簡單來說 Aethir Edge 宣布計劃在其更新的 Tokenomics 2.0 中推出新的基於權益的獎金結構,該結構將於 13 月 XNUMX 日起生效。

Matrixport:美國宏觀經濟數據疲軟或引發市場波動,挑戰比特幣上漲動能
簡單來說 Matrixport 最近的分析警告稱,美國宏觀經濟數據疲軟和新興市場風險可能會導致加密貨幣市場的不確定性和整合增加,這可能會限制比特幣的上漲勢頭。

EigenLayer 推出重新分配功能,讓 AVS 重新利用和分配被削減的資金
簡單來說 EigenLayer 在 Holesky、Sepolia 和 Hoodi 以太坊測試網路上推出了其重新分配功能,預計將於 6 月底或 7 月在主網部署。

Anthropic 推出 Claude Gov:專為美國國家安全開發的人工智慧模型
簡單來說 Anthropic 推出了 Claude Gov,這是其 AI 型號的專門版本,專為美國國家安全用途而設計,旨在在機密環境中運行,同時滿足嚴格的安全和操作標準。

熱門新聞
更多加密貨幣價格
更多








