Bitget App
交易「智」變
快速買幣市場交易合約BOT理財跟單
史丹佛HAI《2025年人工智慧指數報告》精華

史丹佛HAI《2025年人工智慧指數報告》精華

BlockBeatsBlockBeats2025/04/14 13:00
作者:BlockBeats

人工智慧更有效率、更易取得且更經濟實惠;此外,亞洲人對人工智慧更為樂觀。

原文標題:The 2025 AI Index Report
原文作者:Stanford HAI(史丹佛人工智慧研究院)
原文編譯:Felix,PANews


原文編輯:Felix,PANews


原文編列以下是人工智慧趨勢的一些關鍵要點:


1. 人工智慧變得比想像的要強大得多


在新的基準測試 MMMU、GPQA 和 SWE-bench 中,人工智慧的表現大幅提升:得分分別提高了 18.8%、48.3%。除了基準測試外,人工智慧系統在產生高品質視訊方面取得重大進展,在某些情況下,大型語言模型(LLM)甚至在限時的程式設計任務中超越了人類。


註:


· MMMU 是一個精心設計的新型基準,專為大學層級的多學科多模態理解和推理而設,旨在評估基礎模型在廣泛任務中的專家級多模態理解能力。


· GPQA 是一個具有挑戰性的資料集,包含 448 道由不同領域專家編寫的高品質且難度極高的多項選擇題。在相應領域擁有或正在攻讀博士學位的專家,準確率僅為 65%,而技能高超的非專家驗證者儘管平均花費時間超過 30 分鐘且可不受限制地訪問網絡,準確率也只有 34%。


· SWE-bench 是一個用於評估大型語言模型(LLM)在從 GitHub 收集的真實世界軟體問題上的表現的基準。


史丹佛HAI《2025年人工智慧指數報告》精華 image 0


2. 人工智慧更高效、更易獲取且更經濟實惠


參數更少的小型人工智慧模型的能力日益增強:在短短兩年內,參數數量減少了約 10% 的小型人工智慧模型的能力在短短兩年內,參數數量減少了 10%。


開源模型與封閉源模型之間的差距也在縮小,在某些基準測試中,效能差距從 8% 降至僅 1.7%。


史丹佛HAI《2025年人工智慧指數報告》精華 image 1


此外,從 2022 年 11 月到 2024 年 10 月,達到 GPT-3.5 水準的系統的推理成本下降了 280 倍以上。在硬體層面,成本每年下降 30%,而能源效率每年提高 40%。


高階人工智慧的門檻正在迅速降低。更不用說像 DeepSeek 這樣的稀疏模型的開發,在專家混合(MoE)的結構下,只有相關的參數會被激活以回答用戶的查詢,使整個事情更加高效。


的確,隨著規模較小但能力較強的 AI 模式不斷湧現,AI 模式訓練的要求降低了,成本效益高的分散式訓練有望在未來十年成為主流。目前有一些頂尖計畫正在基於不同的理論架構進行相關研究。


3. 人工智慧正日益融入日常生活


2023 年,美國食品藥物管理局(FDA)批准了 223 款人工智慧輔助醫療設備,而 2015 年這一數字僅為 6 款。在道路上,自動駕駛汽車已不再是實驗品:美國最大的營運商之一 Waymo 每週提供超過 15 萬次自動駕駛服務,而百度的 Apollo Go 無人駕駛計程車車隊如今已在中國多個城市投入營運。


史丹佛HAI《2025年人工智慧指數報告》精華 image 2


4. 企業在人工智慧領域的投資大幅增加,推動創紀錄的投資和應用


在商業中的應用也在加速:2024 年,7%

人工智慧在商業中的應用也在加速:2024 年,同時,越來越多的研究證實,人工智慧能夠提高生產力,並有助於縮小整個勞動力隊伍中的技能差距。


事實上,隨著人工智慧導致客戶期望值呈指數級增長,現有解決方案會在一夜之間顯得過時,從而使現有企業失去適應的機會,產品市場匹配崩潰的情況會更頻繁地發生。


5. 儘管全球對人工智慧的樂觀情緒上升,但亞洲人對人工智慧更為樂觀


在中國(83%)、印尼(80%)和泰國(77%)等國家,大多數人認為人工智慧產品和服務利比不利。相較之下,在加拿大(40%)、美國(39%)和荷蘭(36%)等地,樂觀情緒仍遠低於此。


不過,這種態度正在轉變:自 2022 年以來,一些此前持懷疑態度的國家的樂觀情緒顯著增長,包括德國(增長 10%)、法國(增長 10%)、加拿大(增長 8%)、英國(增長 8%)和美國(增長 4%)。


史丹佛HAI《2025年人工智慧指數報告》精華 image 3


6. 人工智慧在科研中的影響日益增強,已成為推動科學進步的重要驅動力


人工智慧日益增長的重要性在重大科學進步的重要驅動力


學習方面的開創性貢獻。


顯然,人工智慧正以指數級、出乎意料的速度飛速發展,對大多數人來說意義非凡。因此,人工智慧安全也變得越來越重要。雖然人工智慧讓偽造變得更容易,但密碼學讓偽造變得更加困難。期待那些能夠利用區塊鏈的原生屬性(可驗證性和透明性)來建立這一領域實用解決方案的加密項目。


原文連結

0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與

您也可能喜歡

Kamino Finance 開啟第四季,推出全新獎勵模式,開啟第三季分配

簡單來說 Kamino Finance 推出了第四季,其獎勵結構經過改進,取代了 Kamino Points,引入了即時 KMNO 激勵,並繼續擴大其 DeFi Solana 上的生態系統已部署超過 4 億美元的資產。

Mpost2025/05/31 03:24
Kamino Finance 開啟第四季,推出全新獎勵模式,開啟第三季分配

Solayer 推出 InfiniSVM DevNet,加速基於 Solana 的 dApp

簡單來說 Solayer 推出了 InfiniSVM,這是一種硬體加速的區塊鏈,提供超過 1 萬 TPS、Solana VM 相容性和開發人員友善工具,以增強 dApp 的效能和可擴展性。

Mpost2025/05/31 03:24
Solayer 推出 InfiniSVM DevNet,加速基於 Solana 的 dApp

Willy Woo 警告稱,如果反彈在兩天內失敗,比特幣週線圖上可能會出現看跌背離

簡單來說 Willy Woo 警告稱,如果比特幣無法在未來兩天半內恢復,週線圖上可能會形成看跌背離,可能導致市場波動性長期處於低位。

Mpost2025/05/31 03:24
Willy Woo 警告稱,如果反彈在兩天內失敗,比特幣週線圖上可能會出現看跌背離

BitGo和Kraken開始分發50億美元的前FTX用戶賠付款

簡要概述 週五,該交易所宣布已開始第二輪分配,價值約50億美元,作為先前宣布的破產計劃的一部分。前FTX用戶報告稱已從破產交易所收到付款。

The Block2025/05/30 22:57
BitGo和Kraken開始分發50億美元的前FTX用戶賠付款