剛剛,由李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所(Stanford HAI)發(fā)布了《2024 年人工智能指數(shù)報告》(Artificial Intelligence Index Report 2024)。
這份長達 300 多頁的報告是 Stanford HAI 發(fā)布的第 7 份 AI Index 研究,追蹤了 2023 年全球人工智能的發(fā)展趨勢。 Stanford HAI 官方介紹道,“這是我們迄今為止最全面的報告,而且是在人工智能對社會的影響從未如此明顯的重要時刻發(fā)布的?!?/span> Stanford HAI 研究項目主任 Vanessa Parli 表示,“我認為最令人興奮的人工智能研究優(yōu)勢是將這些大型語言模型與機器人或智能體(agent)相結(jié)合,這標志著機器人在現(xiàn)實世界中更有效地工作邁出了重要一步。”
與往年不同,Stanford HAI 今年擴大了研究范圍,更廣泛地涵蓋了人工智能的技術(shù)進步、公眾對該技術(shù)的看法等基本趨勢。新報告揭示了 2023 年人工智能行業(yè)的 10 大主要趨勢:
1.人工智能在某些任務(wù)上勝過人類,但并非在所有任務(wù)上。 人工智能已在多項基準測試中超越人類,包括在圖像分類、視覺推理和英語理解方面。然而,它在競賽級數(shù)學(xué)、視覺常識推理和規(guī)劃等更復(fù)雜的任務(wù)上依然落后于人類。
2.產(chǎn)業(yè)界繼續(xù)主導(dǎo)人工智能前沿研究。
2023 年,產(chǎn)業(yè)界產(chǎn)生了 51 個著名的機器學(xué)習(xí)模型,而學(xué)術(shù)界只貢獻了 15 個。2023 年,產(chǎn)學(xué)合作還產(chǎn)生了 21 個著名模型,創(chuàng)下新高。此外,108 個新發(fā)布的基礎(chǔ)模型來自工業(yè)界,28 個來自學(xué)術(shù)界。
3.前沿模型變得更加昂貴。 根據(jù) AI Index 的估算,最先進的人工智能模型的訓(xùn)練成本已經(jīng)達到了前所未有的水平。例如,OpenAI 的 GPT-4 估計使用了價值 7800 萬美元的計算資源進行訓(xùn)練,而谷歌的 Gemini Ultra 的計算成本則高達 1.91 億美元。
相比之下,幾年前發(fā)布的一些最先進的模型,即原始 transformer 模型(2017 年)和 RoBERTa Large(2019 年),訓(xùn)練成本分別約為 900 美元和 16 萬美元。
4.美國成為頂級人工智能模型的主要來源國。 2023 年,61 個著名的人工智能模型源自美國的機構(gòu),超過歐盟的 21 個和中國的 15 個。 美國也仍然是人工智能投資的首選之地。2023 年,美國在人工智能領(lǐng)域的私人投資總額為 672 億美元,是中國的近 9 倍。 然而,中國依然是美國最大的競爭對手,中國的機器人安裝量居世界首位;同樣,世界上大多數(shù)人工智能專利(61%)都來自中國。
5.嚴重缺乏對 LLM 責任的可靠和標準化評估。 AI Index 的最新研究顯示,負責任的人工智能嚴重缺乏標準化。包括 OpenAI、谷歌和 Anthropic 在內(nèi)的領(lǐng)先開發(fā)商主要根據(jù)不同的負責任人工智能基準測試他們的模型。這種做法使系統(tǒng)地比較頂級人工智能模型的風(fēng)險和局限性的工作變得更加復(fù)雜。
6.生成式人工智能投資激增。
盡管去年人工智能私人投資整體下降,但對生成式人工智能的投資激增,比 2022 年(約 30 億美元)增長了近八倍,達到 252 億美元。生成式人工智能領(lǐng)域的主要參與者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都獲得了一輪可觀的融資。
7.數(shù)據(jù)顯示,人工智能讓打工人更有生產(chǎn)力,工作質(zhì)量更高。
2023 年,多項研究評估了人工智能對勞動力的影響,表明人工智能可以讓打工人更快地完成任務(wù),并提高他們的產(chǎn)出質(zhì)量。這些研究還表明,人工智能有可能縮小低技能和高技能工人之間的技能差距。還有一些研究警告說,在沒有適當監(jiān)督的情況下使用人工智能可能會起到負面作用。
8.得益于人工智能,科學(xué)進步進一步加速。
2022 年,人工智能開始推動科學(xué)發(fā)現(xiàn)。然而,2023 年,與科學(xué)相關(guān)的更重要的人工智能應(yīng)用啟動——使算法排序更高效的 AlphaDev、促進材料發(fā)現(xiàn)過程的 GNoME、可在一分鐘內(nèi)提供極其準確的 10 天天氣預(yù)報的 GraphCast、成功對 7100 萬種可能的錯義突變中的約 89% 進行分類的 AlphaMissence。 如今,人工智能現(xiàn)在可以完成人類難以完成的、但對解決一些最復(fù)雜的科學(xué)問題至關(guān)重要的粗暴計算。在醫(yī)療方面,新的研究表明,醫(yī)生可以利用人工智能更好地診斷乳腺癌、解讀X射線和檢測致命的癌癥。
9.美國的人工智能法規(guī)數(shù)量急劇增加。 2023 年,全球立法程序中有 2175 次提及人工智能,幾乎是上一年的兩倍。美國人工智能相關(guān)法規(guī)的數(shù)量在過去一年大幅增加。2023 年,與人工智能相關(guān)的法規(guī)有 25 項,而 2016 年只有 1 項。僅去年一年,人工智能相關(guān)法規(guī)的總數(shù)就增長了 56.3%。其中一些法規(guī)包括生成式人工智能材料的版權(quán)指南和網(wǎng)絡(luò)安全風(fēng)險管理框架。
10.人們對人工智能的潛在影響有了更深刻的認識,同時也更焦慮。 來自市場研究公司 Ipsos 的一項調(diào)查顯示,在過去一年中,認為人工智能將在未來 3-5 年內(nèi)極大地影響他們生活的人,比例從 60%上升到 66%。此外,52% 的人對人工智能產(chǎn)品和服務(wù)表示焦慮,比 2022 年上升了 13 個百分點。 在美國,來自皮尤研究中心(Pew)的數(shù)據(jù)顯示,52% 的美國人表示對人工智能的擔憂多于興奮,這一比例比 2022 年的 38% 有所上升。
附:來自AI Index 聯(lián)合主任 Ray Perrault 的一封信
十年前,世界上最好的人工智能系統(tǒng)也無法以人類的水平對圖像中的物體進行分類。人工智能在語言理解方面舉步維艱,也無法解決數(shù)學(xué)問題。如今,人工智能系統(tǒng)在標準基準上的表現(xiàn)經(jīng)常超過人類。
2023 年,人工智能進步加速。GPT-4、Gemini 和 Claude 3 等先進模型展示出了令人印象深刻的多模態(tài)能力:它們可以生成數(shù)十種語言的流暢文本,處理音頻,甚至可以解釋備忘錄。隨著人工智能的進步,它也越來越多地進入我們的生活。公司競相打造基于人工智能的產(chǎn)品,普通大眾也越來越多地使用人工智能。但是,當前的人工智能技術(shù)仍然存在重大問題。它無法可靠地處理事實、進行復(fù)雜的推理或解釋其結(jié)論。
人工智能面臨兩個相互關(guān)聯(lián)的未來。第一個,技術(shù)不斷改進,應(yīng)用日益廣泛,對生產(chǎn)力和就業(yè)產(chǎn)生重大影響。人工智能的用途有好有壞。第二個,人工智能的應(yīng)用受到技術(shù)局限的制約。無論是哪一種,政府都越來越關(guān)注。政府正在積極參與,鼓勵人工智能的發(fā)展,比如資助大學(xué)研發(fā)和激勵私人投資。政府還致力于管理潛在的不利因素,如對就業(yè)的影響、隱私問題、錯誤信息和知識產(chǎn)權(quán)。
在技術(shù)方面,今年的 AI Index 報告稱,2023 年全球發(fā)布的新大型語言模型數(shù)量比上一年翻了一番。三分之二的模型是開源的,但性能最高的模型來自擁有封閉系統(tǒng)的行業(yè)參與者。
Gemini Ultra 成為首個在大規(guī)模多任務(wù)語言理解(MMLU)基準上達到人類水平的 LLM;自去年以來,模型在該基準上的性能表現(xiàn)提高了 15 個百分點。此外,GPT-4 在綜合語言模型整體評估(HELM)基準上取得了令人印象深刻的 0.97 平均勝率分數(shù)。 雖然全球?qū)θ斯ぶ悄艿乃饺送顿Y連續(xù)第二年減少,但對生成式人工智能的投資卻急劇上升。財富 500 強企業(yè)財報電話會議中提及人工智能的次數(shù)比以往任何時候都多,而且新的研究表明,人工智能明顯提高了打工人的生產(chǎn)率。在政策制定方面,全球在立法程序中提及人工智能的次數(shù)前所未有。美國監(jiān)管機構(gòu)在 2023 年通過的人工智能相關(guān)法規(guī)比以往任何時候都多。盡管如此,許多人仍對人工智能生成深度偽造等能力表示擔憂。公眾對人工智能有了更多的認識,研究表明,他們的反應(yīng)也是焦慮的。