黄色欧美网站A片小视频|人妻无码中文字幕V爆|亚洲av婷婷五月天|国模私拍偷拍在线视频|亚洲一级av电影|欧美内射无码按摩|美女丝袜中文字幕|日韩精品免费一区二区夜夜嗨|黄色电影品爱网|超碰在线播放日本

廣告 廣告 ×

城市之窗

當(dāng)前位置:首頁 > 新聞 > 城市之窗 > 智慧城市 >

算力不足限制AI創(chuàng)新 學(xué)者呼吁加強(qiáng)學(xué)術(shù)界算力支持

2024年11月28日 09:45:02

  一項(xiàng)針對(duì)全球數(shù)十家學(xué)術(shù)機(jī)構(gòu)的學(xué)者開展的調(diào)查顯示,許多大學(xué)的科學(xué)家對(duì)人工智能(AI)研究可用的算力資源感到沮喪。

  相關(guān)研究論文已于近日發(fā)布在預(yù)印本服務(wù)器arXiv上,指出學(xué)者難以接觸到最先進(jìn)的計(jì)算系統(tǒng),這可能阻礙他們開發(fā)大型語言模型(LLM)和其他AI研究的進(jìn)展。

(圖片來源:nature)

  具體而言,學(xué)術(shù)研究者往往沒有資源獲取足夠強(qiáng)大的圖形處理器(GPU)——這些電腦芯片常用于訓(xùn)練AI模型,且價(jià)格昂貴,可達(dá)數(shù)千美元。相比之下,大型科技公司的研究者預(yù)算更高,可以在GPU上投入更多資金?!懊吭黾右粔KGPU,就能提升更多算力。”美國(guó)布朗大學(xué)計(jì)算機(jī)科學(xué)家、該研究的合著者Apoorv Khandelwal表示,“雖然行業(yè)巨頭可能擁有數(shù)千塊GPU,但學(xué)者可能只有幾塊?!?

  “學(xué)術(shù)界與行業(yè)界的模型差距巨大,但本可以小得多?!泵绹?guó)華盛頓特區(qū)非營(yíng)利AI研究機(jī)構(gòu)EleutherAI的執(zhí)行董事Stella Biderman說。她表示,對(duì)這一差距的研究“至關(guān)重要”。

  為了評(píng)估學(xué)者可用的計(jì)算資源,研究團(tuán)隊(duì)對(duì)35家機(jī)構(gòu)的50名科學(xué)家進(jìn)行了調(diào)查。受訪者中,66%對(duì)自己的算力滿意度打了3分及以下(滿分5分)。“他們根本不滿意?!盞handelwal說。

  各大學(xué)在GPU訪問設(shè)置上有所不同。有些學(xué)校設(shè)有供各部門和學(xué)生共享的中央計(jì)算集群,研究人員可申請(qǐng)GPU使用時(shí)間。另一些機(jī)構(gòu)可能為實(shí)驗(yàn)室成員直接購買機(jī)器。

  柱狀圖揭示了調(diào)查的結(jié)果:學(xué)者通常只能有限地訪問圖形處理器,這進(jìn)而限制了他們訓(xùn)練機(jī)器學(xué)習(xí)模型的能力。

  一些科學(xué)家表示,他們不得不等待數(shù)天才能使用GPU,并指出在項(xiàng)目截止日期前后等待時(shí)間特別長(zhǎng)。調(diào)查結(jié)果還凸顯了全球算力訪問的差異。例如,有受訪者提到在中東地區(qū)難以找到GPU。僅有10%的受訪者表示,他們可以使用英偉達(dá)的H100GPU,這是專為AI研究設(shè)計(jì)的高端芯片。

  這一障礙極大地加劇了預(yù)訓(xùn)練過程的難度,即向大型語言模型(LLM)輸入海量數(shù)據(jù)集的過程變得尤為困難?!坝捎诔杀靖甙?,大多數(shù)學(xué)者甚至不敢涉足預(yù)訓(xùn)練領(lǐng)域的研究。”Khandelwal指出。他和同事堅(jiān)信,學(xué)者在人工智能研究中帶來了獨(dú)一無二的視角,而算力的匱乏可能會(huì)嚴(yán)重制約這一領(lǐng)域的未來發(fā)展。

  “為了長(zhǎng)期的增長(zhǎng)和技術(shù)發(fā)展,擁有一個(gè)健康、有競(jìng)爭(zhēng)力的學(xué)術(shù)研究環(huán)境至關(guān)重要?!泵绹?guó)布朗大學(xué)計(jì)算機(jī)科學(xué)和語言學(xué)學(xué)者、該研究的合著者Ellie Pavlick說,“相比之下,在行業(yè)研究中往往存在顯著的商業(yè)壓力,這有時(shí)會(huì)促使研究人員急于求成,減少了對(duì)未知領(lǐng)域的探索。”

  研究人員還深入探究了學(xué)者如何在算力資源有限的情況下更高效地進(jìn)行利用。他們測(cè)算了在使用1至8塊GPU的低資源硬件環(huán)境下,預(yù)訓(xùn)練多個(gè)大型語言模型(LLM)所需的時(shí)間。盡管面臨資源限制,學(xué)者仍成功訓(xùn)練出多個(gè)模型,但這一過程耗時(shí)更長(zhǎng),并要求他們必須采用更為高效的方法。

  “我們實(shí)際上可以延長(zhǎng)現(xiàn)有GPU的使用時(shí)間,從而在一定程度上彌補(bǔ)與行業(yè)界的差距。”Khandelwal說。

  “在有限的計(jì)算資源上竟然也能訓(xùn)練出比許多人預(yù)期中更大的模型,這確實(shí)令人驚嘆?!钡聡?guó)薩爾布呂肯薩爾蘭大學(xué)神經(jīng)顯式模型研究者Ji-Ung Lee表示。他進(jìn)一步指出,未來的研究可以聚焦小公司行業(yè)研究者的經(jīng)歷,因?yàn)樗麄兺瑯釉谟?jì)算資源獲取上面臨困境?!安⒎撬杏心芰Λ@取無限算力的人都能夠如愿以償。”他補(bǔ)充道。 (作者:吳雙)

來源:人民郵電報(bào)
責(zé)任編輯:張瑞
關(guān)閉
主辦單位:《城市建設(shè)》雜志社有限公司
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:京B2-20171283   互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120200016
期刊出版許可證:京期出證字第 1622 號(hào)網(wǎng)絡(luò)出版服務(wù)許可證:(署)網(wǎng)出證(京)字第369號(hào)
《城市建設(shè)》 國(guó)際標(biāo)準(zhǔn)刊號(hào):ISSN 1674-781X   國(guó)內(nèi)統(tǒng)一刊號(hào):CN 11-5897/F
《城市建設(shè)理論研究(電子版)》 國(guó)際標(biāo)準(zhǔn)刊號(hào):ISSN 2095-2104   國(guó)內(nèi)統(tǒng)一刊號(hào):CN 11-9313/TU
違法和不良信息舉報(bào)電話:(010)63257595   投訴舉報(bào)郵箱:qzlx@zgcsjs.org.cn
Top