近日,2024全球開發(fā)者先鋒大會在上海舉行。為期兩天的大會,匯聚了國內(nèi)外超過100家開發(fā)者社區(qū)、100余家知名投資機構(gòu)。OpenAI前高管扎克·卡斯、硅谷“創(chuàng)投之父”史蒂夫·霍夫曼等“大咖”也來滬與全球開發(fā)者交流。在此次大會的舉辦地徐匯濱江,上海首個大模型創(chuàng)新生態(tài)社區(qū)已然成形。僅僅成立半年,就吸引了近60家大模型企業(yè),以及200余家產(chǎn)業(yè)鏈上下游企業(yè)資源匯聚。
以應(yīng)用牽引,發(fā)布市級應(yīng)用場景;培育生態(tài),做好算力、數(shù)據(jù)等關(guān)鍵要素供應(yīng);加大開源、開放力度,降低廣大創(chuàng)新創(chuàng)業(yè)團隊和中小企業(yè)的大模型訓(xùn)練門檻……近年來,上海積極培育人工智能產(chǎn)業(yè)沃土,逐漸成為大模型產(chǎn)業(yè)高密度創(chuàng)新的苗圃基地。
大模型產(chǎn)業(yè)“風(fēng)起云涌”
大會上,上海人工智能實驗室領(lǐng)軍科學(xué)家林達(dá)華用“風(fēng)起云涌”來形容近幾年全球大模型產(chǎn)業(yè)的發(fā)展。
2022年,ChatGPT橫空出世,大模型開始走入大眾視野,成為全球焦點。2023年2月,Meta公司發(fā)布LLaMa并催生發(fā)展出開源社區(qū),大模型從“只會聊天的工具”,變成了有可能會進(jìn)入到“嚴(yán)肅生產(chǎn)領(lǐng)域”的生產(chǎn)力。邁入2024年,Sora的出世、Claude 3.0展現(xiàn)出的強大推理能力,以及馬斯克剛剛開源的Grok,都代表著整個行業(yè)處在“方興未艾”的賽道。
“大模型行業(yè)的發(fā)展有兩個非常重要的驅(qū)動力量。一個是源于所有研究者和從業(yè)者對于技術(shù)理想的追求,不斷突破邊界,尋求越來越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同時產(chǎn)業(yè)界也看到了大模型帶來產(chǎn)業(yè)革命的可能性,無數(shù)企業(yè)投入巨大資源到這個賽道中。兩股力量交織在一起,形成了我們今天看到的大模型產(chǎn)業(yè)‘波瀾壯闊’的局面?!绷诌_(dá)華表示。
而在國內(nèi),大模型產(chǎn)業(yè)的發(fā)展同樣突飛猛進(jìn)。去年3月份,百度發(fā)布“文心一言”,此后,阿里巴巴的“通義千問”、科大訊飛星火大模型、騰訊混元大模型陸續(xù)發(fā)布上線。互聯(lián)網(wǎng)大廠之外,華為、京東、字節(jié)跳動、商湯科技,乃至三大電信運營商、各科研院所和高校的大模型產(chǎn)品也不斷推出。有統(tǒng)計數(shù)據(jù)顯示,中國研發(fā)大模型的公司已有100多家,邁入“百模大戰(zhàn)”階段。
同時,大模型行業(yè)也在不斷涌現(xiàn)出新的課題。以算力為例,微軟原全球執(zhí)行副總裁沈向洋稱,發(fā)展大模型產(chǎn)業(yè),算力是門檻。隨著大模型參數(shù)的增加,對算力的需求幾乎是幾何級增長的。另外,包括ChatGPT在內(nèi),大模型還帶來了“一本正經(jīng)地胡說八道”、“深度偽造”等倫理問題,需要各方加強治理。
此外,當(dāng)前主流的大模型都是建立在Transformer架構(gòu)堆疊的基礎(chǔ)上,但這一架構(gòu)對計算資源的消耗特別大。騰訊混元大模型算法負(fù)責(zé)人康戰(zhàn)輝表示,當(dāng)下越來越多的企業(yè)看到了MoE(即:混合專家模型)展現(xiàn)出來的優(yōu)良特性,未來可能還會有更加高效的架構(gòu)出來。
產(chǎn)業(yè)應(yīng)用“繁花綻放”
有行業(yè)人士將2024年比作大模型應(yīng)用的“元年”,認(rèn)為行業(yè)的競爭焦點正在從基礎(chǔ)模型到應(yīng)用遷移。從目前來看,大模型確實已經(jīng)落地到各行各業(yè),生根發(fā)芽。
“大模型+科學(xué)”可以產(chǎn)生哪些化學(xué)反應(yīng)?上海人工智能實驗室青年科學(xué)家白磊介紹,實驗室發(fā)布“風(fēng)烏”大模型,可用以預(yù)測氣象。由于大氣系統(tǒng)的復(fù)雜性,全球中期天氣預(yù)報的有效性每10年才提高1天。此前,全球范圍內(nèi)最好的物理模型有效預(yù)報時長最大為8.5天,而“風(fēng)烏”達(dá)到了10.75天,且預(yù)測時間僅需30秒。
機器人與大模型的結(jié)合領(lǐng)域“具身智能”也是熱點?!皞鹘y(tǒng)的機器人需要編程,需要寫固定的代碼,造成之前的人機交流非常僵硬。現(xiàn)在,我們告訴機器人它的手臂快碰到天花板了,在沒有任何方向性指示的情況下,它能夠理解,且做出正確反應(yīng)。這在傳統(tǒng)的機器人編程中,是不可想象的。我們期待,大模型能給機器人一顆通用的大腦?!?中電科21所高級專家劉一帆表示。
“過去藝術(shù)家們通過AI軟件進(jìn)行藝術(shù)作品的設(shè)計,今天有更多的藝術(shù)家通過AI完成藝術(shù)作品的創(chuàng)作。此外,從去年下半年開始,包括電商、營銷等領(lǐng)域,也有非常多的大模型產(chǎn)品涌現(xiàn)出來?!敝窍笪磥懋a(chǎn)品總監(jiān)弓子健說。
林達(dá)華認(rèn)為,圍繞大模型應(yīng)用,產(chǎn)業(yè)分工會逐漸形成?!白龌A(chǔ)模型的企業(yè)并不會壟斷一切。如果從業(yè)者能夠憑借自己在行業(yè)里積累的數(shù)據(jù)和經(jīng)驗,并基于自身的資源稟賦和數(shù)據(jù)優(yōu)勢積極尋找差異化發(fā)展路徑,最終形成競爭力,我們的大模型產(chǎn)業(yè)一定會‘一路繁花’?!?/p>
著力建設(shè)“大模型之都”
人工智能是上海重點發(fā)展的三大先導(dǎo)產(chǎn)業(yè)之一。伴隨著新一代人工智能的發(fā)展,大模型熱潮掀起,上海正在著力建設(shè)“大模型之都”。
懷著“栽好梧桐樹,引得鳳凰來”的美好愿景,上海以徐匯西岸為核心,啟動了首個人工智能發(fā)展集聚區(qū)建設(shè)。如今,作為上海首個大模型創(chuàng)新生態(tài)社區(qū),誕生于徐匯人工智能產(chǎn)業(yè)沃土的“模速空間”,已成為大模型產(chǎn)業(yè)高密度創(chuàng)新的苗圃基地。
上海徐匯區(qū)委常委、副區(qū)長俞林偉對“模速空間”名字的由來進(jìn)行了解釋。他說,“‘?!馕吨汕先f的開發(fā)者在這里創(chuàng)新創(chuàng)業(yè),百花齊放。這里是場景的試驗田,也是應(yīng)用的孵化器?!佟瘎t指通過市、區(qū)攜手,為企業(yè)提供全方位的加速服務(wù)。”
轉(zhuǎn)眼間,“模速空間”掛牌已近半年。如今有超過60家大模型企業(yè)與他們身后200余家產(chǎn)業(yè)鏈上下游企業(yè)的資源匯聚在黃浦江畔這一方天地。
對于大模型企業(yè)來說,數(shù)據(jù)的體量、質(zhì)量、多樣性缺一不可,均對大模型能力的提升有重要意義。如何能夠生產(chǎn)大規(guī)模、高質(zhì)量的數(shù)據(jù),也是各個大模型研發(fā)機構(gòu)某種意義上“競爭壁壘”所在。
此外,算力同樣重要,不管是大模型研發(fā)企業(yè),還是應(yīng)用類公司,高算力成本都令人頭痛。如何提供普惠的算力,通過較低成本把大模型在垂直行業(yè)真正用起來,讓更多的中小企業(yè)、個人開發(fā)者加入大模型的開發(fā)中,也是行業(yè)關(guān)注的問題。
記者了解到,“模速空間”五個公共服務(wù)平臺作為“土壤雨露”,可為創(chuàng)新企業(yè)提供開放數(shù)據(jù)、算力調(diào)度、能力評測、備案輔導(dǎo)、融資服務(wù)等公共服務(wù),提供關(guān)鍵要素保障。
以算力調(diào)度平臺為例,“模速空間”聯(lián)合運營商和云廠商共同保障大模型企業(yè)算力,目前商湯、儀電、火山超5萬張GPU可供調(diào)配。其開放數(shù)據(jù)平臺依托浦江實驗室牽頭的大模型語料數(shù)據(jù)聯(lián)盟,持續(xù)開源發(fā)布高質(zhì)量數(shù)據(jù)集,數(shù)據(jù)總量近5TB,下載量近14萬次,行業(yè)覆蓋10余類。
面向未來,大模型產(chǎn)業(yè)的發(fā)展尚有許多挑戰(zhàn)。對此,上海已明確,未來將加強核心技術(shù)的突破,推動智能芯片關(guān)鍵技術(shù)和應(yīng)用適配,打造更多元開放的智能計算生態(tài)。同時,完善標(biāo)準(zhǔn)體系、安全準(zhǔn)則、倫理規(guī)范,推動人工智能、區(qū)塊鏈、元宇宙等前沿技術(shù)的開發(fā)和應(yīng)用。
上海市副市長陳杰表示,未來上海將進(jìn)一步加大開源開放的力度,探索大模型的新型開源和推廣模式,以降低廣大創(chuàng)新創(chuàng)業(yè)團隊、中小企業(yè)等大模型訓(xùn)練的門檻,推出更多具有示范性、標(biāo)志性的應(yīng)用場景,來牽引大模型在金融、教育、醫(yī)療、制造等典型領(lǐng)域的垂直應(yīng)用。(記者 杜康 上海報道)
相關(guān)稿件