一,、 世界人工智能發(fā)展歷程和方向——大勢所趨
人工智能(ArtificialIntelligence,,簡稱AI)是指,,在機器上實現(xiàn)相當乃至超越人類的感知,、認知,、行動等智能,。按照智能能力的不同,,人工智能通常可分為通用人工智能和專用人工智能,,或被稱為強人工智能和弱人工智能,。目前對通用人工智能有兩種理解:一種是通用性的人工智能(簡稱GAI)是媒體和社會公眾的一般理解,指的是能夠處理很多任務(wù)的智能,;另一種則是人工智能專業(yè)領(lǐng)域的準確名稱,,即人工通用智能(簡稱AGI),是指在人工智能所有方面都達到人類水平,,能夠自適應(yīng)地應(yīng)對外界環(huán)境挑戰(zhàn),,完成人類能完成的所有任務(wù)的人工智能。
長期以來,,人工智能系統(tǒng)都是為了實現(xiàn)特定或?qū)S媚繕巳蝿?wù)的智能,,屬于弱人工智能或?qū)S萌斯ぶ悄芊懂牎?018年以來,大規(guī)模預(yù)訓練模型(簡稱大模型)通過在海量無標注數(shù)據(jù)上依托強大算力資源訓練能適應(yīng)一系列下游任務(wù),,實現(xiàn)了通用性的人工智能(GAI),拉開了通用人工智能的序幕,,但當前仍沒有達到真正的人工通用智能(AGI),。
(一)人工智能發(fā)展歷程
人工智能的概念最早于1956年在美國達特茅斯學院召開的夏季研討會上被正式提出??v觀人工智能近70年的發(fā)展歷程,,大體上可分為三個階段。
第一階段以符號主義邏輯推理證明為中心,。該階段主要研究在形式化表示方法基礎(chǔ)上,,通過邏輯推理或啟發(fā)式程序來模擬人類推理能力,解決代數(shù)應(yīng)用題求解,、幾何定理證明和機器翻譯等問題,。
第二階段是以人工規(guī)則的專家系統(tǒng)為核心。該階段的研究焦點就是將領(lǐng)域?qū)<业闹R歸納成人工規(guī)則,,進而進行輔助決策,,專家系統(tǒng)技術(shù)在這一時期得到快速發(fā)展。
第三階段是以大數(shù)據(jù)驅(qū)動的深度學習為核心。該階段有效整合算法,、算力和數(shù)據(jù),,推動人工智能的研究重心從如何“制造”智能轉(zhuǎn)移到如何“習得”智能。
2006年,,加拿大多倫多大學杰弗里?辛頓教授提出“深度學習算法”,,為新一輪人工智能的發(fā)展奠定了理論和方法基礎(chǔ)。
2012年,,杰弗里?辛頓教授與學生提出的深度學習神經(jīng)網(wǎng)絡(luò)模型AlexNet在ImageNet圖像識別挑戰(zhàn)賽上以巨大的優(yōu)勢擊敗了其他非神經(jīng)網(wǎng)絡(luò)模型,,成為深度學習興起的標志。
2016—2021年,,谷歌開發(fā)的系列圍棋機器人AlphaGo和AlphaZero,,不僅在比賽中先后戰(zhàn)勝了世界冠軍李世石和柯潔,后來還取得了擂臺賽不敗的戰(zhàn)績,。
同時,,該公司研發(fā)的AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測問題上達到接近人類實驗解析的水平,解決了困擾生物學界50年的“蛋白質(zhì)折疊”難題,。
近10年來,,基于大數(shù)據(jù)的深度學習模型和算法得到大規(guī)模應(yīng)用,在機器翻譯,、智能問答,、博弈對抗等領(lǐng)域取得了巨大成功,人工智能進入加速發(fā)展期,。
以上三個階段中,,前兩個階段的主要思路是設(shè)計新的理論和算法,用機器模擬人的智能,,盡管在理論方法上取得了進展,,但由于目標過高,與應(yīng)用結(jié)合不夠,,使得人工智能發(fā)展幾經(jīng)起伏,。第三階段基于大數(shù)據(jù)的深度學習技術(shù)已成為當前人工智能的主流發(fā)展路徑,在計算機視覺,、自然語言處理,、智能語音等技術(shù)領(lǐng)域?qū)崿F(xiàn)了規(guī)模應(yīng)用。
其中,,計算機視覺是人工智能技術(shù)中應(yīng)用最為廣泛的領(lǐng)域,。計算機視覺是指,通過計算機對圖像或視頻進行處理,,使其能夠自動識別,、分析和理解圖像或視頻中的信息,。
2015年,由微軟亞洲研究院提出的深度殘差學習網(wǎng)絡(luò)ResNet成為計算機視覺領(lǐng)域具有里程碑意義的代表性技術(shù),。ResNet的出現(xiàn),,使得超過上百層的更深層網(wǎng)絡(luò)可以更有效地進行訓練,推動了深度學習技術(shù)不斷探索能力極限,。目前,,ResNet已經(jīng)成為計算機視覺任務(wù)的******架構(gòu),例如圖像分類,、物體檢測和圖像分割等,。2023年,基于為人工智能作出的基礎(chǔ)性貢獻,,ResNet的四位作者獲得了未來科學大獎,。
(二)當前人工智能發(fā)展新趨勢
2018年以來,大模型首先在自然語言處理領(lǐng)域取得突破,,以ChatGPT為代表的現(xiàn)象級產(chǎn)品拉開了通用人工智能的序幕,,引發(fā)了新一輪人工智能發(fā)展浪潮。當前人工智能發(fā)展已由小模型時代邁向大模型時代,。
大模型是“大數(shù)據(jù)+大算力+強算法”結(jié)合的產(chǎn)物,,至少具有三個特點:
第一,規(guī)模大,,神經(jīng)網(wǎng)絡(luò)參數(shù)規(guī)模要達到百億以上,;
第一,涌現(xiàn)性,,要產(chǎn)生預(yù)料之外的新能力,,這是人工智能發(fā)展近70年來最具里程碑意義的新特性;
第一,,通用性,,能夠解決各類問題。
美國OpenAI公司的GPT(生成型預(yù)訓練Transformer模型)系列大模型是當前國際大模型領(lǐng)域的領(lǐng)先代表,。2022年11月,OpenAI發(fā)布的人工智能對話大模型ChatGPT表現(xiàn)出了驚人的智能水平,,能夠長時間進行自然流暢的對話,,同時還能夠高質(zhì)量撰寫幾乎任何類型的書面材料,可以完成很多需要創(chuàng)造性思考的任務(wù),,一經(jīng)發(fā)布就受到全球用戶廣泛關(guān)注,,成為歷史上增長最快的消費應(yīng)用,引發(fā)了人工智能的“iPhone時刻”,。
ChatGPT之所以能表現(xiàn)出色,,主要歸因于幾個關(guān)鍵方面的技術(shù)和策略:
第一,,其采用了大規(guī)模的訓練數(shù)據(jù),特別是互聯(lián)網(wǎng)文本數(shù)據(jù),,以捕獲豐富的知識和語言模式,。
第二,模型基于高效的Transformer架構(gòu),,該架構(gòu)通過自注意力機制,,能夠有效處理輸入序列中各位置信息間關(guān)聯(lián)依賴關(guān)系,極為適合自然語言處理任務(wù),。
第三,,ChatGPT通過多任務(wù)學習,提高了其在多樣化問題上的泛化能力和生成能力,。
第四,,模型還針對特定任務(wù)進行了微調(diào),以更好地適應(yīng)和解決特定領(lǐng)域或場景下的問題,。
第五,,通過利用強化學習等技術(shù)進行模型調(diào)優(yōu),ChatGPT在特定任務(wù)上的輸出更加接近人類的習慣,,進而表現(xiàn)得以進一步提升,。
這些技術(shù)的融合和應(yīng)用,使ChatGPT成為了文本問答任務(wù)中的佼佼者,,激發(fā)了公眾對強人工智能未來發(fā)展的無限遐想,。
除語言能力以外,大模型也在迅速擴展視覺,、聽覺,、具身(有身體的智能,能與環(huán)境進行交互),、行動等其他通用智能能力,,在向多模態(tài)方向發(fā)展的同時,也將逐漸進入現(xiàn)實世界,,發(fā)展實體智能,,引發(fā)下一波人工智能發(fā)展浪潮。
但是,,也應(yīng)看到,,大模型等通用人工智能技術(shù)在給世界經(jīng)濟社會發(fā)展帶來巨大機遇的同時,也帶來了難以預(yù)知的各種風險和復(fù)雜挑戰(zhàn),。大模型是高度復(fù)雜的人工智能系統(tǒng),,特點是難以預(yù)測,當前取得的進展基本上是通過經(jīng)驗?zāi)J饺〉?,大模型背后的智能發(fā)生和涌現(xiàn)機理尚不清晰,,國際社會對如何構(gòu)建一個安全的人工智能系統(tǒng)仍知之甚少,。
當前以大模型為代表的通用性的人工智能(GAI)已顯現(xiàn)出倫理道德、數(shù)據(jù)安全等一系列風險,,需要加強安全監(jiān)管,。未來,面對伴隨著人工通用智能(AGI)的到來可能會引發(fā)的人類生存性風險,,更需要嚴加防范,。加強通用人工智能治理已成為世界各國面臨的共同問題。
隨著人類探索通用智能發(fā)展路徑的越發(fā)清晰,,全球正處于“AGI”(準強人工智能)的前夜,,處在一個不確定性的狀態(tài),未來需要對大模型基礎(chǔ)原理,、安全與價值觀對齊,、人工通用智能(AGI)風險控制策略等方面開展深入研究,促進人工智能技術(shù)造福于人類,。
(三)世界大國加快人工智能戰(zhàn)略與政策部署
當前,,人工智能已成為國際競爭的新焦點和經(jīng)濟發(fā)展的新引擎,世界主要發(fā)達國家把發(fā)展人工智能視為提升國家競爭力,、維護國家安全的重大戰(zhàn)略,,紛紛出臺人工智能規(guī)劃和相關(guān)政策,力圖在新一輪國際科技競爭中掌握主導權(quán),。
1.各國從國家戰(zhàn)略層面強化人工智能布局,。
美國圍繞人工智能研發(fā)和國家安全,陸續(xù)出臺《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》等相關(guān)戰(zhàn)略和政策,,力求鞏固其領(lǐng)先優(yōu)勢,。
法國發(fā)布《國家人工智能戰(zhàn)略》,著力推動健康,、交通,、環(huán)境、國防安全等領(lǐng)域的智能化,。
歐盟自2010年以來就把實現(xiàn)智能增長作為其三大增長目標之一,,2018年4月發(fā)布了《歐洲人工智能》,系統(tǒng)地提出了歐盟的人工智能發(fā)展戰(zhàn)略規(guī)劃,;同月,,發(fā)布了《人工智能合作宣言》,標志著歐洲人工智能進入合作發(fā)展的新階段,。
德國通過《聯(lián)邦政府人工智能戰(zhàn)略要點》,提出成為全球領(lǐng)先的人工智能科研場,,實現(xiàn)人工智能德國造,。
英國發(fā)布《國家人工智能戰(zhàn)略》,,從數(shù)據(jù)獲取、人才培養(yǎng),、科技研發(fā)和產(chǎn)業(yè)應(yīng)用等方面打造人工智能強國,。
俄羅斯發(fā)布《2030年前人工智能國家發(fā)展戰(zhàn)略》。
日本提出建設(shè)“超智能社會5.0”,,不僅要提升產(chǎn)業(yè)競爭力,,還要實現(xiàn)國民生活智能化。
2.各國競相加大人工智能研發(fā)投入,。
美國政府2017財年向人工智能非保密項目投入研發(fā)經(jīng)費超過20億美元,,在2022年累計投入達249億美元,預(yù)計2028年投入將破千億美元,;2021財年美國國防預(yù)算提案在人工智能研發(fā)領(lǐng)域的投資總額為8.41億美元,,較2020財年的7.8億美元增長約8%。法國在2022年前在人工智能項目中投資15億歐元,。韓國提出要從“IT強國”發(fā)展為“人工智能強國”,,計劃在2030年將韓國在人工智能領(lǐng)域的競爭力提升至世界前列。
3.各國組建新型人工智能研發(fā)機構(gòu),。
美國國家科學基金會協(xié)同聯(lián)邦機構(gòu),,包括國土安全部、國防部,、教育部,、農(nóng)業(yè)部等,聯(lián)合成立了25家國家人工智能研究院,;歐洲計劃建立一所世界級人工智能研究所,,在英國等多個歐洲國家設(shè)立科研中心;法國提出新建人工智能中心,,并組建人工智能研究網(wǎng)絡(luò),;英國擴建阿蘭?圖靈研究所,啟動數(shù)據(jù)倫理與創(chuàng)新中心建設(shè),,成立新的人工智能技術(shù)學院,。全球各大人工智能跨國公司和領(lǐng)軍企業(yè)也在加快布局人工智能研發(fā)中心。
4.各國加緊推動人工智能治理體系建設(shè),。
聯(lián)合國自2018年起專門成立了人工智能與機器人中心,,研究人工智能的管控問題;美國國會建議成立人工智能安全委員會,,負責對人工智能,、機器學習的發(fā)展和相關(guān)技術(shù)開展審查;歐盟簽署《人工智能合作宣言》,,發(fā)布《歐盟機器人民事法律規(guī)則》,,共同應(yīng)對人工智能在倫理,、法律等方面的挑戰(zhàn);2019年起,,歐盟持續(xù)加強對人工智能應(yīng)用和治理的關(guān)注,,于當年4月出臺了《可信賴的人工智能倫理準則》,為實現(xiàn)可信賴的人工智能設(shè)定了一個倫理框架,。
目前,,全球人工智能發(fā)展正處于由弱人工智能向強人工智能過渡的階段,人工智能已經(jīng)成為主導國家戰(zhàn)略競爭力的重要支撐和推動科技革命的重要力量,。未來,,“人工智能+高速移動互聯(lián)”將成為人類社會生活的基本場景。著眼更長遠的未來,,強人工智能將會帶來顛覆性,、全局性影響,誰率先實現(xiàn)突破,,誰就會掌握未來發(fā)展的主導權(quán),。如果我國在新一輪人工智能發(fā)展中落后,將會在全球競爭中處于不利地位,。
二,、中國人工智能發(fā)展現(xiàn)狀和前景——大有可為
習近平總書記指出,“把新一代人工智能作為推動科技跨越發(fā)展,、產(chǎn)業(yè)優(yōu)化升級,、生產(chǎn)力整體躍升的驅(qū)動力量,努力實現(xiàn)高質(zhì)量發(fā)展”,。2017年,,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,確立了人工智能三步走目標,,將人工智能上升為國家戰(zhàn)略,。此后,相關(guān)部委和各地方政府推動《新一代人工智能發(fā)展規(guī)劃》加快實施,,同時,,科技界、產(chǎn)業(yè)界,、投資界協(xié)同發(fā)力,,推動我國人工智能發(fā)展進入跨越趕超的關(guān)鍵時期。
(一)我國人工智能基礎(chǔ)理論和部分關(guān)鍵技術(shù)實現(xiàn)突破,,人工智能與經(jīng)濟社會融合不斷深入,。
經(jīng)過多年的持續(xù)研發(fā)布局,我國人工智能科技創(chuàng)新體系逐漸完善,智能經(jīng)濟和智能社會發(fā)展不斷深入,,取得顯著成效,。
1.人工智能基礎(chǔ)理論快速積淀。
近年來,,國內(nèi)學者在問題求解、演化計算,、模式識別,、專家系統(tǒng)、智能控制等經(jīng)典人工智能領(lǐng)域多有建樹,。
特別是在新興的深度學習理論和推理算法方面開展了大量研究,,例如,北京大學提出深度跨媒體學習方法,,顯著提高了跨媒體檢索的準確率,;南京大學提出的“深度森林”模型是國際上第一個非神經(jīng)網(wǎng)絡(luò)和BP(反向傳播)算法的深度學習方法。
在類腦計算方面加強布局,,類腦芯片,、類腦計算系統(tǒng)、類腦應(yīng)用等取得積極進展,;中國科學院在腦機接口領(lǐng)域取得突破,,研發(fā)了目前運行最快的頭皮腦電(EEG)腦機接口系統(tǒng)。華為公司上線了氣象大模型,,在一系列氣象學家關(guān)心的精度指標和極端天氣預(yù)報中都展現(xiàn)出優(yōu)勢,,具有強大競爭力和巨大潛力。
2.人工智能部分關(guān)鍵技術(shù)躋身世界先進水平,。
本輪人工智能技術(shù)爆發(fā)初期,,我國在中文信息處理、生物特征識別,、機器翻譯,、智能處理器、自動駕駛和智能機器人等技術(shù)方向上緊跟世界前沿,,實現(xiàn)了部分人工智能關(guān)鍵技術(shù)突破,。麻省理工學院第十七任校長拉斐爾?萊夫評價認為,中國在人臉識別和語音識別等人工智能領(lǐng)域居絕對領(lǐng)先地位,。
主要包含了以下階段性成果:中國科學院研發(fā)推出全球首款商用深度學習專用處理器“寒武紀”芯片,,在運行主流智能算法時性能功耗效率大幅超越中央處理器(CPU)和圖形處理器(GPU);商湯科技的圖像識別技術(shù),、科大訊飛的語音識別與合成技術(shù)和語言翻譯技術(shù)的產(chǎn)業(yè)化水平目前處于世界前列,,受到國際認可。
在計算機視覺方面也取得重大原始創(chuàng)新。北京大學改寫了持續(xù)近兩個世紀的曝光成像原理,,發(fā)明了脈沖攝影原理,,用比特序列逼近高速光電子流,研制出超高速視覺芯片和相機,,實現(xiàn)了超高速,、高動態(tài)、無模糊連續(xù)清晰成像,。它建立了脈沖視覺算法體系并研制出超高速系統(tǒng),,采用常規(guī)光電器件和芯片工藝實現(xiàn)高超聲速過程連續(xù)清晰成像和實時跟蹤識別,其專利獲中美歐日韓授權(quán),,有望從源頭重塑計算機視覺技術(shù)和產(chǎn)業(yè)體系,。
在人工智能基礎(chǔ)軟硬件方面,華為發(fā)布了基于達芬奇架構(gòu)的昇騰910和昇騰310兩款人工智能芯片,,力爭打造以芯片為載體,、從底層算法到應(yīng)用開發(fā)的完整生態(tài),為全球開發(fā)者和企業(yè)提供新的選擇,,也為我國企業(yè)提供了安全保障,。在此基礎(chǔ)上,鵬城實驗室推出了“鵬城云腦Ⅱ”和正在研制“鵬城云腦”下一代設(shè)施,?!谤i城云腦Ⅱ”是基于華為國產(chǎn)人工智能芯片打造的、作為國內(nèi)首個全面自主可控的E級智能算力平臺,,具有國際領(lǐng)先的人工智能算力水平,,已經(jīng)在多個國際榜單上取得冠軍。該平臺約70%的機時對外開放共享,,已支撐近千個國產(chǎn)人工智能模型訓練任務(wù)與人工智能算法發(fā)布,,成為我國最重要的開放共享、自主可控的人工智能大模型訓練平臺之一,。
3.人工智能加速與千行百業(yè)融合發(fā)展,。
智能制造方面,正在大力推進智能制造工廠建設(shè),,已實現(xiàn)產(chǎn)品個性化定制,;
智能醫(yī)療方面,已研發(fā)人工智能醫(yī)學影像產(chǎn)品,,可用于篩查早期食管癌,,其檢出率高于醫(yī)生借助內(nèi)窺鏡平均檢出率;
智慧城市方面,,“城市大腦”已應(yīng)用于杭州城市交通管理,,可有效減少區(qū)域通行時間,;
智能物流方面,人工智能技術(shù)被應(yīng)用于改進物流系統(tǒng),,分揀效率超過人工分揀的10倍多,;
智能交通方面,首都機場采用人工智能技術(shù)實現(xiàn)在50秒內(nèi)完成1700架次航班的停機位安排,,降低了飛機延誤率,,停機位利用率提高10%;
智能安防方面,,廣州利用人臉識別技術(shù)幫助發(fā)現(xiàn)及抓獲犯罪嫌疑人,。
4.人工智能發(fā)展的創(chuàng)新生態(tài)初步構(gòu)建。
科技部在自動駕駛,、城市大腦、智能醫(yī)療,、智能語音,、智能視覺等領(lǐng)域已構(gòu)建起開放創(chuàng)新平臺,助力中小企業(yè)科技創(chuàng)新,,推動行業(yè)技術(shù)進步和產(chǎn)業(yè)升級,。比如,某智能語音平臺開發(fā)者團隊數(shù)量超過80萬家,,已形成了覆蓋技術(shù)研發(fā),、基礎(chǔ)平臺、物聯(lián)網(wǎng),、智能硬件等完整人工智能產(chǎn)業(yè)鏈,。同時,人工智能領(lǐng)域的眾創(chuàng)空間,、孵化器,、加速器快速發(fā)展,創(chuàng)業(yè)孵化體系逐步完善,。
(二)中美引領(lǐng)大模型發(fā)展,,我國語言大模型與美國差距正在逐步縮小,視覺,、多模態(tài),、具身等新一代大模型有望實現(xiàn)齊頭并進
目前,國際大模型領(lǐng)域已形成美國引領(lǐng),、中國緊跟的格局,。根據(jù)中國科學技術(shù)信息研究所2023年5月發(fā)布的《中國人工智能大模型地圖研究報告》,從全球已發(fā)布的大模型分布來看,,中國和美國大幅領(lǐng)先,,超過全球總數(shù)的80%,中國在大模型數(shù)量方面位居全球第二。
中國大模型研發(fā)呈現(xiàn)蓬勃發(fā)展態(tài)勢,。截至2023年5月,,已發(fā)布79個大模型,大部分為語言大模型,。
國際上的基礎(chǔ)大模型主要分為語言,、視覺、多模態(tài)等主要類別,。其中,,在語言大模型方面,OpenAI的GPT系列和谷歌PaLM2等已形成領(lǐng)先優(yōu)勢,,我國已研發(fā)出智源“悟道?天鷹”,、百度“文心”、華為“盤古”,、“鵬城?腦?!薄⒗锿x等語言大模型,,但與海外頂尖水平仍有一定差距,。隨著人工智能模型開源生態(tài)的繁榮,中美大模型的差距將逐步縮小,。
在視覺和多模態(tài)大模型方面,,我國有望扭轉(zhuǎn)跟隨局面,實現(xiàn)中美齊頭并進,。
視覺大模型上,,智源研究院創(chuàng)新研發(fā)路徑,首創(chuàng)“上下文圖像學習”“以視覺為中心”作為核心建模思想,,用圖像理解,、解釋、輸出圖像,,研發(fā)出視覺通用多任務(wù)模型Painter,,對Painter模型針對物體分割任務(wù)作出優(yōu)化后,研發(fā)出國際首個利用視覺提示完成任意分割任務(wù)的通用視覺模型SegGPT,,已成為與Meta發(fā)布的基礎(chǔ)圖像分割模型SAM齊名的國際視覺大模型關(guān)鍵里程碑成果,。
多模態(tài)大模型上,智源研究院研發(fā)出首個打通多模態(tài)輸入到多模態(tài)輸出的統(tǒng)一多模態(tài)預(yù)訓練模型Emu,,超越了此前DeepMind的多模態(tài)大模型Flamingo,,刷新8項性能指標,并且模型能力覆蓋圖像與文本的生成及視頻理解,,能完成任意圖生文和文生圖的多模態(tài)任務(wù),。中國科學院自動化所研發(fā)出的三模態(tài)(圖文音)大模型“紫東太初”目前已具有全模態(tài)能力,,達到國際先進水平。
(三)我國人工智能整體發(fā)展已進入第一梯隊
美國智庫信息技術(shù)與創(chuàng)新基金會(ITIF) 2019年發(fā)布《誰在人工智能競賽中獲勝:中國,、歐盟還是美國,?》報告,從人才,、研究,、企業(yè)發(fā)展、應(yīng)用,、數(shù)據(jù),、硬件6個維度,系統(tǒng)地對比中美歐人工智能技術(shù)創(chuàng)新與生態(tài)構(gòu)建能力,。2021年1月,,ITIF發(fā)布該報告的2021年更新版本,指出美國仍然保持著巨大的總體領(lǐng)先優(yōu)勢,,但中國得分相比于2019年有明顯增長,,總排名反超歐盟上升至第二位,僅次于美國,。我國的應(yīng)用場景豐富,相比國外有一定優(yōu)勢,。但是,,報告也顯示,中國在人工智能研究,、人才,、企業(yè)發(fā)展等方面與美國相比差距明顯。
根據(jù)英國媒體機構(gòu)Tortoise Media發(fā)布的2023年全球人工智能指數(shù)排名,,目前人工智能領(lǐng)域綜合情況全球排名前三的國家分別是美國,、中國和新加坡。其中,,中國在運營環(huán)境和政府戰(zhàn)略方面領(lǐng)先于美國,,在基礎(chǔ)設(shè)施、科研,、發(fā)展,、商業(yè)方面緊隨其后,但在人才方面與美國差距較大,。
(四)我國人工智能發(fā)展的優(yōu)勢條件
目前,,我國在人工智能技術(shù)上持續(xù)深耕、快速積累,,在政策,、數(shù)據(jù)和市場應(yīng)用上具有一定優(yōu)勢,。
1.強有力的戰(zhàn)略引領(lǐng)和政策支持。2017年《新一代人工智能發(fā)展規(guī)劃》的發(fā)布,,開啟了我國人工智能發(fā)展的系統(tǒng)部署,。該規(guī)劃發(fā)布后,各部門和地方積極推動落實,,國家發(fā)改委,、教育部、科技部,、工信部等部門相繼出臺多項舉措,,北京、上海,、天津,、重慶、廣東等近20個省市出臺了人工智能規(guī)劃和行動計劃,,紛紛加大研發(fā)投入,,設(shè)立研發(fā)機構(gòu),制定人才引進,、財稅優(yōu)惠等配套政策,,帶動企業(yè)加快智能化步伐,產(chǎn)學研協(xié)同推進人工智能發(fā)展的格局初步形成,。
2.海量的數(shù)據(jù)資源提供支撐,。我國互聯(lián)網(wǎng)數(shù)據(jù)資源快速增長,截至2022年底,,網(wǎng)民規(guī)模超10.6億,,我國移動電話用戶規(guī)模為16.83億戶,其中5G移動電話用戶達5.61億戶,。網(wǎng)民使用網(wǎng)絡(luò)購物的比例超過55%,,手機支付用戶規(guī)模達到5.27億人。特定應(yīng)用領(lǐng)域數(shù)據(jù)規(guī)模龐大,,醫(yī)療門診總量每年達到81.8億人次,,每年有3億人次做計算機斷層掃描(CT),10億人次做數(shù)字化成像(DR),;公共和私人領(lǐng)域裝有1.76億個監(jiān)控攝像頭,;年度快遞業(yè)務(wù)量超過400億件;每年國內(nèi)旅游人數(shù)超過50億人次,。
3.豐富的應(yīng)用需求孵化應(yīng)用場景,。我國具有全球規(guī)模大、較為成熟的互聯(lián)網(wǎng)市場,,人工智能在互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用空間廣闊,。我國作為全球制造業(yè)大國,,各細分領(lǐng)域都面臨轉(zhuǎn)型升級,對人工智能應(yīng)用具有巨大需求,。我國新型城鎮(zhèn)化加速推進,,城鎮(zhèn)規(guī)模不斷擴大,利用人工智能改進城市基礎(chǔ)設(shè)施,、提升城市治理水平潛力巨大,。同時,我國老齡化問題日益突出,,居民收入水平不斷提升,,消費結(jié)構(gòu)加快升級,對醫(yī)療,、教育,、養(yǎng)老等智能化產(chǎn)品和服務(wù)需求迫切。
4.具有潛力的青年人才快速成長聚集,。我國加大對人工智能人才培育,。2018年,國家自然科學基金委新設(shè)人工智能一級學科代碼F06,,加大對人工智能基礎(chǔ)研究的支持,;國務(wù)院學位辦2022年底新設(shè)智能科學與技術(shù)一級學科,全國各大高校加快布局人工智能學院,,擴大本科和研究生培養(yǎng)規(guī)模,。我國人工智能學者數(shù)量大幅增加。
(五)我國人工智能發(fā)展的薄弱環(huán)節(jié)
1.人工智能基礎(chǔ)理論和原創(chuàng)算法差距較大,。
我國人工智能研究起步晚,原創(chuàng)性貢獻不多,。近年來,,隨著各國加快人工智能理論創(chuàng)新探索,模型和方法不斷有新的突破,,包括深度學習模型,、生成對抗網(wǎng)絡(luò)等重大成果和原創(chuàng)性理論貢獻仍以西方國家為主。大模型構(gòu)建,、訓練,、調(diào)優(yōu)對齊、推理部署等多個流程使用的主要算法及核心技術(shù)大部分來自美國,。我國在人工智能領(lǐng)域內(nèi)高影響力論文數(shù)量增長明顯,,但是,頂級論文和重大理論創(chuàng)新還主要源自美國,、英國,、加拿大等,。
2.在高端芯片、關(guān)鍵部件,、高精度傳感器等方面基礎(chǔ)薄弱,。
在圖形處理器(GPU)、專用集成電路(ASIC)和現(xiàn)場可編程門陣列(FPGA)等人工智能芯片方面,,英偉達,、英特爾、高通,、超威等歐美國家企業(yè)占據(jù)壟斷地位,。英偉達在GPU領(lǐng)域占據(jù)了全球近84%的市場份額,賽靈思(Xilinx)和阿爾特拉(Altera)占據(jù)了FPGA市場將近61.9%的份額,。美國波士頓動力公司的人形機器人產(chǎn)品(Atlas)依靠其在高精度傳感器和運動控制算法上的巨大優(yōu)勢,,目前已連續(xù)完成臺階跳躍、后空翻,、單腿三級跳等高難度動作,,在智能感知和智能行為融合上達到新的高度。
3.尚未形成具有國際影響力的人工智能開源開放平臺,。
當前,,國際巨頭企業(yè)紛紛建立人工智能開放平臺,打通硬件—系統(tǒng)—產(chǎn)業(yè)鏈條,,主導建設(shè)創(chuàng)新生態(tài),。我國在面向特定應(yīng)用領(lǐng)域已經(jīng)陸續(xù)建立了國家人工智能開放平臺,但在機器學習等通用開源算法平臺方面布局不夠,,且對產(chǎn)業(yè)鏈的帶動性不足,,國際影響力不夠。
4.數(shù)據(jù)量大質(zhì)低,,缺乏高質(zhì)量大規(guī)模中文數(shù)據(jù)集,。
在當前深度學習階段,數(shù)據(jù)對人工智能發(fā)展至關(guān)重要,,特別是在大模型時代,,數(shù)據(jù)對大模型智能水平的影響差不多要超過60%。我國的數(shù)據(jù)資源極其豐富,,但是數(shù)據(jù)的量大質(zhì)低,,很多不能用于模型訓練。
另外,,書籍期刊等版權(quán)數(shù)據(jù),、互聯(lián)網(wǎng)平臺數(shù)據(jù)等高質(zhì)量數(shù)據(jù)割裂、封閉,、不易獲取,,導致我國可用于大模型訓練的高質(zhì)量中文數(shù)據(jù)集相對缺乏,。
目前,我國大模型訓練主要依賴國際開源數(shù)據(jù)集,,國際數(shù)據(jù)集中的中文內(nèi)容少且不規(guī)范,,Common Crawl中的中文數(shù)據(jù)不足5%,基于這些數(shù)據(jù)集訓練的大模型自然是“英文思維”,。
建設(shè)高質(zhì)量大規(guī)模中文數(shù)據(jù)集,,是我國通用人工智能發(fā)展的基本前提。國內(nèi)已有部分機構(gòu)開展了相關(guān)工作,。
5.算力資源短缺,。
大模型的快速發(fā)展和持續(xù)迭代對算力的需求呈爆炸性增長,由于GPU等芯片的供給增長緩慢,,導致全球范圍內(nèi)的算力短缺問題普遍存在,,我國的算力短缺問題尤為突出。目前,,我國大模型研發(fā)所需的算力資源主要來源于智算中心,、超算中心和云計算中心。其中,,智算中心普遍算力規(guī)模不高,。
目前我國有超過30個城市正在建設(shè)或提出建設(shè)智算中心,算力規(guī)模目標大部分在1000P左右,。超算中心中國產(chǎn)人工智能芯片數(shù)量較多,,但由于很多是早年部署,型號早,、性能低,,難以用于大模型訓練。云計算中心的商業(yè)任務(wù)占用率較高,,千億級模型的私有化部署成本接近每年2000萬—3000萬元,,成本較高。
6.高水平人才不足,。
根據(jù)清華大學AMiner AI 2000全球最具影響力人工智能學者榜單,在全球人工智能高影響力學者中,,美國人數(shù)最多,,近3年均穩(wěn)步在1100人以上,占比約六成,;中國位列第二,,數(shù)量穩(wěn)步增加,超過了230人,,占比一成多,,但與美國的差距并沒有縮小,,美國是中國的近5倍。
從以上幾點來看,,我國發(fā)展人工智能既有很好的基礎(chǔ)和優(yōu)勢,,也面臨巨大挑戰(zhàn),需要探索一條適合我國國情的發(fā)展道路,。
應(yīng)堅持科技引領(lǐng),、應(yīng)用驅(qū)動的戰(zhàn)略導向,以促進人工智能與經(jīng)濟社會深度融合為主線,,以提升科技創(chuàng)新能力為主攻方向,,全面推動人工智能應(yīng)用。
應(yīng)通過科技引領(lǐng)和應(yīng)用驅(qū)動的雙向發(fā)力,,實現(xiàn)我國人工智能在理論上盡快補上短板,、技術(shù)上自主可控、產(chǎn)業(yè)上占領(lǐng)制高點,,全面增強經(jīng)濟創(chuàng)新力和國際競爭力,。
三、全面推進中國人工智能高質(zhì)量發(fā)展——勇毅前行
2023年4月28日召開的中共中央政治局會議指出,,要重視通用人工智能發(fā)展,,營造創(chuàng)新生態(tài),重視防范風險,。我國人工智能發(fā)展要深刻把握國際通用人工智能技術(shù)發(fā)展趨勢,,開展前瞻性技術(shù)研究,著力實現(xiàn)彎道超車,。同時,,要加強政策、人才,、底層基礎(chǔ)軟硬件,、開源開放等生態(tài)環(huán)境的打造,營造良好環(huán)境,。另外,,要加強風險研判,積極推進人工智能治理,,推動我國新一代人工智能持續(xù)健康發(fā)展,。
(一)持續(xù)完善我國人工智能規(guī)劃和政策體系
面對國際通用人工智能發(fā)展新形勢、新機遇,、新問題,、新挑戰(zhàn),圍繞《新一代人工智能發(fā)展規(guī)劃》提出的我國到2030年實現(xiàn)人工智能達到絕對領(lǐng)先水平的戰(zhàn)略目標,《新一代人工智能發(fā)展規(guī)劃》在新時期實施時應(yīng)突出新變化,,形成新的規(guī)劃任務(wù)方向,。另外,要針對我國通用人工智能發(fā)展的薄弱環(huán)節(jié)和發(fā)展需求,,在技術(shù)研究,、資源開放、場景建設(shè),、人才發(fā)展等方面制定相關(guān)支持政策,,打造人工智能高質(zhì)量發(fā)展的支撐政策體系。
(二)加強通用人工智能基礎(chǔ)理論研究和關(guān)鍵技術(shù)研發(fā)
前瞻布局通用人工智能前沿技術(shù)研究,,開展大模型基礎(chǔ)原理和新架構(gòu)探索,,視覺、視頻,、多模態(tài),、具身等下一代大模型研究,利用大模型解決重大科學問題,,形成具有國際影響力的通用人工智能原創(chuàng)理論體系,。
引領(lǐng)通用人工智能關(guān)鍵核心技術(shù)創(chuàng)新,重點突破分布式高效深度學習框架,、大規(guī)模認知與推理,、可控內(nèi)容生成、高效低成本訓練與推理等關(guān)鍵算法研發(fā),,建立我國通用人工智能技術(shù)創(chuàng)新體系,。
(三)夯實人工智能基礎(chǔ)軟硬件生態(tài)底層基礎(chǔ)
推動國產(chǎn)人工智能芯片實現(xiàn)突破,面向通用人工智能技術(shù)發(fā)展需求,,能夠全面支撐大模型訓練,、多模態(tài)處理、科學計算等場景算力需求,,并探索可重構(gòu),、存算一體、超規(guī)格高算力智能芯片等新型架構(gòu)芯片,,提供支撐我國人工智能發(fā)展的算力保障,。
加強自主開源深度學習框架研發(fā)攻關(guān),在大模型分布式訓練和多端多平臺推理部署等方面提升核心能力,,研發(fā)模型開發(fā),、訓練、壓縮,、推理全流程工具。
支持人工智能芯片和深度學習框架開展廣泛適配和融合優(yōu)化,打造人工智能國產(chǎn)基礎(chǔ)軟硬件深度協(xié)同生態(tài),。
(四)加強數(shù)據(jù),、算力等資源的匯聚及共享
建立多層次數(shù)據(jù)開放體系。
相關(guān)政府部門出臺政策措施,,推動出版社,、雜志社、圖書館,、博物館,、檔案館等版權(quán)數(shù)據(jù)或公共數(shù)據(jù)機構(gòu),以及互聯(lián)網(wǎng)平臺對外有序開放數(shù)據(jù)用于人工智能技術(shù)研發(fā),,打破數(shù)據(jù)壁壘,。
建立我國大規(guī)模高質(zhì)量中文數(shù)據(jù)集建設(shè)的長效機制,整合匯聚大型互聯(lián)網(wǎng)企業(yè),、大模型研發(fā)企業(yè),、數(shù)據(jù)服務(wù)企業(yè)、大型出版社,、圖書館,、主流媒體、行業(yè)組織等機構(gòu),,建設(shè)大規(guī)模高質(zhì)量的語言,、語音、圖像,、視頻和多模態(tài)數(shù)據(jù)集,,以及醫(yī)療、交通等行業(yè)數(shù)據(jù)集,,為我國通用人工智能長期健康發(fā)展提供基礎(chǔ)保障,。
夯實算力基礎(chǔ)設(shè)施建設(shè)。
加強智算中心建設(shè),,逐步提高算力設(shè)施國產(chǎn)化率,,為大模型研究提供高性能計算資源和服務(wù)。推動中國算力網(wǎng)建設(shè),,實現(xiàn)國家超算中心,、智算中心、“東數(shù)西算”數(shù)據(jù)中心的互聯(lián)互通,,實現(xiàn)全國大型算力的協(xié)同調(diào)度和高效計算,,推動云、網(wǎng),、算等資源融為一體,,形成支撐數(shù)字經(jīng)濟發(fā)展的國家算力基礎(chǔ)設(shè)施和統(tǒng)一算力大市場,,為人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)智能化轉(zhuǎn)型提供普惠算力。
(五)加強人工智能風險預(yù)判和治理體系建設(shè)
我國在通用人工智能監(jiān)管上走在國際前列,,2023年7月出臺了全球首部生成式人工智能規(guī)范性政策文件《生成式人工智能服務(wù)管理暫行辦法》,,為其他國家相關(guān)政策的制定提供了借鑒。伴隨通用人工智能技術(shù)的快速發(fā)展,,我國應(yīng)堅持發(fā)展和安全并重的原則,,建立并完善符合我國人工智能發(fā)展需求的治理體系。
1.加強對人工通用智能(AGI)發(fā)展安全風險的研判,,根據(jù)風險問題適時調(diào)整我國通用人工智能發(fā)展策略,。
2.建立中國特色的敏捷治理體系。通用人工智能發(fā)展迅速,,新應(yīng)用新模式層出不窮,,應(yīng)建立符合我國經(jīng)濟、社會發(fā)展特色的敏捷治理體系,,保持政策靈活性,,留足制度發(fā)展空間,以保障技術(shù)的長遠健康發(fā)展,。
3.開展風險防范技術(shù)研究,,以技術(shù)監(jiān)管技術(shù),針對大模型基礎(chǔ)原理,、安全與價值觀對齊,、人工通用智能(AGI)風險控制策略等方面開展深入研究,促進人工智能技術(shù)造福于人類,。
4.推動建立健全的人工智能監(jiān)管方面相關(guān)的法律,、法規(guī)和標準,是保障人工智能高水平提升,、高質(zhì)量發(fā)展的重要一環(huán),,應(yīng)逐步完善人工智能的安全保障和倫理規(guī)范,保障人工智能的安全和可信度,。
(1)制定和完善人工智能相關(guān)法律,、法規(guī)和標準,涉及人工智能開發(fā),、使用,、應(yīng)用等各個環(huán)節(jié),明確相關(guān)責任和法律后果,,規(guī)范人工智能的發(fā)展和使用,。
(2)加強人工智能的安全保障,強化人工智能的安全性研究和技術(shù)保障,,防范人工智能被惡意利用和攻擊,,確保人工智能系統(tǒng)的穩(wěn)定運行和數(shù)據(jù)的安全,。
(3)建立人工智能的倫理規(guī)范,明確人工智能的道德責任和社會責任,,避免人工智能帶來的負面影響和倫理風險,。
(4)建立健全人工智能的監(jiān)管機制,包括人工智能評估,、審查、監(jiān)督,、監(jiān)測等各個環(huán)節(jié),,加強對人工智能的監(jiān)管和治理,保障人工智能的安全和可信度,。
(5)加強人工智能的公眾參與,,包括社會組織、專家學者,、公民等各方面的參與,,加強社會監(jiān)督和民主監(jiān)督,推動人工智能的良性發(fā)展,。
(六)強化人工智能在服務(wù)企業(yè)升級中發(fā)揮更大作用
人工智能作為一項滲透性極強的顛覆性技術(shù),,對實體經(jīng)濟及社會生活的方方面面都具有極其重要的意義,是建設(shè)現(xiàn)代化經(jīng)濟體系,、實現(xiàn)高質(zhì)量發(fā)展的重要支撐,。企業(yè)作為社會經(jīng)濟活動的基本單位,直面市場,、服務(wù)市場,,是最活躍的創(chuàng)新力量。要實現(xiàn)傳統(tǒng)產(chǎn)業(yè)改造,,新興產(chǎn)業(yè)不斷壯大,,現(xiàn)代化產(chǎn)業(yè)體系加快形成,就要打好一套“組合拳”,。
1.龍頭企業(yè)要發(fā)揮引領(lǐng)作用,,打造開放、協(xié)同,、共享的創(chuàng)新生態(tài)系統(tǒng),,特別是構(gòu)建一個包括從基礎(chǔ)研究到應(yīng)用推廣的全鏈式人工智能創(chuàng)新生態(tài)系統(tǒng),助推傳統(tǒng)企業(yè)向智能化高端化轉(zhuǎn)型,。
2.加大對人工智能產(chǎn)業(yè)的支持和投入,,通過設(shè)立人工智能創(chuàng)新基金、支持人工智能企業(yè)上市等方式,,增強該類專精特新“小巨人”利用金融力量為企業(yè)不斷造血,。
3.搭建人工智能開放創(chuàng)新平臺,,通過平臺資源和技術(shù)賦能服務(wù)企業(yè)、高校和研究院所,,加速人工智能技術(shù)的研發(fā)和應(yīng)用,,不斷提高技術(shù)創(chuàng)新能力。
4.積極引導推動數(shù)據(jù)的開放和共享,,促進各個領(lǐng)域之間的數(shù)據(jù)融合和互通,,形成全社會共建共享的數(shù)據(jù)資源庫,切實推進人工智能與實體經(jīng)濟深度融合,。
(七)加強人工智能教育和人才培養(yǎng)
我國的人工智能發(fā)展,,關(guān)鍵在人。培養(yǎng)具有創(chuàng)新能力和實踐能力的高素質(zhì)人才非常關(guān)鍵,,可通過設(shè)立人工智能專業(yè),、加強人工智能相關(guān)領(lǐng)域的教育和培訓、支持高水平人才引進等,,逐步構(gòu)建人工智能人才培養(yǎng)體系和課程體系,,提高我國人工智能人才隊伍的整體素質(zhì)。
同時,,政府還應(yīng)積極鼓勵企業(yè)和高校合作,,加強人工智能人才培養(yǎng)的實踐環(huán)節(jié),推動理論與實踐的深度融合,。此外,,應(yīng)量身定制包括稅收優(yōu)惠、研發(fā)經(jīng)費支持,、人才獎勵,、高層次人才計劃等一系列政策措施,鼓勵創(chuàng)新創(chuàng)業(yè),,加強對人工智能領(lǐng)域人才的引進和扶持,,從而為人工智能人才的培養(yǎng)和發(fā)展提供有力支持。
(八)加強人工智能國際交流與合作
總體來說,,應(yīng)積極參與全球人工智能領(lǐng)域的標準制定和技術(shù)交流,,加強與國際頂尖人工智能企業(yè)和機構(gòu)的合作,推動人工智能技術(shù)的全球創(chuàng)新和發(fā)展,。
通過加強國際合作機制建設(shè),,建立人工智能領(lǐng)域的跨國合作框架,促進全球人工智能技術(shù)的開放和共享,。
加強人工智能領(lǐng)域的知識產(chǎn)權(quán)保護,,建立國際人工智能技術(shù)標準和知識產(chǎn)權(quán)保護機制,促進人工智能技術(shù)的國際化應(yīng)用和交流,。
積極參與國際人工智能標準制定,,推動人工智能標準化國際化進程,,提高我國在國際標準制定中的話語權(quán)和地位。
加強國際人才交流與合作,,鼓勵優(yōu)秀人工智能人才到國外交流和學習,,引進國際優(yōu)秀人才來我國工作和合作。
與國際頂尖人工智能企業(yè)和機構(gòu)建立戰(zhàn)略合作伙伴關(guān)系,,共同開展技術(shù)研發(fā),、應(yīng)用推廣、人才培養(yǎng)等領(lǐng)域的合作,,加速形成具有國際競爭力的人工智能產(chǎn)業(yè)集群,。
參與國際人工智能賽事和競賽,提高我國人工智能技術(shù)的國際影響力和競爭力,。
(原始文字來源:《黨委中心組學習》作者系高文(中國工程院院士)