日前,2024中關(guān)村論壇系列活動(dòng)――第二屆北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會(huì)舉辦。會(huì)上,國(guó)家發(fā)展改革委黨組成員,國(guó)家數(shù)據(jù)局黨組書(shū)記、局長(zhǎng)劉烈宏受邀發(fā)言,分享了他基于數(shù)據(jù)和算力等角度對(duì)人工智能高質(zhì)量發(fā)展的一些思考,并表示下一步,國(guó)家數(shù)據(jù)局將把握數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展的趨勢(shì),大力推進(jìn)數(shù)據(jù)資源的整合共享和開(kāi)發(fā)利用。
讓數(shù)據(jù)成為人工智能發(fā)展的催化劑
劉烈宏指出,2023年,以ChatGPT為代表的生成式人工智能在語(yǔ)言對(duì)話領(lǐng)域率先取得巨大突破,并陸續(xù)在計(jì)算機(jī)、生物、化學(xué)等領(lǐng)域取得顯著進(jìn)展。國(guó)內(nèi)諸多企業(yè)相繼推出大模型及相關(guān)的產(chǎn)品,并在互聯(lián)網(wǎng)服務(wù)和行業(yè)數(shù)據(jù)化場(chǎng)景中加速落地,展現(xiàn)出巨大的應(yīng)用前景。2024年2月,視頻生成大模型取得突破性進(jìn)展,引起全球廣泛關(guān)注和討論。大模型技術(shù)具有規(guī)模擴(kuò)展性強(qiáng)、多任務(wù)適應(yīng)性、能力可塑性強(qiáng)的特點(diǎn),并仍在快速迭代、持續(xù)研究,有望成為通用人工智能的可行路徑之一。
劉烈宏指出:“我們要充分發(fā)揮數(shù)據(jù)的基礎(chǔ)資源作用和創(chuàng)新引擎作用,構(gòu)建滿足人工智能發(fā)展需要的數(shù)據(jù)開(kāi)放、共享、流通、交易的模式,全面提高數(shù)據(jù)資源開(kāi)發(fā)利用水平,讓數(shù)據(jù)‘供得出、流得動(dòng)、用得好’,真正成為人工智能發(fā)展的催化劑,推動(dòng)做強(qiáng)、做優(yōu)、做大數(shù)字經(jīng)濟(jì)?!?
劉烈宏表示,將數(shù)據(jù)作為生產(chǎn)要素,是我國(guó)首次提出的重大理論創(chuàng)新,這也為我們搶抓人工智能戰(zhàn)略機(jī)遇奠定了堅(jiān)實(shí)的基礎(chǔ)。大模型驅(qū)動(dòng)的人工智能發(fā)展對(duì)于高質(zhì)量數(shù)據(jù)供給提出了更高要求,數(shù)據(jù)要素的市場(chǎng)化配置和開(kāi)發(fā)利用顯得尤為重要。我們要充分發(fā)揮數(shù)據(jù)的基礎(chǔ)資源作用和創(chuàng)新引擎作用。
劉烈宏首談人工智能高質(zhì)量發(fā)展
大會(huì)現(xiàn)場(chǎng),劉烈宏分享了他基于數(shù)據(jù)和算力等角度對(duì)人工智能高質(zhì)量發(fā)展的一些思考。
高質(zhì)量數(shù)據(jù)是人工智能發(fā)展的根基。
在他看來(lái),高質(zhì)量數(shù)據(jù)是人工智能發(fā)展的根基。人工智能技術(shù)的歷次突破都離不開(kāi)高質(zhì)量數(shù)據(jù)集的支撐。
回顧歷史,由七萬(wàn)張手寫(xiě)數(shù)字圖片組成的數(shù)據(jù)集,促進(jìn)了圖像識(shí)別領(lǐng)域的發(fā)展,快速推動(dòng)了數(shù)據(jù)自動(dòng)分類和聚類技術(shù)的發(fā)展;由1400萬(wàn)張各類互聯(lián)網(wǎng)圖片組成的數(shù)據(jù)集開(kāi)啟了深度學(xué)習(xí)的時(shí)代,極大地提升了人工智能感知技術(shù)的能力;由自然語(yǔ)言、編程語(yǔ)言、網(wǎng)絡(luò)數(shù)據(jù)等組成的萬(wàn)億級(jí)多模態(tài)高質(zhì)量數(shù)據(jù)級(jí)開(kāi)啟了大模型時(shí)代,人工智能開(kāi)始具備一定的認(rèn)知交付能力,使得機(jī)器認(rèn)知,甚至通用智能成為可能。
劉烈宏指出,今天數(shù)據(jù)的“質(zhì)”和“量”是推動(dòng)大模型不斷進(jìn)步的關(guān)鍵。例如,在前提條件不變的前提下,使用更高質(zhì)量的數(shù)據(jù)集來(lái)做訓(xùn)練,能使20億參數(shù)量級(jí)的模型超過(guò)100億參數(shù)量級(jí)的模型。
高性能算力是人工智能發(fā)展的基礎(chǔ)。
高性能算力是人工智能發(fā)展的基礎(chǔ)。劉烈宏認(rèn)為,面對(duì)生成式人工智能服務(wù)和大模型的迅速興起帶來(lái)的旺盛的算力需求,需要從算力供給和算力網(wǎng)絡(luò)調(diào)度等方面來(lái)做好統(tǒng)籌協(xié)調(diào)。從算力供給來(lái)看,需要加大低成本、高質(zhì)量、易使用的算力供給;從算力網(wǎng)絡(luò)的調(diào)度來(lái)看,需要做好人工智能、模型訓(xùn)練推理、離線分析等高時(shí)延業(yè)務(wù)等資源匹配,切實(shí)提升計(jì)算資源的整體使用率。
2023年12月,國(guó)家數(shù)據(jù)局聯(lián)合有關(guān)部門共同印發(fā)了《深度實(shí)施東數(shù)西算工程加快構(gòu)建全國(guó)一體化算力網(wǎng)的實(shí)施意見(jiàn)》,從“通用算力、智能算力、超級(jí)算力的一體化布局”“東中西部算力一體化協(xié)同”“算力數(shù)據(jù)算法一體化應(yīng)用”“算力與綠色電力一體化融合”“算力發(fā)展與安全保障一體化推進(jìn)”等五個(gè)統(tǒng)籌出發(fā),推動(dòng)建設(shè)聯(lián)網(wǎng)調(diào)度、普惠易用、綠色安全的全國(guó)一體化算力網(wǎng)。
行業(yè)應(yīng)用是人工智能落地的關(guān)鍵。
劉烈宏指出,行業(yè)應(yīng)用是人工智能落地的關(guān)鍵?!拔覈?guó)超大規(guī)模市場(chǎng)為人工智能行業(yè)應(yīng)用提供了豐富的土壤,這是我國(guó)推動(dòng)人工智能應(yīng)用邁向更高水平的重要優(yōu)勢(shì)。”劉烈宏說(shuō)道。
例如在交通物流行業(yè),人工智能技術(shù)應(yīng)用可以助力企業(yè)提升運(yùn)輸效率,降低全社會(huì)物流的成本;在文化旅游行業(yè)開(kāi)發(fā)文化大模型,能夠貫通各類文化機(jī)構(gòu)的數(shù)據(jù)中心,充分挖掘文化數(shù)據(jù)的價(jià)值;在科技創(chuàng)新領(lǐng)域以科學(xué)數(shù)據(jù)支撐大模型的開(kāi)發(fā),可以更深入地挖掘各類科學(xué)數(shù)據(jù)和科技的文獻(xiàn)。
國(guó)家數(shù)據(jù)局與16個(gè)部門共同印發(fā)《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024―2026年)》,提升數(shù)據(jù)利用水平,推動(dòng)人工智能行業(yè)應(yīng)用落地,推動(dòng)社會(huì)各界共同挖掘市場(chǎng)的需求。這為人工智能技術(shù)的行業(yè)應(yīng)用奠定了基礎(chǔ)。
安全治理是人工智能發(fā)展的保障。
另外,劉烈宏還指出,安全治理是人工智能發(fā)展的保障。人工智能在對(duì)經(jīng)濟(jì)社會(huì)發(fā)展帶來(lái)深遠(yuǎn)影響的同時(shí)也蘊(yùn)含著隱私保護(hù)、算法安全、設(shè)施安全和技術(shù)耐用等潛在的風(fēng)險(xiǎn)隱患。
目前,國(guó)內(nèi)多家企業(yè)已經(jīng)設(shè)立了數(shù)據(jù)倫理安全委員會(huì),積極落實(shí)行業(yè)自律,并取得了初步的成效。“在此基礎(chǔ)上,我們還應(yīng)該多維布局,匯聚政府、行業(yè)、企業(yè)等各主體,從科技倫理、立法、技術(shù)實(shí)踐等維度推動(dòng)人工智能安全治理,堅(jiān)持創(chuàng)新發(fā)展和安全治理統(tǒng)籌原則,持續(xù)優(yōu)化完善人工治理安全風(fēng)險(xiǎn)的防范?!眲⒘液暾f(shuō)道。
保障體系是人工智能發(fā)展的支撐。
最后,保障體系是人工智能發(fā)展的支撐。人工智能高質(zhì)量發(fā)展離不開(kāi)人才的建設(shè)、標(biāo)準(zhǔn)規(guī)范和國(guó)際合作等保障體系。其中復(fù)合型人才是發(fā)展的強(qiáng)效動(dòng)力,需要以社會(huì)需求和產(chǎn)業(yè)發(fā)展為導(dǎo)向,培養(yǎng)兼具理論和實(shí)踐,掌握數(shù)據(jù)、算法、分布式計(jì)算等技能的跨專業(yè)人才隊(duì)伍。
“統(tǒng)一的標(biāo)準(zhǔn)規(guī)范體系是發(fā)展的重要基礎(chǔ),需要構(gòu)建關(guān)于人工智能數(shù)據(jù)、算力和算法的標(biāo)準(zhǔn)體系,有效提升高質(zhì)量數(shù)據(jù)和高質(zhì)量算力的供給?!眲⒘液瓯硎?,“開(kāi)放的國(guó)際合作是發(fā)展的必經(jīng)之路,需要積極開(kāi)展人工智能國(guó)際合作,打造互聯(lián)互通、互利共贏的人工智能的命運(yùn)共同體。”
劉烈宏表示,下一步,國(guó)家數(shù)據(jù)局將把握數(shù)字化、網(wǎng)絡(luò)化智能發(fā)展的趨勢(shì),大力推進(jìn)數(shù)據(jù)資源的整合共享和開(kāi)發(fā)利用,讓數(shù)據(jù)賦能人工智能的發(fā)展,讓數(shù)據(jù)真正實(shí)現(xiàn)“供得出、流得動(dòng),用得好”。同時(shí)打造全國(guó)一體化的算力調(diào)度體系,加速算力的高質(zhì)量發(fā)展。
三部門共同研究提升“東數(shù)西算”網(wǎng)絡(luò)傳輸效能
3月1日晚,國(guó)家數(shù)據(jù)局公號(hào)發(fā)文稱,國(guó)家數(shù)據(jù)局等三部門共同研究提升“東數(shù)西算”網(wǎng)絡(luò)傳輸效能。
文章說(shuō),近日,為深入貫徹黨中央、國(guó)務(wù)院決策部署,加快落實(shí)《深入實(shí)施“東數(shù)西算”工程 加快構(gòu)建全國(guó)一體化算力網(wǎng)的實(shí)施意見(jiàn)》,國(guó)家數(shù)據(jù)局會(huì)同國(guó)家發(fā)展改革委、工業(yè)和信息化部圍繞充分發(fā)揮“東數(shù)西算”網(wǎng)絡(luò)傳輸效能,進(jìn)一步提高企業(yè)網(wǎng)絡(luò)傳輸性價(jià)比,聽(tīng)取國(guó)家樞紐節(jié)點(diǎn)企業(yè)、數(shù)據(jù)傳輸需求企業(yè),以及電信運(yùn)營(yíng)商等方面的意見(jiàn)建議,研究建立專用于國(guó)家樞紐節(jié)點(diǎn)間的公共傳輸通道,有效提升“東數(shù)西算”網(wǎng)絡(luò)傳輸效能。
文章披露,下一步,國(guó)家發(fā)展改革委、國(guó)家數(shù)據(jù)局、工業(yè)和信息化部將引導(dǎo)中國(guó)電信、中國(guó)聯(lián)通、中國(guó)移動(dòng)等企業(yè)加強(qiáng)創(chuàng)新探索,近期將在部分樞紐節(jié)點(diǎn)間試點(diǎn)開(kāi)通“東數(shù)西算”的“公共傳輸通道”,探索采用多種服務(wù)方式,增強(qiáng)普惠易用水平,切實(shí)提升企業(yè)主體獲得感。
“東數(shù)西算”工程自啟動(dòng)以來(lái),國(guó)家政策支持力度不斷加強(qiáng),《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》等一系列重磅政策措施的發(fā)布,加強(qiáng)算力、數(shù)據(jù)、算法協(xié)同應(yīng)用,算力得以更快地走進(jìn)千行百業(yè)。
據(jù)中國(guó)信息通信研究院測(cè)算,算力每投入1元,將帶動(dòng)3元至4元的GDP經(jīng)濟(jì)增長(zhǎng)。加快算力建設(shè),將有效激發(fā)數(shù)據(jù)要素創(chuàng)新活力,加快數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化進(jìn)程,催生新技術(shù)、新業(yè)態(tài)、新模式,實(shí)現(xiàn)對(duì)經(jīng)濟(jì)發(fā)展效能的放大、疊加、倍增作用。
AI的“三駕馬車”:數(shù)據(jù)、算法、算力
人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,數(shù)據(jù)、算法和算力被公認(rèn)為人工智能的三大核心要素。
數(shù)據(jù)是人工智能發(fā)展的基礎(chǔ)。人工智能領(lǐng)域作為一個(gè)數(shù)據(jù)密集的領(lǐng)域,離不開(kāi)數(shù)據(jù)的支持,其發(fā)展以海量數(shù)據(jù)作為基礎(chǔ),數(shù)據(jù)越多越優(yōu),場(chǎng)景特點(diǎn)越豐富,算法性能越高,模型也就更高效。
算法可比喻為人工智能發(fā)展的大腦。是通過(guò)一系列人工智能算法,比如機(jī)器學(xué)習(xí)從海量數(shù)據(jù)中獲得規(guī)律,并利用規(guī)律對(duì)位置數(shù)據(jù)某些特性進(jìn)行預(yù)測(cè)與判斷,是處理數(shù)據(jù)信息的規(guī)則與方式。
算法是實(shí)現(xiàn)人工智能的根本途徑,是挖掘數(shù)據(jù)智能的有效方法。當(dāng)前,以深度學(xué)習(xí)為代表的算法快速發(fā)展拉開(kāi)了人工智能浪潮的序幕,在計(jì)算機(jī)視覺(jué)、智能語(yǔ)音、自然語(yǔ)言處理、生物特征識(shí)別等領(lǐng)域廣泛應(yīng)用,相繼超過(guò)人類識(shí)別水平。
在數(shù)據(jù)、算力和算法的進(jìn)步與驅(qū)動(dòng)下,近年來(lái)人工智能商業(yè)成熟度不斷提升,行業(yè)進(jìn)入加速發(fā)展階段。與此同時(shí),人工智能與傳統(tǒng)產(chǎn)業(yè)的融合發(fā)展,彰顯出了巨大的市場(chǎng)潛力,吸引了包括國(guó)內(nèi)外科技巨頭、解決方案及設(shè)備供應(yīng)商、傳統(tǒng)行業(yè)龍頭企業(yè)以及人工智能企業(yè)等各類企業(yè),積極參與到各個(gè)層面及細(xì)分領(lǐng)域的發(fā)展布局和市場(chǎng)競(jìng)爭(zhēng)中。
根據(jù)畢馬威發(fā)布的《人工智能全域變革圖景展望:躍遷點(diǎn)來(lái)臨(2023)》顯示,從全球范圍來(lái)看,人工智能企業(yè)數(shù)量經(jīng)歷了由爆發(fā)式增長(zhǎng)轉(zhuǎn)入穩(wěn)步增長(zhǎng)的階段變化。從2017年開(kāi)始,全球當(dāng)年新增AI注冊(cè)企業(yè)數(shù)量逐年下降,已從2017年的3714家下降到2022年的1106家。
結(jié)合各國(guó)對(duì)比情況來(lái)看,截至2023年6月底,全球人工智能企業(yè)共計(jì)3.6萬(wàn)家,中美英企業(yè)數(shù)量名列前茅。美國(guó)人工智能企業(yè)數(shù)量約1.3萬(wàn)家,在全球占比達(dá)34%,中國(guó)占比16%,英國(guó)7%%,美中英三國(guó)的人工智能企業(yè)數(shù)量合計(jì)占全球的56%。從人工智能獨(dú)角獸企業(yè)情況來(lái)看,截至2023年6月底,全球人工智能領(lǐng)域獨(dú)角獸總數(shù)達(dá)291家,美國(guó)和中國(guó)企業(yè)數(shù)量獨(dú)占鰲頭并基本平分秋色,分別為131家和108家。
中國(guó)人工智能領(lǐng)域企業(yè)密集誕生在2015年至2018年之間,約三分之二的人工智能領(lǐng)域核心企業(yè)成立年限在5-10年,隨著有效投資增長(zhǎng)乏力,人工智能領(lǐng)域新增注冊(cè)企業(yè)數(shù)量在2017年達(dá)到峰值528家后,逐年下降,到2022年新增注冊(cè)企業(yè)數(shù)減少至63家。
結(jié)合區(qū)域布局來(lái)看,中國(guó)人工智能企業(yè)主要集聚于北京、廣東、上海、浙江等地,形成京津冀、長(zhǎng)三角、粵港澳三足鼎立的格局,其中北京市人工智能企業(yè)數(shù)量有1,600余家。從人工智能獨(dú)角獸企業(yè)來(lái)看,北京市有41家,位居全國(guó)首位。上海市和廣東省數(shù)量位列二、三,分別有24家和23家。
當(dāng)前我國(guó)人工智能產(chǎn)業(yè)加速發(fā)展,從基礎(chǔ)支撐、核心技術(shù)到行業(yè)應(yīng)用的產(chǎn)業(yè)鏈條基本形成,一批創(chuàng)新活躍、特色鮮明的創(chuàng)新企業(yè)加速成長(zhǎng),新模式、新業(yè)態(tài)不斷涌現(xiàn),整體呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。政策支持、投資引導(dǎo)和巨頭布局將推動(dòng)中國(guó)AI 產(chǎn)業(yè)的結(jié)構(gòu)調(diào)整,進(jìn)一步擴(kuò)大市場(chǎng)規(guī)模。根據(jù)國(guó)際數(shù)據(jù)公司IDC數(shù)據(jù)顯示,2020 年,中國(guó)人工智能產(chǎn)業(yè)規(guī)模達(dá)到 68.36 億美元,預(yù)計(jì) 2023 年將達(dá)174.68 億美元,年復(fù)合增長(zhǎng)率達(dá)到 40.52%。