中信所報告:國內大模型數量已達79個 超半數已開源
2023-05-29 17:31:01 來源: 貝殼財經

中國科學技術信息研究所所長,科技部新一代人工智能發(fā)展研究中心主任趙志耕圖/主辦方供圖


(資料圖)

5月28日,中國科學技術信息研究所所長,科技部新一代人工智能發(fā)展研究中心主任趙志耕在中關村論壇平行論壇“人工智能大模型發(fā)展論壇”上發(fā)布了《中國人工智能大模型地圖研究報告》。據她披露,據不完全統(tǒng)計目前國內已經發(fā)布了79個大模型,從地區(qū)來看北京和廣東最多,自然語言處理是大模型研發(fā)最活躍的領域。

全球已發(fā)布認知大模型 中美共占80% 國內已有79個大模型

趙志耕介紹,在全球大模型發(fā)展趨勢上,美國的谷歌和open AI等機構是領先的技術方向。歐洲、俄羅斯、以色列等國家和地區(qū)都有多個團隊和技術人員致力于大模型的最新開發(fā)方向。從全球已發(fā)布的認知大模型中,美國和中國占據了大頭,超過了80%,美國模型數量位居全球之首。自2020年開始,中國大模型進入快速發(fā)展期,整體增長態(tài)勢與美國保持同步,從2017年發(fā)布人工智能發(fā)展規(guī)劃以來,各領域的布局為大模型發(fā)展奠定了非常好的基礎。

政產學研協力合作使中國大模型已經呈現出良好發(fā)展態(tài)勢,無論是理論方法還是軟硬件技術的體系化研究能力,都已形成了技術迭代趨勢。近年來,中國大模型各種技術路線都在并行突破,特別是自然語言理解、機器視覺和多模態(tài)方面,出現了盤古、悟道、文心一言、通義千問、星火認知等多個在行業(yè)具有影響力的大模型。同時,我們可以看到中國大模型在地域、領域以及研發(fā)主體方面,呈現出明顯的發(fā)展趨勢。

趙志耕表示,據不完全統(tǒng)計,目前中國已發(fā)布79個大模型,“我們注意到地域分布明顯特點,14個省市地區(qū)都有大模型研究,但北京和廣東非常突出。北京有38個大模型,廣東有20個大模型。在模型領域分布上,自然語言處理仍是目前大模型研發(fā)最活躍的重點領域,其次是多模態(tài)領域。計算機視覺和智能語音等領域仍有待進一步突破,目前模型較少?!?/p>

大模型快速發(fā)展但合作開發(fā)力量不足 北上廣AI論文數量最多

“研發(fā)主體分布上,大學及研究機構和企業(yè)都投入大模型研發(fā),但單獨研究現象較多。產業(yè)界和學術界合作開發(fā)的力量不足。今年以來,大模型呈現快速發(fā)展的態(tài)勢,我們觀察到合作收縮趨勢,這是接下來需要注意的?!壁w志耕說。

在她看來,算力是重要的要素資源,對人工智能發(fā)展很重要。同時,人工智能大模型與算力之間存在強相關性和正相關性,“我們注意到北京、廣東、浙江、上海等地的大型模型數量眾多,但近3年來,我們發(fā)現同樣的現象,這4個地區(qū)的人工智能服務器采購數量非常巨大。因此,各地在加快公共算力部署推動人工智能發(fā)展的同時,也加速了大型模型基礎設施的建設?!?/p>

趙志耕表示,人才是人工智能的重要支撐。在大型模型發(fā)展上,人才呈正相關關系。例如,北京、江蘇、廣東和上海等地的大型模型人才相對集中,同時也是人工智能人才的高地。從區(qū)域影響力來看,北京、廣東、上海三地在論文的發(fā)表量和引用量上居國內最高。其中清華大學和阿里、百度聯合開發(fā)的CogView模型論文引用數量最高,華為的FILP、百度的ERNIE 3.0以及阿里的M6-OFA引用數在國內也名列前茅。然而,這些大模型的學術影響與國際相比仍有一定差距。

強調開源開放 國內超半數大模型實現開源

趙志耕表示,在人工智能發(fā)展方面,中國強調開源開放這一基本原則,大多數人工智能大模型的發(fā)展也堅持開源創(chuàng)新和生態(tài)引導。目前,超過一半國內發(fā)布的大模型已經實現了開源,其中開源的主力是高校和科研機構,如清華大學的ChatGLM-68、復旦大學的MOSS以及百度的文心系列大模型。

“目前,中國大模型的產業(yè)化應用沿著兩條技術路線發(fā)展,第一條路線是通用類大模型,正不斷打造跨行業(yè)的通用化人工智能能力平臺,其行業(yè)應用正在從辦公、生活、娛樂等方向向醫(yī)療、工業(yè)、教育等領域加速拓展。另一條路線是針對垂直領域的專業(yè)類大模型,有大批針對生物制藥、遙感、氣象等垂直領域的專業(yè)大模型,正發(fā)揮其在領域內的縱深應用效果。同時,我們也看到許多企業(yè)提供針對特定業(yè)務場景的高質量專業(yè)化解決方案,不斷擴大大模型產業(yè)化應用的市場空間和水平。”趙志耕說。

趙志耕也對國內大模型的發(fā)展提出了建議,她表示,要加強資源和研發(fā)力量的統(tǒng)籌,促進大模型的有序發(fā)展;加快基礎研究和技術創(chuàng)新,提升學術和開源影響力;強化大模型發(fā)展中的場景牽引作用,打造大模型標桿項目;強化國際合作,積極參與全球人工智能治理。

“中國在人工智能健康可持續(xù)發(fā)展方面一直秉承高技術和向善發(fā)展,以人為本的理念,我們推出了人工智能的自律原則和倫理規(guī)范。我們希望這些治理原則和倫理規(guī)范能夠在大模型的全鏈條中落地生根。在增進共識的基礎上,加強人工治理的全球合作,創(chuàng)造中國的智慧和治理方案?!壁w志耕說。

記者聯系郵箱:luoyidan@xjbnews.com

編輯 宋鈺婷

校對 王心

關鍵詞:
責任編輯:zN_2954