對話科大訊飛劉慶峰：大模型競爭，要有科學(xué)精神也要有“警戒線”丨大道直行

2023-05-18 16:36:16 來源：新浪科技評論：0 [收藏] [評論]

導(dǎo)讀：　　截至目前，國內(nèi)已有超40個大模型正籌備研制或已經(jīng)推出，越來越卷的大模型競賽，似乎也正在演變?yōu)樾乱惠喫懔Α?shù)據(jù)以及算法競爭的燒錢大戰(zhàn)，各家都在宣揚著自己的大模型能力出眾、性能卓越，但最終真實情況如

　　截至目前，國內(nèi)已有超40個大模型正籌備研制或已經(jīng)推出，越來越“卷”的大模型競賽，似乎也正在演變?yōu)樾乱惠喫懔�、�?shù)據(jù)以及算法競爭的“燒錢”大戰(zhàn)，各家都在宣揚著自己的大模型能力出眾、性能卓越，但最終真實情況如何，外界難以評判。

　　越來越卷的國內(nèi)大模型競賽，究竟是好事還是壞事?企業(yè)該如何理性地參與這場競賽?近日，科大訊飛(61.190, 2.86, 4.90%)星火大模型發(fā)布，在接受新浪財經(jīng)《大道直行》采訪時，科大訊飛董事長劉慶峰給出了自己的答案，在他看來，“百花齊放是好事，但也需要建立一套客觀科學(xué)的大模型評價體系，讓大家知道誰好誰壞，避免一窩蜂而上導(dǎo)致的魚龍混雜，對外界形成誤導(dǎo)。”

　　“大模型進步中，會有許多毛病”

　　ChatGPT發(fā)布后短短半年內(nèi)，國內(nèi)已經(jīng)涌現(xiàn)出超40余支大模型團隊，從阿里、百度、360等底蘊雄厚的互聯(lián)網(wǎng)大廠，到科大訊飛、云從科技(41.800, 1.57, 3.90%)等AI科技企業(yè)，再到王慧文、王小川等明星高管帶隊的初創(chuàng)團隊，以及中科院自動化所、智源研究院等“學(xué)院派”大模型隊伍，越來越多的大模型團隊正不斷涌現(xiàn)。

　　然而，繁榮之下，愈演愈烈的大模型競賽，也正在不斷催生出新的數(shù)據(jù)孤島、算力浪費以及人才內(nèi)耗等問題。與此同時，一些企業(yè)團體不斷通過輿論手段混淆視聽，干擾大眾認知以及行業(yè)判斷的行為，也正滋生著新的混亂。

　　在劉慶峰看來，“當前國內(nèi)大模型百花齊放的狀態(tài)是一件好事，畢竟，我們需要擁抱這一次通用人工智能的機會。”但在擁抱的同時，我們也應(yīng)該尊重一些基本的倫理價值和法律底線，涉及數(shù)據(jù)安全、個人隱私以及國家安全等相關(guān)問題的，需要有一定的“警戒線”。

　　與此同時，劉慶峰還指出，“隨著越來越多的企業(yè)參與到大模型研究當中，行業(yè)需要有一個相對客觀的系統(tǒng)性評價方法，在對企業(yè)自己的大模型研究發(fā)展進行指導(dǎo)的同時，也讓外界看到不同模型之間的差異與特色，進而幫助開發(fā)者、客戶、行業(yè)監(jiān)管乃至于媒體公眾，進行自發(fā)的遴選評測。”

　　“認知大模型推出的時間并不長，即便是ChatGPT和GPT4，也在快速進步中，它們也有許多毛病和問題，如果隨便找一個例子來評測并說自己的大模型做得好，這其實是片面的，可能只是為了營銷或者其他目的的誤導(dǎo)。”

　　據(jù)劉慶峰介紹，在成立了訊飛星火大模型專項工作組初期，科大訊飛所做的第一件事情，就是根據(jù)ChatGPT的48個主要任務(wù)指令進行系統(tǒng)性的評價，并據(jù)此提出大模型研發(fā)需求。在新近公布的通用人工智能評價方式中，科大訊飛提出了包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力在內(nèi)的7大維度481項大模型評測體系。

　　在他看來，我們一定是要把通用人工智能的評價標準拿出來，這既能夠?qū)ξ覀冏约旱拇竽Ｐ脱芯孔龅绞裁闯潭绕鸬街笇?dǎo)，讓我們知道自己的進步和缺點。同時這也是拿來給開發(fā)者、客戶、行業(yè)監(jiān)管以及公眾看的，讓他們能夠知道從哪些維度進行評測，并做出自己的選擇判斷。

　　“做認知大模型的企業(yè)，大部分都是龍頭企業(yè)，都可能有一批跟隨者或者資本關(guān)注者，還是要有科學(xué)的精神，腳踏實地的態(tài)度，來給大家把大模型究竟是怎么回事把它解析出來。否則就會一窩蜂上，也不知道誰好誰壞、進步方向在哪。”劉慶峰表示。

　　據(jù)他介紹，基于自主提出的7維度481項大模型評測體系，科大訊飛對最新發(fā)布的星火大模型進行了每維度10個左右的案例測試，訊飛星火在語言理解和知識問答方面已接近ChatGPT處于國內(nèi)領(lǐng)先水平，“5分制ChatGPT能到4.48分，而訊飛星火大模型已經(jīng)達到4.29分”。

　　“有兩件事情值得注意”

　　劉慶峰認為，這一次認知大模型的發(fā)展，能夠在工業(yè)互聯(lián)網(wǎng)領(lǐng)域會形成巨大的突破和機會，有力地推動萬物互聯(lián)時代的到來。幾年前，外界一致認為IT產(chǎn)業(yè)將從以手機為代表的移動互聯(lián)網(wǎng)，發(fā)展到以穿戴設(shè)備等為代表的萬物互聯(lián)階段，但由于人機交互模式以及機器人(16.650, 2.57, 18.25%)語言理解能力的不足，這一天遲遲沒能快速到來。

　　“但今天已經(jīng)不一樣了，基于大模型的人工智能技術(shù)已經(jīng)具備通用領(lǐng)域的智慧涌現(xiàn)、觸類旁通能力，這將帶來萬物互聯(lián)這個產(chǎn)業(yè)的巨大的機會。”劉慶峰表示。

　　在他看來，人類智慧的產(chǎn)生可能有兩種模式。第一，類似于牛頓范式，所有事情都能講得清清楚楚，寫出萬有引力公式并據(jù)此計算出九大行星如何繞地運行、宇宙飛船如何飛上天。另一種則是生物神經(jīng)網(wǎng)絡(luò)，基于海量模型參數(shù)形成記憶后帶來的學(xué)習(xí)認知觸類旁通能力。劉慶峰實測發(fā)現(xiàn)，“這一次基于大模型技術(shù)的通用人工智能技術(shù)，確實已經(jīng)具備智慧涌現(xiàn)的能力，原來我們還不敢輕易提的通用人工智能確實已經(jīng)到來，星星之火開始顯現(xiàn)。”

　　“雖然目前我們?nèi)圆磺宄竽Ｐ蜑槭裁磿邆?lsquo;智慧涌現(xiàn)’的能力，但我們可以通過在大模型訓(xùn)練學(xué)習(xí)階段加入人為的選擇和價值判斷，保證它學(xué)得更對，最終更加符合我們的要求。”劉慶峰表示。

　　在劉慶峰看來，做大模型應(yīng)用的企業(yè)，有兩件事情值得注意。第一，特別敏感、關(guān)鍵的應(yīng)用，應(yīng)該建立在自主可控的硬件平臺之上，這才是長期之道。第二，做大模型應(yīng)用時，需要看準目標市場，遵循國家法律，同時自己心中帶著人工智能不是代替人類，是幫助人類的這樣一個基本倫理和價值觀，這樣才能越做越好。

　　隨著越來越多的大模型產(chǎn)品技術(shù)不斷涌現(xiàn)，未來真正有價值的認知大模型，將是以解決社會剛需問題為導(dǎo)向的，擁有正確價值觀，并且能夠在具備社會剛需的應(yīng)用場景落地大模型的企業(yè)，也將最先能形成良性的自我造血能力。

分享到：

責(zé)任編輯：zsz

更多相關(guān)搜索：

新聞
圖片
下載
專題

返回服務(wù)頻道

快速導(dǎo)航：新聞立場角度消費服務(wù) 產(chǎn)品

對話科大訊飛劉慶峰：大模型競爭，要有科學(xué)精神也要有“警戒線”丨大道直行

網(wǎng)友評論

高端訪談排行

延伸閱讀

最新高端訪談