對話科大訊飛劉慶峰:大模型競爭,要有科學(xué)精神也要有“警戒線”丨大道直行

2023-05-18 16:36:16   來源:新浪科技   評論:0   [收藏]   [評論]
導(dǎo)讀:  截至目前,國內(nèi)已有超40個大模型正籌備研制或已經(jīng)推出,越來越卷的大模型競賽,似乎也正在演變?yōu)樾乱惠喫懔Α?shù)據(jù)以及算法競爭的燒錢大戰(zhàn),各家都在宣揚著自己的大模型能力出眾、性能卓越,但最終真實情況如
  截至目前,國內(nèi)已有超40個大模型正籌備研制或已經(jīng)推出,越來越“卷”的大模型競賽,似乎也正在演變?yōu)樾乱惠喫懔、?shù)據(jù)以及算法競爭的“燒錢”大戰(zhàn),各家都在宣揚著自己的大模型能力出眾、性能卓越,但最終真實情況如何,外界難以評判。

  越來越卷的國內(nèi)大模型競賽,究竟是好事還是壞事?企業(yè)該如何理性地參與這場競賽?近日,科大訊飛(61.190, 2.86, 4.90%)星火大模型發(fā)布,在接受新浪財經(jīng)《大道直行》采訪時,科大訊飛董事長劉慶峰給出了自己的答案,在他看來,“百花齊放是好事,但也需要建立一套客觀科學(xué)的大模型評價體系,讓大家知道誰好誰壞,避免一窩蜂而上導(dǎo)致的魚龍混雜,對外界形成誤導(dǎo)。”

  “大模型進步中,會有許多毛病”

  ChatGPT發(fā)布后短短半年內(nèi),國內(nèi)已經(jīng)涌現(xiàn)出超40余支大模型團隊,從阿里、百度、360等底蘊雄厚的互聯(lián)網(wǎng)大廠,到科大訊飛、云從科技(41.800, 1.57, 3.90%)等AI科技企業(yè),再到王慧文、王小川等明星高管帶隊的初創(chuàng)團隊,以及中科院自動化所、智源研究院等“學(xué)院派”大模型隊伍,越來越多的大模型團隊正不斷涌現(xiàn)。

  然而,繁榮之下,愈演愈烈的大模型競賽,也正在不斷催生出新的數(shù)據(jù)孤島、算力浪費以及人才內(nèi)耗等問題。與此同時,一些企業(yè)團體不斷通過輿論手段混淆視聽,干擾大眾認知以及行業(yè)判斷的行為,也正滋生著新的混亂。

  在劉慶峰看來,“當前國內(nèi)大模型百花齊放的狀態(tài)是一件好事,畢竟,我們需要擁抱這一次通用人工智能的機會。”但在擁抱的同時,我們也應(yīng)該尊重一些基本的倫理價值和法律底線,涉及數(shù)據(jù)安全、個人隱私以及國家安全等相關(guān)問題的,需要有一定的“警戒線”。

  與此同時,劉慶峰還指出,“隨著越來越多的企業(yè)參與到大模型研究當中,行業(yè)需要有一個相對客觀的系統(tǒng)性評價方法,在對企業(yè)自己的大模型研究發(fā)展進行指導(dǎo)的同時,也讓外界看到不同模型之間的差異與特色,進而幫助開發(fā)者、客戶、行業(yè)監(jiān)管乃至于媒體公眾,進行自發(fā)的遴選評測。”

  “認知大模型推出的時間并不長,即便是ChatGPT和GPT4,也在快速進步中,它們也有許多毛病和問題,如果隨便找一個例子來評測并說自己的大模型做得好,這其實是片面的,可能只是為了營銷或者其他目的的誤導(dǎo)。”

  據(jù)劉慶峰介紹,在成立了訊飛星火大模型專項工作組初期,科大訊飛所做的第一件事情,就是根據(jù)ChatGPT的48個主要任務(wù)指令進行系統(tǒng)性的評價,并據(jù)此提出大模型研發(fā)需求。在新近公布的通用人工智能評價方式中,科大訊飛提出了包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力在內(nèi)的7大維度481項大模型評測體系。

  在他看來,我們一定是要把通用人工智能的評價標準拿出來,這既能夠?qū)ξ覀冏约旱拇竽P脱芯孔龅绞裁闯潭绕鸬街笇?dǎo),讓我們知道自己的進步和缺點。同時這也是拿來給開發(fā)者、客戶、行業(yè)監(jiān)管以及公眾看的,讓他們能夠知道從哪些維度進行評測,并做出自己的選擇判斷。

  “做認知大模型的企業(yè),大部分都是龍頭企業(yè),都可能有一批跟隨者或者資本關(guān)注者,還是要有科學(xué)的精神,腳踏實地的態(tài)度,來給大家把大模型究竟是怎么回事把它解析出來。否則就會一窩蜂上,也不知道誰好誰壞、進步方向在哪。”劉慶峰表示。

  據(jù)他介紹,基于自主提出的7維度481項大模型評測體系,科大訊飛對最新發(fā)布的星火大模型進行了每維度10個左右的案例測試,訊飛星火在語言理解和知識問答方面已接近ChatGPT處于國內(nèi)領(lǐng)先水平,“5分制ChatGPT能到4.48分,而訊飛星火大模型已經(jīng)達到4.29分”。

  “有兩件事情值得注意”

  劉慶峰認為,這一次認知大模型的發(fā)展,能夠在工業(yè)互聯(lián)網(wǎng)領(lǐng)域會形成巨大的突破和機會,有力地推動萬物互聯(lián)時代的到來。幾年前,外界一致認為IT產(chǎn)業(yè)將從以手機為代表的移動互聯(lián)網(wǎng),發(fā)展到以穿戴設(shè)備等為代表的萬物互聯(lián)階段,但由于人機交互模式以及機器人(16.650, 2.57, 18.25%)語言理解能力的不足,這一天遲遲沒能快速到來。

  “但今天已經(jīng)不一樣了,基于大模型的人工智能技術(shù)已經(jīng)具備通用領(lǐng)域的智慧涌現(xiàn)、觸類旁通能力,這將帶來萬物互聯(lián)這個產(chǎn)業(yè)的巨大的機會。”劉慶峰表示。

  在他看來,人類智慧的產(chǎn)生可能有兩種模式。第一,類似于牛頓范式,所有事情都能講得清清楚楚,寫出萬有引力公式并據(jù)此計算出九大行星如何繞地運行、宇宙飛船如何飛上天。另一種則是生物神經(jīng)網(wǎng)絡(luò),基于海量模型參數(shù)形成記憶后帶來的學(xué)習(xí)認知觸類旁通能力。劉慶峰實測發(fā)現(xiàn),“這一次基于大模型技術(shù)的通用人工智能技術(shù),確實已經(jīng)具備智慧涌現(xiàn)的能力,原來我們還不敢輕易提的通用人工智能確實已經(jīng)到來,星星之火開始顯現(xiàn)。”

  “雖然目前我們?nèi)圆磺宄竽P蜑槭裁磿邆?lsquo;智慧涌現(xiàn)’的能力,但我們可以通過在大模型訓(xùn)練學(xué)習(xí)階段加入人為的選擇和價值判斷,保證它學(xué)得更對,最終更加符合我們的要求。”劉慶峰表示。

  在劉慶峰看來,做大模型應(yīng)用的企業(yè),有兩件事情值得注意。第一,特別敏感、關(guān)鍵的應(yīng)用,應(yīng)該建立在自主可控的硬件平臺之上,這才是長期之道。第二,做大模型應(yīng)用時,需要看準目標市場,遵循國家法律,同時自己心中帶著人工智能不是代替人類,是幫助人類的這樣一個基本倫理和價值觀,這樣才能越做越好。

  隨著越來越多的大模型產(chǎn)品技術(shù)不斷涌現(xiàn),未來真正有價值的認知大模型,將是以解決社會剛需問題為導(dǎo)向的,擁有正確價值觀,并且能夠在具備社會剛需的應(yīng)用場景落地大模型的企業(yè),也將最先能形成良性的自我造血能力。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評論