訊飛星火V4.0發(fā)布 評測:整體超越GPT-4 Turbo

2024-06-27 20:02:51   來源:家電消費網(wǎng)   評論:0   [收藏]   [評論]
導讀:  家電消費網(wǎng)6月27日訊 今天,訊飛星火大模型V4 0正式發(fā)布。訊飛星火V4 0 七大核心能力全面升級,全面對標GPT-4 Turbo,并實現(xiàn)在文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力等方面的整體超越。  
  家電消費網(wǎng)6月27日訊    今天,訊飛星火大模型V4.0正式發(fā)布。訊飛星火V4.0 七大核心能力全面升級,全面對標GPT-4 Turbo,并實現(xiàn)在文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力等方面的整體超越。

  訊飛星火V4.0在圖文識別能力上進一步升級,在科研、金融、醫(yī)療、司法、辦公等場景的應用效果已領先GPT-4o。此外,星火長文本能力也全新升級,并針對長文檔知識問答的幻覺問題,業(yè)界首發(fā)溯源功能。

  外部權威測試集也體現(xiàn)出訊飛星火V4.0的領先性。在國內(nèi)外12項大模型主流測試集中,訊飛星火在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型,國內(nèi)大模型全面領先。

  科大訊飛董事長劉慶峰展示了訊飛星火V4.0在復雜指令、復雜邏輯推理、空間推理、高中數(shù)學等方面的效果,星火“智商”再度進化。以空間推理為例,“Bob在客廳里。他拿著一個杯子走到廚房。他把球放進杯子里,然后拿著杯子走到臥室。他把杯子倒過來,然后走到花園。他把杯子放在花園里,然后走到車庫。問題:球在什么地方?”訊飛星火可以基于空間和常識推斷出球在臥室的地面上,這些能力的進步對于以后的具身智能、家庭機器人都具有意義。

分享到:
責任編輯:zsz

網(wǎng)友評論