進(jìn)軍智能語(yǔ)音賽道 漢王科技發(fā)布首款智能語(yǔ)音應(yīng)用“漢王語(yǔ)音王”

2024-08-08 16:10:56   來(lái)源:家電消費(fèi)網(wǎng)   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  人類(lèi)語(yǔ)言最早起源于5萬(wàn)-10萬(wàn)年前,和文字一起是人類(lèi)文明的兩大支柱,共同促進(jìn)了人類(lèi)社會(huì)的進(jìn)步。漢王科技已深耕手寫(xiě)文字識(shí)別技術(shù)三十余載,榮獲過(guò)國(guó)家科技進(jìn)步一等獎(jiǎng)等眾多獎(jiǎng)項(xiàng)榮譽(yù),并在各個(gè)行業(yè)取得大量成...
  人類(lèi)語(yǔ)言最早起源于5萬(wàn)-10萬(wàn)年前,和文字一起是人類(lèi)文明的兩大支柱,共同促進(jìn)了人類(lèi)社會(huì)的進(jìn)步。漢王科技已深耕手寫(xiě)文字識(shí)別技術(shù)三十余載,榮獲過(guò)國(guó)家科技進(jìn)步一等獎(jiǎng)等眾多獎(jiǎng)項(xiàng)榮譽(yù),并在各個(gè)行業(yè)取得大量成功商業(yè)實(shí)踐。今天,漢王科技將正式開(kāi)拓全新的智能語(yǔ)音市場(chǎng),踏實(shí)全棧AI賦能千行百業(yè)之路。

  8月8日,漢王科技2024新品發(fā)布會(huì)圓滿(mǎn)舉行,首款智能語(yǔ)音應(yīng)用——漢王語(yǔ)音王App正式發(fā)布,致力于讓所有人都可以無(wú)障礙地進(jìn)行語(yǔ)言記錄、交流溝通,構(gòu)建智能時(shí)代“通天塔”,讓世界文明共享、共謀新發(fā)展。

  漢王科技在人工智能技術(shù)上堅(jiān)持原始創(chuàng)新三十余載,在感知智能、認(rèn)知智能以及具身智能領(lǐng)域持續(xù)深耕和廣域布局,進(jìn)一步完善從“看懂”、“聽(tīng)懂”、到“讀懂”,再到“表達(dá)”的人工智能和機(jī)器人核心技術(shù)體系。漢王語(yǔ)音王正是在此技術(shù)體系下孕育而生,依托多模態(tài)天地大模型、OCR等全棧AI技術(shù)賦能,將在蓬勃發(fā)展的智能語(yǔ)音賽道上開(kāi)辟出屬于自己的天地。

  漢王語(yǔ)音王是基于漢王自研多模態(tài)天地大模型,自主研發(fā)的一款集AI語(yǔ)音記錄、智能翻譯與同聲傳譯于一體的智能語(yǔ)音旗艦應(yīng)用,支持AI精準(zhǔn)轉(zhuǎn)寫(xiě)、拍錄同步(自動(dòng)裁邊)、話稿整理、智能總結(jié)及不間斷實(shí)時(shí)翻譯等功能,用戶(hù)可以即聽(tīng)即用,幫助跨越語(yǔ)言障礙,提高日常辦公、學(xué)習(xí)、會(huì)議、旅游等場(chǎng)景應(yīng)用效率和便捷性。

  AI語(yǔ)音記錄:精準(zhǔn)識(shí)別拍錄同步

  AI語(yǔ)音記錄支持實(shí)時(shí)語(yǔ)音轉(zhuǎn)錄和語(yǔ)音文件轉(zhuǎn)錄兩種方式,具備錄音速記、拍錄同步(自動(dòng)裁邊) 、語(yǔ)音轉(zhuǎn)文字、說(shuō)話人精準(zhǔn)識(shí)別、智能總結(jié)、AI話稿整理等多種智能功能,滿(mǎn)足用戶(hù)不同場(chǎng)景的語(yǔ)音記錄應(yīng)用需求。

  漢王科技自研高精度語(yǔ)音識(shí)別模型,基于多元化數(shù)據(jù)訓(xùn)練、多任務(wù)聯(lián)合學(xué)習(xí)等方式提升語(yǔ)音準(zhǔn)確識(shí)別的性能,并通過(guò)多項(xiàng)模型優(yōu)化技術(shù)對(duì)性能進(jìn)一步完善和提升,確保在多種復(fù)雜的聲學(xué)場(chǎng)景下都能得到語(yǔ)音識(shí)別的高準(zhǔn)確性,隨時(shí)隨地滿(mǎn)足用戶(hù)對(duì)語(yǔ)音記錄準(zhǔn)確性的要求。

  實(shí)際測(cè)試時(shí),漢王科技語(yǔ)音識(shí)別具備高準(zhǔn)確率、多語(yǔ)言支持、動(dòng)態(tài)修正和自然交流等特點(diǎn)。在行業(yè)廣泛使用的開(kāi)源中文語(yǔ)音識(shí)別數(shù)據(jù)集上測(cè)試,錯(cuò)誤率低至1.94%,處于行業(yè)領(lǐng)先水平。

  漢王語(yǔ)音王可以自動(dòng)修正錯(cuò)誤文本,內(nèi)容規(guī)整后無(wú)須二次編輯,也支持自動(dòng)生成標(biāo)題、總結(jié)記錄要點(diǎn)等,省心省力,同時(shí)更提升工作效率和學(xué)習(xí)效果。

  值得一提的是拍錄同步功能,在錄音轉(zhuǎn)寫(xiě)的同時(shí)拍照,通過(guò)強(qiáng)大的原研OCR技術(shù),在錄音類(lèi)產(chǎn)品中首創(chuàng)照片自動(dòng)裁邊和內(nèi)容智能排版功能,為用戶(hù)直接提供一份聲、圖、文并茂的多媒體記錄文檔,重要信息一點(diǎn)不落。

  在會(huì)議、頭腦風(fēng)暴等多人對(duì)話場(chǎng)景中,準(zhǔn)確分離出每個(gè)人的身份以及內(nèi)容具有非常大的挑戰(zhàn),聲紋識(shí)別成為關(guān)鍵。聲紋和掌紋等類(lèi)似都是人類(lèi)生物特征,漢王科技聲紋識(shí)別技術(shù)具備在不限定用戶(hù)說(shuō)話內(nèi)容的情況下,最短2秒準(zhǔn)確識(shí)別說(shuō)話人的能力。

  為解決場(chǎng)景中的各種環(huán)境噪聲和回響,以及說(shuō)話人語(yǔ)速和情感變化等復(fù)雜情況下的識(shí)別準(zhǔn)確性問(wèn)題,漢王科技隨機(jī)對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行了速度變化,添加環(huán)境噪聲、回響等模擬復(fù)雜場(chǎng)景,通過(guò)持續(xù)訓(xùn)練迭代,最終在復(fù)雜場(chǎng)景下得到穩(wěn)定的準(zhǔn)確識(shí)別率。同時(shí),漢王科技也引入聚類(lèi)算法等實(shí)現(xiàn)了結(jié)合聲紋和語(yǔ)義特征,進(jìn)一步提高識(shí)別的準(zhǔn)確性,杜絕“張冠李戴”的情況出現(xiàn)。

  當(dāng)整理好會(huì)議紀(jì)要、演講內(nèi)容等后,漢王語(yǔ)音王能與電紙本一鍵分享,將語(yǔ)音文本一體化傳輸?shù)诫娂埍旧线M(jìn)行高效閱讀辦公操作,構(gòu)建成一個(gè)多端互聯(lián)、共享的應(yīng)用生態(tài)。

  對(duì)話翻譯:自然準(zhǔn)確林籟泉韻

  對(duì)話翻譯具備實(shí)時(shí)翻譯和語(yǔ)音合成兩大能力,可以精準(zhǔn)捕捉每一句對(duì)話,即時(shí)翻譯,讓大家可以跨越語(yǔ)言界限,適合辦公、教育和旅游等場(chǎng)景下無(wú)障礙交流溝通。

  基于漢王自研天地大模型的對(duì)話翻譯,具備更好的語(yǔ)義理解和上下文聯(lián)系能力,以及自適應(yīng)語(yǔ)言風(fēng)格和行業(yè)領(lǐng)域,提供更準(zhǔn)確和自然的翻譯內(nèi)容,表達(dá)更清楚、交流更順暢。

  漢王科技自研的語(yǔ)音合成系統(tǒng)不僅具有卓越的多音字準(zhǔn)確識(shí)別能力,還能處理各種復(fù)雜多變的語(yǔ)音現(xiàn)象,能輕松應(yīng)對(duì)日常溝通交流、教育輔助朗讀和客戶(hù)服務(wù)等應(yīng)用場(chǎng)景。

  為了進(jìn)一步提升語(yǔ)音自然度、準(zhǔn)確性和合成效率,漢王科技自研高自然度聲學(xué)模型,并引入了恒Q變換等多項(xiàng)先進(jìn)技術(shù),讓合成語(yǔ)音能更加高效和精準(zhǔn)地還原人類(lèi)語(yǔ)音特性,帶來(lái)林籟泉韻的聽(tīng)覺(jué)體驗(yàn)。

  同聲傳譯:長(zhǎng)時(shí)間不間斷實(shí)時(shí)同傳

  在AI語(yǔ)音記錄和對(duì)話翻譯的能力基礎(chǔ)上,漢王語(yǔ)音王又更進(jìn)一步拓展,推出了同聲傳譯功能。這對(duì)語(yǔ)音識(shí)別的實(shí)時(shí)準(zhǔn)確度、轉(zhuǎn)寫(xiě)、糾正和翻譯能力都提出了更高的要求。

  漢王語(yǔ)音王具備長(zhǎng)時(shí)段不間斷即時(shí)翻譯能力,實(shí)時(shí)雙語(yǔ)對(duì)照文字記錄更能準(zhǔn)確表達(dá)專(zhuān)業(yè)術(shù)語(yǔ)和詞句表達(dá),加上領(lǐng)先的配錄同步功能,跨越語(yǔ)言的障礙,讓聲音也能看得見(jiàn),幫助用戶(hù)輕松解決超長(zhǎng)時(shí)間國(guó)際會(huì)議、學(xué)術(shù)研討的內(nèi)容記錄難題,為辦公、學(xué)習(xí)等全面提質(zhì)增效。

  通用人工智能浪潮興起,對(duì)人工智能技術(shù)和產(chǎn)品產(chǎn)生了巨大推動(dòng),更是成為行業(yè)智能應(yīng)用的革命性工具,為各行各業(yè)開(kāi)啟“人工智能+”變革之門(mén)。

  漢王科技此刻恰逢其會(huì),發(fā)布智能語(yǔ)音應(yīng)用——漢王語(yǔ)音王,一方面源于自研天地大模型的多模態(tài)智能涌現(xiàn),另一方面智能語(yǔ)音市場(chǎng)將進(jìn)入一個(gè)新的爆發(fā)增長(zhǎng)期。在技術(shù)和商業(yè)雙輪驅(qū)動(dòng)下,漢王語(yǔ)音王必將在智能語(yǔ)音市場(chǎng)上頂天立地,開(kāi)辟出一片屬于自己的嶄新未來(lái)。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論