6月24日,2023年度國家科學(xué)技術(shù)獎在京揭曉,共評選出250個項目。記者了解到,由科大訊飛股份有限公司牽頭,聯(lián)合中國科學(xué)技術(shù)大學(xué)、清華大學(xué)等高校及行業(yè)領(lǐng)軍企業(yè)聯(lián)合完成的“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項目榮獲2023年度國家科技進(jìn)步獎一等獎。據(jù)悉,這是深度學(xué)習(xí)引發(fā)全球人工智能浪潮以來,過去十年人工智能領(lǐng)域的首個國家科學(xué)技術(shù)進(jìn)步獎。
據(jù)了解,多語種智能語音技術(shù)對于支撐人機(jī)交互、人類語言互通及國家安全等需求具有重大戰(zhàn)略意義,具有十分廣闊的產(chǎn)業(yè)前景,是當(dāng)前國際科技競爭的核心焦點之一。然而,智能語音也面臨著如何突破復(fù)雜場景語音技術(shù)大規(guī)模實用門檻,如何基于自主可控的平臺、實現(xiàn)國產(chǎn)軟硬件的語音產(chǎn)業(yè)鏈自主可控等問題。
為解決這一技術(shù)難題,科大訊飛聯(lián)合各單位、企業(yè)持續(xù)攻關(guān)十余年,通過提出復(fù)雜語音信號解耦建模技術(shù)、多語種共享建模技術(shù)、語音語義聯(lián)合建模技術(shù)、國產(chǎn)異構(gòu)硬件平臺訓(xùn)練及推理加速技術(shù)等,實現(xiàn)了國產(chǎn)多語種智能語音的關(guān)鍵技術(shù)突破,構(gòu)建形成了自主可控的智能語音技術(shù)體系。據(jù)悉,科大訊飛也是唯一獲得本屆國家科學(xué)技術(shù)獎一等獎的民營企業(yè)。
記者了解到,多語種智能語音技術(shù)是包含多語種語音識別、多語種語音合成、多語種翻譯技術(shù)等在內(nèi)的綜合技術(shù),也是新一代人工智能核心技術(shù)之一。目前,該技術(shù)支持全球69個主流語種,除了6個聯(lián)合國通用語言(漢語、英語、法語、西班牙語、俄語、阿拉伯語)之外,還包括挪威語、丹麥語等小語種54個,均達(dá)國際通用標(biāo)準(zhǔn)。
如今,該技術(shù)成果不僅在博鰲論壇等重要政務(wù)和商務(wù)交流場合得到廣泛應(yīng)用,更在中國品牌“走出去”戰(zhàn)略中發(fā)揮了關(guān)鍵推動作用。以近年來國產(chǎn)新能源汽車的海外出口為例,中國汽車出口企業(yè)十強(qiáng)中,有八家搭載了科大訊飛的多語種智能語音技術(shù),涵蓋23個語種,服務(wù)范圍擴(kuò)展至60多個國家和地區(qū),為中國汽車行業(yè)的國際化進(jìn)程提供了有力支撐。
記者了解到,近三年,多語種智能語音技術(shù)產(chǎn)業(yè)化項目累計實現(xiàn)直接經(jīng)濟(jì)效益521.28億元,并帶動由工信部和安徽省政府共建、以科大訊飛為核心的“中國聲谷”產(chǎn)業(yè)集聚發(fā)展。
6月27日,訊飛星火V4.0也將正式發(fā)布,底座能力全面對標(biāo)GPT-4 Turbo,語音大模型也將迎來全新升級。