近日,網(wǎng)易集團(tuán)、網(wǎng)易公益聯(lián)合浙江省殘疾人福利基金會發(fā)起“人生第一句”聲音復(fù)原公益計(jì)劃,利用網(wǎng)易互娛AI Lab的iSpeech技術(shù)打造首個(gè)AI復(fù)原聽障人士原聲的工具——聽障人士僅需上傳5分鐘沒有完整語義的發(fā)聲片段,之后在產(chǎn)品中輸入想要表達(dá)的文字,就可以用原本的聲音說出來。目前該產(chǎn)品已向全國聽障人士免費(fèi)開放,幫助他們無障礙、有情感地與外界交流,用自己的聲音說出“人生第一句”。
據(jù)介紹,作為亞運(yùn)圓夢計(jì)劃之一,“人生第一句”公益計(jì)劃在杭州2022年第4屆亞洲殘疾人運(yùn)動(dòng)會組委會、中國殘疾人事業(yè)新聞宣傳促進(jìn)會、浙江省殘疾人聯(lián)合會的指導(dǎo)下發(fā)起,基于致敬亞運(yùn)、助力亞殘運(yùn)、助力殘障人士社會融合的大背景,通過AI技術(shù)幫助聽障人士實(shí)現(xiàn)“親口說話”的人生夢想,號召更多人“益”起來關(guān)注殘障人士,關(guān)注無障礙環(huán)境建設(shè)。
首個(gè)AI聲音復(fù)原工具,免費(fèi)開放給全國聽障人士
不久前,浙江省殘疾人福利基金會面向浙江特殊教育職業(yè)學(xué)院的學(xué)生和音書APP(擁有百萬聽障用戶)的部分用戶開展調(diào)研,調(diào)研結(jié)果顯示,僅有十分之一的受訪對象能夠通過簡單的口語與身邊的人進(jìn)行交流,他們中的大多數(shù)人經(jīng)歷過太多想說但說不出的自卑與懊惱,最大的夢想便是能說出“人生第一句”。
是否能運(yùn)用最新的人工智能技術(shù)幫助聽障人士向他人傳遞自己的真實(shí)想法和真誠態(tài)度?網(wǎng)易互娛AI Lab的技術(shù)團(tuán)隊(duì)展開了研究。研究發(fā)現(xiàn),目前市場上絕大多數(shù)語音克隆產(chǎn)品需要輸入完整講話采集數(shù)據(jù),對于無法正常發(fā)出語義的聽障人士來說并不適用,而且面向聽障人士的交流工具,大多也只有文字轉(zhuǎn)語音功能,他們無法用自有的音色表達(dá)。
因此,網(wǎng)易互娛AI Lab研發(fā)團(tuán)隊(duì)利用iSpeech技術(shù),基于海量數(shù)據(jù)的預(yù)訓(xùn)練模型,加上聽障人士極少量的純語音數(shù)據(jù)快速微調(diào)算法模型,在快速克隆新的說話人音色的同時(shí)保留基礎(chǔ)模型的內(nèi)容發(fā)音能力,研發(fā)首個(gè)聽障人士聲音復(fù)原工具,實(shí)現(xiàn)只需輸入文字就可實(shí)時(shí)用原聲流暢表達(dá),讓聽障人士能圓夢“人生第一句”。

目前該聲音復(fù)原工具已經(jīng)在音書App上線,供聽障人群免費(fèi)使用,并且在浙江省杭州市馬塍路殘疾人融合就業(yè)街區(qū)試點(diǎn)應(yīng)用,幫助聽障咖啡師、面包師等更好地工作。據(jù)了解,殘疾人融合就業(yè)街區(qū)也是杭州亞殘運(yùn)會期間對外展示的窗口,有了科技的助力,無聲小店的工作人員從被助者變?yōu)橹苏撸憬萘鲿车嘏c各方來客交流,為他們提供更好的服務(wù),向世界展示中國殘疾人群體的新風(fēng)貌。

近七成聽障人士表示希望使用,人生第一句話是說“謝謝”
在調(diào)研中,有超過67%的受訪對象表示“愿意使用音色復(fù)原技術(shù)”,超過一半的受訪對象表示“愿意將音色復(fù)原技術(shù)推薦給身邊有需要的人”,也有部分受訪對象表示除了手機(jī) APP 軟件以外,希望音色復(fù)原技術(shù)應(yīng)用于在公交、出租、飯店、超市、銀行等公共場所。
99年的小陳是一位先天聽障的甜品師。也許是因?yàn)樗氖澜绺裢獍察o,工作時(shí)總是非常專注,做的奶凍和牛角包總是被一搶而空。但小陳心里一直有個(gè)愿望,希望能跟顧客“親口”交流。此前遇到過商品原材料等問題,有些顧客沒耐心文字解釋,她只能干著急,而且她也想向老顧客們“親口”說句感謝。自從試用了產(chǎn)品后,她覺得顧客多了一些耐心,交流起來變得平等同步了,她也更有底氣,更自信,更愿意主動(dòng)交流。

跟小陳一樣,沈師傅也是殘疾人融合就業(yè)街區(qū)的一位理發(fā)師,他做理發(fā)師10多年了,最擅長快剪男頭。因?yàn)榧彝l件不好,從小沒有錢去訓(xùn)練讀、聽能力,所以在工作中,他只能用文字、簡單手勢來跟客人溝通發(fā)型要求。他的顧客中老年人偏多,文字交流更加費(fèi)勁。試用產(chǎn)品后,他能非常順暢、快速地了解客戶需求,平時(shí)生活中上醫(yī)院、上超市、上高鐵都方便多了。

除了工作以外,人生重要時(shí)刻無法親口表達(dá)也是聽障人士很大的遺憾。顧老師是一位曾經(jīng)參與世界巡演的舞蹈家,一歲時(shí)的一次發(fā)燒打針讓她的世界永遠(yuǎn)失去了聲音。她說,自己的童年是在四處求醫(yī)中度過的,不管藥有多苦、針有多疼她都堅(jiān)持治療,但每次都是開開心心去,失望而歸。后來媽媽就把她送進(jìn)聾兒康復(fù)中心進(jìn)行語言康復(fù)訓(xùn)練,“當(dāng)我說話的時(shí)候別人會用異樣的眼光看我,我覺得很自卑。”
在老師的鼓勵(lì)下,她開始學(xué)畫畫、書法、舞蹈,后來成為一名殘疾人藝術(shù)團(tuán)的舞蹈演員,參加過浙江賽區(qū)環(huán)球小姐比賽,也拍攝過殘奧會獻(xiàn)禮影片。但每當(dāng)這些重要時(shí)刻,她都很遺憾無法表達(dá)激動(dòng)與感謝。如今,她能用自己的音色“說話”了,“想說又說不出的時(shí)候太多了!現(xiàn)在最想對陪在我身邊鼓勵(lì)我的人說感謝!也想對女兒說對不起,她學(xué)說話的時(shí)候不能陪她、教她。”
浙江省殘疾人福利基金會理事長趙小飛表示,浙江省共有持證殘疾人133.7萬人,其中聽力殘疾20.8萬人、言語殘疾1.7萬人,希望通過這一AI技術(shù)幫助他們用自己的音色向他人傳遞內(nèi)心真實(shí)想法,進(jìn)而推動(dòng)解決該群體在和健聽人溝通交流過程中存在的障礙問題,改變他們的生活、學(xué)習(xí)和工作環(huán)境狀況及相應(yīng)的能力水平,使他們真正能夠平等參與社會生活,實(shí)現(xiàn)人生價(jià)值。
大模型只能對話、寫詩、作畫?網(wǎng)易AI技術(shù)加速落地普惠
實(shí)際上,一直以來網(wǎng)易持續(xù)利用游戲技術(shù)助力打造無障礙社會。此次運(yùn)用的iSpeech技術(shù)原本是由網(wǎng)易互娛AI Lab針對游戲場景推出的AI創(chuàng)作工具,已落地服務(wù)于以《大話西游》《一夢江湖》《荒野行動(dòng)》為代表的10余項(xiàng)游戲項(xiàng)目產(chǎn)品之中,相關(guān)技術(shù)成果斬獲了多項(xiàng)國際頂會論文和技術(shù)專利,并在此前應(yīng)用于游戲中,進(jìn)行交互界面的朗讀播報(bào),輔助視覺障礙人士玩游戲。
隨著AI浪潮的興起,網(wǎng)易除了加快人工智能技術(shù)在產(chǎn)業(yè)的落地應(yīng)用外,也致力于讓每個(gè)普通人都能夠享受到新技術(shù)發(fā)展的紅利,實(shí)現(xiàn)技術(shù)的普惠。例如,在鄉(xiāng)村振興方面,網(wǎng)易利用人工智能等技術(shù),打造線上線下結(jié)合的智慧文旅元宇宙,為22個(gè)縣域新增游客300萬;在工業(yè)生產(chǎn)方面,網(wǎng)易伏羲將人工智能、游戲化交互、游戲仿真等能力遷移到工程機(jī)械領(lǐng)域,推出國內(nèi)首臺無人裝載機(jī)器人和挖掘機(jī)器人,參與到礦山、鐵路等一線場景的建設(shè)。
接下來,網(wǎng)易不僅將會和浙江省殘疾人福利基金會一起把這項(xiàng)技術(shù)提供給更多有需要的人,還會不斷探索游戲技術(shù)外溢價(jià)值,賦予游戲更多的社會價(jià)值和可能。