近期,北京車展火爆開幕,無論是各路大牌明星的到來、大量新能源汽車的集體亮相,還是眾品牌主力車型的國產化都是人們津津樂道的話題。然而在人工智能時代,汽車智能化毫無疑問才是本次車展真正的主角!
人工智能距離我們還有多遠?
據了解,在本屆北京車展上,八成以上的車型都標配了智能交互系統,而此前剛剛驚艷大眾的樂視,也攜首臺生態汽車LeSEE、搭載了樂樂語音交互系統的第二代樂視車聯版阿斯頓·馬丁Rapide
S出席車展,成為車展上最具“智能科技范兒”的代表之一。
實際上,今年3月發布的“十三五”規劃綱要中,就將培育人工智能納入其中。而人工智能技術在生活消費領域的應用獲得快速拓展有望創造巨大市場機會,2016年也被視為“人工智能商用元年”。
可以說,人工智能已經不再遙不可及,科幻大片中的“神奇”場景進入到尋常百姓家也不再是奢望。僅從現在人們的日常生活中就不難看出,服務類機器人,如:掃地機器人、醫療護理機器人、娛樂機器人等已經走入現實生活。而工業機器人更是現代工業化高速發展的中堅力量。對于普通消費者而言,智能手機、客服機器人、游戲中的電腦AI等等早已見怪不怪,更不必說前些日子引起全世界關注的谷歌AlphaGo了,只要你細心觀察其實人工智能無處不在,它已經慢慢滲透到了我們生活的每一個地方。
然而,盡管人工智能已經不再是完全的“新人”,但是它現階段依然不能完全顛覆人們的生活。究其原因就是技術發展初期的不成熟,造成部分人工智能并不那么“好用”,尤其是量產產品,這也是現階段許多廠商研究的重點。如何能夠讓擁有“人腦”般思考的“電腦”進入普通人的生活是一件看似簡單卻極為艱難的事。不過大家也不必太過失望,畢竟人工智能的發展僅有數十年的基礎就出現了如AlphaGo這樣令全世界驚訝甚至產生恐慌的機器人,相信人工智能真正的成為人們生活中無處不在的幫手將不會遙遠。
語音交互系統到底能幫助我們解決什么問題?
從發明電腦以來,人機交互技術一共經歷了五個階段:機器語言交互階段、命令語言階段、圖形界面階段、物理通道階段和虛擬現實階段。目前我們正處在第四個階段,即“物理多通道交互階段”,用戶可以通過更加自然的手勢動作、語音或表情控制機器,進一步接近人類自然的交流習慣。同時,上述交互手段的成熟對于虛擬現實階段的發展也有著至關重要的意義。
相對于手勢動作進行交互來說,語音和表情交互顯然更加令人感到興奮,這也與大量科幻大片中鏡頭的出現不無關系。在這其中,語音交互是最直接、最自然的方式,也是當下最為火爆的領域,甚至被不少人認為是人機交互的下一個風口。如此前蘋果收購了VocalIQ以增強Siri的語音助手功能、谷歌入股了國內的語音助手出門問問、微軟將語音助手微軟小娜推廣到IOS和Android平臺等等動作,都顯示出眾多國際級科技類企業對于語音交互方面的看重。
眾所周知,現階段語音交互領域中以聲紋識別最為熱門,聲紋識別的理論基礎是每一個聲音都具有獨特的特征,通過該特征能將不同人的聲音進行有效的區分,這對于人機交互來說至關重要,也是精準識別、安全等方面的保障基礎。
近期樂視420“無破界,不生態”全球新品發布會上,樂視第四代超級電視就內置了擁有聲紋識別功能的語音交互系統,并且擁有能夠精準識別兒童聲音的能力,這也是聲紋識別功能實際應用的一個典范。當兒童在使用電視的時候,會自動跳轉至兒童搜索,對孩子進行保護。這對于當前國內沒有影視劇分級的現狀下,兒童看電視如何更加健康的問題得到了完美的解決。
實際上,語音交互還能夠解決更多問題,比如:將其應用于汽車中,將會徹底解放人的雙手,就算是現階段也能夠讓駕駛者無需手動去開啟如收音機、后備箱、空調、車燈、導航等功能,不僅更加方便,而且更加安全。同時作為智能語音交互系統,當你駕車出行的時候,相當于多了一位能夠幫你處理任何車內事物的小助手,可以盡享最佳的駕車體驗!
人工智能現在是時尚還是實用?
許多人覺得通過一個簡單的手勢,一句話就可以達到控制某一個產品的目的非常的時尚。事實的確如此,正如蘋果公司在iPhone上首次搭載Siri的時候,風靡全球,以至于隨后智能手機如果無法實現語音交互就會顯得十分落后,甚至很土。
而在時尚的背后,也存在不少的瑕疵,即便是Siri在實際應用中也并非完美,如何處理語音的地域化、方言、用戶習慣等都是亟待解決的問題,只有真正完美解決了這些瑕疵,才能真正達到正確識別用戶意圖的程度。
而目前非常火爆的家居類機器人其實也遇到了同樣的問題,即此類機器人基本都是完成單一功能,如清潔清掃、看護等,用戶體驗很不理想。專家認為,出現這種情況,主要是服務機器人缺少深度學習能力,未能識別用戶的意圖。
而上述這些情況也正是現階段人工智能大眾化所遇到的問題,如何才能讓炫酷的人工智能除了時尚感以外更加實用,是擺在當下企業面前最大的問題。
樂樂語音到底是誰?
正如上文所述,說到人工智能就不得不提語音交互,而近期最火爆的語音交互類品牌既不是大家熟悉的蘋果、谷歌,也不是國內最知名的科大訊飛,而是一個名為“樂樂語音”的品牌。樂樂語音隸屬于樂樂創新智能科技(北京)有限公司,近期樂視420發布會上發布的第四代超級電視中的聲紋識別功能、第二代樂視車聯版阿斯頓·馬丁Rapide
S中的車載智能交互系統都是出自這家企業之手。而這其中,為阿斯頓·馬丁Rapide
S量身打造的全球首款全方位立體降噪語音識別交互系統更是引起了社會各界的關注,尤其是多路語音采集降噪模組更是全球首家應用于車載交互領域的個性化語音降噪產品,具有里程碑式的意義與極大的實際應用價值。
據了解,全方位立體降噪語音識別的交互系統是利用多個層面組合技術運用,以降低在語音控制中噪聲對語料的干擾。如通過指向型麥克風陣列,只接受固定角度和范圍內的聲音,從硬件角度上降噪;采用盲源分離、回音消除,從算法上實現語音降噪。創新性開發了多路語音采集降噪模組,即前端通過麥克風陣列,精確地定位語音來源,經過降噪系統提取純凈的語音并對該路語音進行增強及回聲消除,同時通過車內六路語音提取器,精確識別車內不同座駕位置人員發出的語音指令從而輸入到語音識別模塊,反饋出適合該人員的實際操作。
此外,據樂樂語音工作人員透露,他們已經研發完成一整套基于車載系統的整體解決方案,為車企及車載系統開發商提供開放性SDK云平臺及創新性硬件操作系統,可以廣泛適配各類型車載操作系統,實現熱喚醒、打斷、降噪等強大功能的語音識別技術,通過場景化語義解析,涵蓋導航、電臺、音樂、電話、應用操控、汽車操控、違章查詢、指定地點查詢、路況、今日限行等各領域內容。
移動互聯網時代的到來讓萬物互聯成為可能,而在經歷了長時間探索階段后,人工智能類產品已經擁有不俗的性能和廣泛應用性。業界普遍認為,人工智能越來越深入地應用于衣食住行、教育、醫療等領域,不僅可令更多民眾“走近”這一高新技術并享受其“紅利”,也有望創造巨大的市場機會。相信伴隨谷歌AlphaGo、樂樂語音全方位立體降噪語音識別交互系統等里程碑式的產品、技術更多的出現、應用,人類將會在不遠的將來真正的迎來智能時代!









