一篇文章讓你搞懂人工智能語音進化史

出處: ZOL 作者:家電資訊網(wǎng) 日期: 2017/12/8 8:39:01

　　關(guān)于人工智能誕生沒有統(tǒng)一說法，有部分學者以1950年“人工智能之父”馬文·明斯基建造世界上第一臺神經(jīng)網(wǎng)絡(luò)計算機為起點。且以當年語音交互起始到現(xiàn)在，大致經(jīng)歷三段演化和推進。讓我們一起回顧整個過程，來看一下人工智能語音發(fā)生的幾次技術(shù)躍進。
人工智能語音1.0：一問一答
現(xiàn)在，工智能語音技術(shù)在數(shù)碼、電子、工業(yè)制造領(lǐng)域被廣泛應(yīng)用并且成為全民熱議的話題，可是在發(fā)展之初它還有很多稚嫩的地方。關(guān)于人工智能時代的討論有很多，但在消費層面上，真正大范圍進入用戶試用階段的人工智能語音應(yīng)用大概在2010年之后。這個階段的人工智能語音技術(shù)形成了以語音交互為主的感知狀態(tài)，我們暫且稱之為第一階段。
這時的人工智能語音應(yīng)用通過算法的演變和大量數(shù)據(jù)的輸入，在技術(shù)層面實現(xiàn)自然語音識別和語義理解，針對對話內(nèi)容進行數(shù)據(jù)匹配，然后調(diào)取相關(guān)話題，從而實現(xiàn)簡單內(nèi)容的單向一問一答。第一階段在自我學習、邏輯推力方面有很大欠缺，不能針對同一對話內(nèi)容展開深入交互，橫向拓展和縱向發(fā)展都不能滿足用戶需求。例如你問今天天氣如何？他調(diào)取今天的天氣數(shù)據(jù)。接著你問明天的天氣如何？他調(diào)取明天的天氣預(yù)報。今天天氣和明天天氣只是各自獨立的對答，不能連接貫通，形成邏輯。

　　關(guān)于人工智能語音技術(shù)的研究，國外企業(yè)投入較早，且發(fā)展也比較全面。像Nuance，曾經(jīng)在語音識別方面功績卓著，到現(xiàn)在為止仍然是全球最大的語音技術(shù)公司，專利數(shù)量和市場份額都遙遙領(lǐng)先。之后包括亞馬遜、蘋果和谷歌，都在深度挖掘智能語音，推出自己的語音助手。據(jù)不完全統(tǒng)計，目前全球?qū)I(yè)做人工智能語音的公司有上千家之多，后起之秀越來越多，涉及的領(lǐng)域越來越廣。如總部位于奧地利維也納的Cortical.io，主要提供新型自然語言理解(NLU)解決方案。由艾倫人工智能研究所和亞馬遜Alexa基金等機構(gòu)資助KITT.AI公司，開發(fā)可定制熱詞檢測器（hotword　detector）和對話引擎ChatFlow。舊金山的MindMeld公司可提供對話式人工智能平臺等等。
人工智能語音2.0：有問有答
早在2000年，比爾蓋茨曾經(jīng)提出“未來10年是語音的時代”。我們目前所說的智能語音，學術(shù)界稱為“自然語言處理”（來自百度）。業(yè)內(nèi)人士認為，智能語音技術(shù)將會成為人類主流的人機交互方式之一，計算機技術(shù)與人工智能領(lǐng)域的發(fā)展為智能語音交互發(fā)展帶來了希望。
人工智能語音交互的更深層階段——對話，即有問有答，包含上下文邏輯。舉個例子或許更好理解，如果一門課程上一年沒開設(shè)，對于“這門課程去年有多少同學沒通過”這樣的問題，機器是回答“都沒通過”還是“去年沒開這門課”？同時機器還需要提前存儲“去年沒開這門課”的信息，想想我們從小時候啥也不懂到現(xiàn)在懂得的知識和信息，這是難以想象的數(shù)據(jù)量。再比如說“我想聽周杰倫的歌”，機器只會將周杰倫的歌顯示出來，并不能直接播放。就是說假如你要做一件事情，需要給機器一個明確的指令，否則，會讓人很煩躁，因為你要一直說下去。

　　當然，“對話”層面，仍然停留在“人機對話”階段，機器仍然停留在被動接受人類輸入大量數(shù)據(jù)階段，相比“問答”層面，只不過信息流、數(shù)據(jù)存儲量更大，機器仍然不能更深層次理解人的意思，無法實現(xiàn)自學習、自成長，與機器的語音交流還不能像人一樣自然。
人工智能語音3.0：自然交互
人工智能進入第三階段，最大的進展就是交互的進展。不僅僅有問有答，不僅僅包含上下文邏輯了，人工智能硬件能夠更多地融合各種環(huán)境信息，作出不同決策或推薦。也就說，在交互的過程中，機器有了更多的主動性，能夠為人提供更多、更好的幫助，讓人們的生活更便捷，更安全，更有趣。
有兩個比較典型的應(yīng)用場景，一個是智能汽車，一個是智能家居。
2010年，谷歌秘密研究的無人汽車項目被《紐約時報》記者曝光，當時引起了不小的震動。無人汽車即無人駕駛汽車，也叫智能汽車，主要是通過車載傳感系統(tǒng)感知道路環(huán)境，并依靠車內(nèi)的人工智能系統(tǒng)自動規(guī)劃行車路線，到達預(yù)定目的地。　

　　　谷歌無人駕駛汽車在開放道路上行駛時，會對來往車輛、行人，路面環(huán)境信息進行識別與分析，為系統(tǒng)的決策判斷提供依據(jù)。系統(tǒng)經(jīng)過長期的“學習”后，人工智能具備的策略神經(jīng)元將變得更加熟練高效，并形成類似于人的“感覺”，能及時處理駕駛過程中的突發(fā)情況。
2016年1月，美國國家公路安全交通管理局（NHTSA）在其網(wǎng)站上發(fā)布了公開信，表示根據(jù)聯(lián)邦政府現(xiàn)行法律規(guī)定，谷歌的無人駕駛汽車采用的人工智能系統(tǒng)可以被視為“司機”。這被視為是人工智能發(fā)展里程碑的事件，也標志著“智能”可以像“人工”一樣感知、判斷、推理并做出決策，可以實現(xiàn)主動控制，也能更好地人機交互與協(xié)同。
在智能家居領(lǐng)域，人工智能的發(fā)展方向同樣是人機交互、操作簡單、通過大數(shù)據(jù)能夠進行自主判斷決策。

【返回首頁】【復(fù)制鏈接】【收藏本頁】【關(guān)閉窗口】

　熱點推薦

　頭條文章

康佳電視榮獲“便捷看電視”首張國家認證！

中國家電制造業(yè)供應(yīng)鏈展覽會，高清家電網(wǎng)現(xiàn)場報道

康佳升級電視AI進化之路交互體驗全場景

變革發(fā)展！康佳公布2022年度業(yè)績預(yù)告

久久精品一区二区三区四区,亚洲精品久久夜色撩人男男小说,中文字幕无线观看不卡网站,日产无人区一线二线三线观,av制服丝袜白丝国产网站

一篇文章讓你搞懂人工智能語音進化史