久艹先锋影音在线,先锋天堂AV在线网,国产欧美一区二区三区户外,亚洲综合色婷婷六月在线图片

<strike id="i2w4y"></strike>
  • <strike id="i2w4y"><code id="i2w4y"></code></strike>
    
    
  • <strike id="i2w4y"><code id="i2w4y"></code></strike>
  • 會(huì)打電話的AI:即便為真,也不值得大驚小怪

    2018-06-11 17:38:43  來(lái)源:科技日?qǐng)?bào)  


    [摘要]“語(yǔ)言交互是智能音箱的核心功能。智能音箱的銷(xiāo)量劇增,大量的語(yǔ)音交互會(huì)帶來(lái)多樣化的數(shù)據(jù)樣本,目前研究界都在試圖突破自然語(yǔ)言處理的難關(guān),雖然從事這項(xiàng)研究的人比以前多很多,研究條件也很好,但理論的瓶頸、語(yǔ)言理解的語(yǔ)義鴻溝問(wèn)題,不是一時(shí)半會(huì)能解決的?!?..

      視覺(jué)中國(guó)

      “語(yǔ)言交互是智能音箱的核心功能。智能音箱的銷(xiāo)量劇增,大量的語(yǔ)音交互會(huì)帶來(lái)多樣化的數(shù)據(jù)樣本,目前研究界都在試圖突破自然語(yǔ)言處理的難關(guān),雖然從事這項(xiàng)研究的人比以前多很多,研究條件也很好,但理論的瓶頸、語(yǔ)言理解的語(yǔ)義鴻溝問(wèn)題,不是一時(shí)半會(huì)能解決的。”

      近日,谷歌在I/O開(kāi)發(fā)者大會(huì)上展示了備受爭(zhēng)議的Duplex AI,它通過(guò)電話完成了飯館、發(fā)廊的預(yù)約,并沒(méi)被對(duì)方“識(shí)破”。但過(guò)于干凈的對(duì)話環(huán)境,也引發(fā)了一些人對(duì)于視頻真假的爭(zhēng)論。

      語(yǔ)音合成技術(shù)已經(jīng)可以“以假亂真”?語(yǔ)音交互取得了突破性進(jìn)展?人和機(jī)器可以對(duì)答如流?這段展示之后,圍觀者的驚喜、質(zhì)疑、擔(dān)憂紛至沓來(lái)。

      技術(shù)加持 智能音箱爆發(fā)式增長(zhǎng)

      “相對(duì)于觸摸、按鈕等操縱,語(yǔ)音交互直接、方便、快捷。受惠于人工智能行業(yè)飛速發(fā)展,語(yǔ)音和語(yǔ)義的識(shí)別已經(jīng)愈發(fā)準(zhǔn)確。”智能設(shè)備廠商負(fù)責(zé)人趙明對(duì)科技日?qǐng)?bào)記者表示。技術(shù)進(jìn)步為智能音箱的產(chǎn)品化提供了支撐。

      智能音箱的基本功能是為與人類(lèi)語(yǔ)言互動(dòng)、播放媒體音頻和智能家居提供統(tǒng)一入口,其中語(yǔ)言交互是核心功能。對(duì)于用戶(hù)來(lái)說(shuō),智能音箱可以用來(lái)查詢(xún)天氣、聽(tīng)音樂(lè)、進(jìn)行一些簡(jiǎn)單問(wèn)答等。對(duì)于廠商來(lái)說(shuō),智能音箱意義更大:在語(yǔ)音時(shí)代,它是重要的流量入口,生產(chǎn)大量數(shù)據(jù),并把用戶(hù)牢牢穩(wěn)固在自己的生態(tài)鏈上。

      從2014年亞馬遜的智能音箱Echo面世,這種智能家居產(chǎn)品在過(guò)去幾年爆發(fā)式增長(zhǎng),巨頭紛紛入場(chǎng),智能音箱發(fā)展史上的重要產(chǎn)品不斷出現(xiàn):國(guó)外的谷歌Home、蘋(píng)果HomePod、微軟Invoke,國(guó)內(nèi)的京東叮咚、聯(lián)想音箱、喜馬拉雅小雅、阿里巴巴天貓精靈、小米小愛(ài)同學(xué)等。據(jù)趙明介紹,全球智能音箱市場(chǎng)規(guī)模在過(guò)去幾年迅速增長(zhǎng),從2015年的255萬(wàn)臺(tái)到2017年的3000萬(wàn)臺(tái)。去年中國(guó)智能音箱市場(chǎng)達(dá)到176萬(wàn)臺(tái)的銷(xiāo)量,銷(xiāo)售額4.9億元,市場(chǎng)潛力明顯。

      對(duì)標(biāo)Echo 產(chǎn)品功能初級(jí)單一

      據(jù)趙明介紹,作為智能音箱領(lǐng)域的頭部廠商,亞馬遜通過(guò)接入Alexa語(yǔ)音助手以連接其他硬件軟件服務(wù),在先發(fā)優(yōu)勢(shì)和技術(shù)壁壘下,已經(jīng)形成一定業(yè)務(wù)體系。亞馬遜具有深厚的電商基礎(chǔ),并在內(nèi)容、硬件、平臺(tái)、云計(jì)算、物流倉(cāng)儲(chǔ)等領(lǐng)域布局,通過(guò)智能音箱整合軟件、硬件、平臺(tái)及內(nèi)容資源,進(jìn)一步盤(pán)活電商資源。

      “亞馬遜Alexa平臺(tái)及云計(jì)算平臺(tái)為打通多個(gè)服務(wù)鏈條奠定了基礎(chǔ),在硬件操作、軟件應(yīng)用及內(nèi)容觀看收聽(tīng)中的海量數(shù)據(jù)被有效收集并整理,實(shí)現(xiàn)內(nèi)容與服務(wù)的個(gè)性化。”趙明表示,亞馬遜在中文語(yǔ)音識(shí)別方面缺少布局,目前沒(méi)有進(jìn)入中國(guó)市場(chǎng),但其發(fā)展為中國(guó)市場(chǎng)提供了借鑒,多數(shù)廠商以Echo為對(duì)標(biāo),布局智能音箱。

      但據(jù)趙明介紹,目前智能家居行業(yè)還處于整體發(fā)展的中前期,行業(yè)標(biāo)準(zhǔn)尚未形成,巨頭之間難以統(tǒng)一的平臺(tái)標(biāo)準(zhǔn)為智能家居的普及造成了巨大困難。“目前的AI水平較為有限,很多智能家居實(shí)現(xiàn)了基本的AI功能,但都比較初級(jí)單一,用戶(hù)使用體驗(yàn)并不理想。”

      此外,中科院自動(dòng)化所研究員王金橋表示,中文語(yǔ)音交互存在更多特殊障礙:中文的方言和口音種類(lèi)過(guò)多,交流非常困難,語(yǔ)義鴻溝難以跨越。“市面上的智能音箱都‘傻乎乎’的,只能用來(lái)搜索和問(wèn)答一些條條框框的問(wèn)題,無(wú)法理解邏輯、上下文關(guān)系等,大家買(mǎi)回家玩幾天,新鮮勁兒一過(guò)就閑置了。全國(guó)三百多家智能音箱廠商,沒(méi)有一家賺錢(qián)的。”王金橋說(shuō)。

      靈隆科技CEO魏強(qiáng)也曾對(duì)媒體表示,目前消費(fèi)者普遍反饋智能音箱存在遠(yuǎn)場(chǎng)識(shí)別差、誤喚醒率高、連續(xù)對(duì)話功能不穩(wěn)定和語(yǔ)義理解能力差、音質(zhì)不好等問(wèn)題,看似火爆的智能音箱行業(yè)正在面臨創(chuàng)新能力弱、產(chǎn)品體驗(yàn)差、內(nèi)容和技能不足、用戶(hù)認(rèn)知度低等諸多挑戰(zhàn)。

      水平有限 仍是簡(jiǎn)單場(chǎng)景的人機(jī)交互

      谷歌演示Duplex AI的過(guò)程引發(fā)了真實(shí)與否的爭(zhēng)議:人們注意到,這些通話中的兩位女性員工都沒(méi)有在電話上提到自己公司的名稱(chēng),另外這兩個(gè)錄音中也都沒(méi)有環(huán)境噪音。不過(guò)谷歌并沒(méi)有對(duì)是否編輯過(guò)電話錄音的問(wèn)題發(fā)表評(píng)論。

      對(duì)于Duplex AI的表現(xiàn),王金橋表示:“這只是展示了一個(gè)效果,不能說(shuō)機(jī)器通過(guò)了圖靈測(cè)試,也不代表理論上的突破。況且真實(shí)性沒(méi)有驗(yàn)證。如果是真實(shí)的,那確實(shí)是先進(jìn)的自然語(yǔ)言理解,這說(shuō)明大家都在往自然語(yǔ)言處理的方向努力。”

      思必馳副總裁、語(yǔ)音交互科學(xué)家初敏表達(dá)了類(lèi)似的觀點(diǎn)。“這個(gè)預(yù)約的過(guò)程難度不大,是一個(gè)簡(jiǎn)單場(chǎng)景的人機(jī)交互。只是角色置換了一下,不是我們常見(jiàn)的‘人問(wèn)機(jī)器’,而是‘機(jī)器問(wèn)人’,引發(fā)了大家的熱議。”初敏說(shuō)。

      初敏表示,谷歌展示的“機(jī)器預(yù)約餐廳、發(fā)廊”一定是可以實(shí)現(xiàn)的,沒(méi)有被對(duì)方聽(tīng)出來(lái)說(shuō)明語(yǔ)音合成的效果不錯(cuò),但整體來(lái)看,全程“沒(méi)有展現(xiàn)有挑戰(zhàn)性的問(wèn)題”——如多任務(wù)切換、跨場(chǎng)景、噪音、上下文邏輯理解等。她同樣表達(dá)了對(duì)視頻真實(shí)性的懷疑:“餐廳聽(tīng)起來(lái)應(yīng)該是亂七八糟的,但視頻中沒(méi)有背景噪音,所以不排除表演的可能。”

      要想質(zhì)變 需要自然語(yǔ)言處理技術(shù)突破

      自然語(yǔ)言處理是語(yǔ)音交互的核心技術(shù),也是三十年來(lái)幾乎沒(méi)有突破的痛點(diǎn)。通俗來(lái)說(shuō),這項(xiàng)技術(shù)就是“讓機(jī)器理解人”。據(jù)王金橋介紹,自然語(yǔ)言處理的核心是理解,希望機(jī)器能理解人的語(yǔ)言和目的。但每個(gè)人都是個(gè)性化的,說(shuō)話的輕重緩急、重音位置,看到夕陽(yáng)西下時(shí)或開(kāi)心或傷感的個(gè)人感受,這些都是目前的機(jī)器無(wú)法理解的。尤其是在中文語(yǔ)境下,常見(jiàn)的一語(yǔ)雙關(guān)、倒裝、句式簡(jiǎn)化等,人有時(shí)候都理解不了,對(duì)機(jī)器來(lái)說(shuō)更是難上加難。

      初敏表示,在語(yǔ)音交互背后,是語(yǔ)音識(shí)別、自然語(yǔ)言理解、對(duì)話管理、自然語(yǔ)言生成等諸多環(huán)節(jié),各環(huán)節(jié)充分配合才能實(shí)現(xiàn)良好的交互效果。“相比于谷歌展示的預(yù)約,我們已經(jīng)可以處理更復(fù)雜的交互,只是效果沒(méi)那么好。”初敏說(shuō)。

      “機(jī)器的認(rèn)知推理和理解是一個(gè)系統(tǒng)的處理工程,是各種復(fù)雜算法的結(jié)合,不是單項(xiàng)技術(shù)能解決的。”王金橋表示。目前比較可行的限定場(chǎng)景下的自然語(yǔ)言處理,比如兒童陪伴、學(xué)科細(xì)分的語(yǔ)料庫(kù),可以實(shí)現(xiàn)智能化交互。中國(guó)科學(xué)院院士譚鐵牛也在兩院院士大會(huì)期間談到人工智能正處在從“不能用”到“可以用”的技術(shù)拐點(diǎn),距離“很好用”還有諸多瓶頸。“像‘那輛白車(chē)是黑車(chē)’‘能穿多少是多少’一類(lèi)的表述,機(jī)器無(wú)法準(zhǔn)確理解和翻譯。”譚鐵牛說(shuō)。

      語(yǔ)言交互是智能音箱的核心功能。智能音箱的銷(xiāo)量劇增,大量的語(yǔ)音交互會(huì)帶來(lái)多樣化的數(shù)據(jù)樣本,“目前研究界都在試圖突破自然語(yǔ)言處理的難關(guān),雖然從事這項(xiàng)研究的人比以前多很多,研究條件也很好,但理論的瓶頸、語(yǔ)言理解的語(yǔ)義鴻溝問(wèn)題,不是一時(shí)半會(huì)能解決的。”王金橋說(shuō)。(實(shí)習(xí)記者 崔 爽)

    編輯: 張潔

    相關(guān)熱詞:
    分享到:

    以上文章僅代表作者個(gè)人觀點(diǎn),本網(wǎng)只是轉(zhuǎn)載,如涉及作品內(nèi)容、版權(quán)、稿酬問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們。電話:029-63903870

    本網(wǎng)所有文字、圖片和音視頻等,版權(quán)均屬各界新聞網(wǎng)所有,任未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接或其他方式復(fù)制發(fā)表,違者本網(wǎng)將依法追究責(zé)任。
    各界新聞網(wǎng) 版權(quán)所有 Copyright(C) 2006-2020 gjnews.cn All Rights Reserved     備案號(hào):陜ICP備13008241號(hào)-1