0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Alexa耳語模式——AI技術(shù)更顯人性化

人工智能 ? 2018-10-09 15:20 ? 次閱讀

上周,亞馬遜在美國西雅圖舉行的發(fā)布會上一口氣推出了十余款Alexa設備,大部分設備主要由Alexa語音平臺驅(qū)動。其中部分設備將增添“耳語模式”功能,使Alexa設備用耳語來回應用戶的低聲說話。日前,亞馬遜Alexa語音系統(tǒng)小組的一位專家Zeynab Raeesy在其博文中揭秘了這一功能的AI基礎(chǔ)。

Raeesy在博文中介紹:“如果你在一個有小孩睡覺的房間,當有人走進來時,你會馬上低聲說話,提醒進來的人你希望房間內(nèi)能保持安靜,而進來的人意識到這一點之后,很可能也會壓低聲音講話?!?/p>

Raeesy指出,Alexa的耳語模式令人難以理解的地方在于它是清音的,也就是說,它不涉及聲帶振動,往往比普通的語音在低頻段具有更少的能量。她與小組的同事研究了兩種能區(qū)分正常語音和耳語音的神經(jīng)網(wǎng)絡

兩種神經(jīng)網(wǎng)絡主要在結(jié)構(gòu)上有所區(qū)別,一個是MLP(多層感知器),另一個是能進行時間遞歸的LSTM(長短期記憶)網(wǎng)絡,這兩者用來做訓練的數(shù)據(jù)是一樣的,這些數(shù)據(jù)包括(1)對數(shù)濾波器組能量,或者是用來記錄不同頻率范圍信號能量的語音信號表示;(2)能區(qū)別耳語音與正常語音之間信號差異的一組特征。

在測試中,他們發(fā)現(xiàn)LSTM的表現(xiàn)結(jié)果比MLP更好,具備許多優(yōu)勢。Raeesy解釋道,Alexa語音識別引擎的其他組件完全依賴對數(shù)濾波器組能量,并給不同的組件提供相同的輸入數(shù)據(jù),進而使整個系統(tǒng)更加緊湊。

Alexa耳語模式的開發(fā)并非一帆風順,至少在最初階段是這樣的。由于Alexa是通過短時間的沉默(一種被稱為“結(jié)束指向”的技術(shù))來識別指令的結(jié)束或者進行回復,LSTM往往在話語即將結(jié)束時降低置信度。為解決這個問題,研究人員將LSTM的輸出校準成整個話語的平均值,最終,降低最后1.25秒的語音數(shù)據(jù)成為維持“耳語模式”性能的關(guān)鍵。

美式英語的耳語模式功能將在今年11月份推出,對耳語模式具體工作原理的介紹將以論文的形式在12月份的IEEE語音技術(shù)研討會上發(fā)表。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29383

    瀏覽量

    267674
收藏 人收藏

    評論

    相關(guān)推薦

    AI在可穿戴領(lǐng)域狂飆,混合式AI模式加速落地

    并不陌生,它帶來了更加個性的推薦和更加人性化的交互方式。 ? 在可穿戴設備上,蘋果、三星、360、索尼、XREAL等做智能手表、XR設備的硬件廠商都將生成式AI用到了自己的產(chǎn)品上。在產(chǎn)業(yè)鏈上游,涉及處理器、傳感器的芯片廠商在生
    的頭像 發(fā)表于 08-02 01:09 ?6457次閱讀
     <b class='flag-5'>AI</b>在可穿戴領(lǐng)域狂飆,混合式<b class='flag-5'>AI</b><b class='flag-5'>模式</b>加速落地

    智能照明管理系統(tǒng),打造人性化照明方案

    基本概念 智能照明管理系統(tǒng)是利用物聯(lián)網(wǎng)、有線/無線通訊、大數(shù)據(jù)以及云計算等技術(shù)組成的智慧樓宇照明管控系統(tǒng),將傳統(tǒng)人工按時開關(guān)的模式,升級為能夠遠程控制、故障示警、自動調(diào)節(jié)及節(jié)能管理的燈控方案,為
    的頭像 發(fā)表于 10-22 10:55 ?73次閱讀
    智能照明管理系統(tǒng),打造<b class='flag-5'>人性化</b>照明方案

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    領(lǐng)域的研究人員的工作模式相融合,也是一個亟待解決的問題。然而,這些挑戰(zhàn)也孕育著新的機遇。隨著技術(shù)的不斷進步和應用場景的拓展,AI在生命科學領(lǐng)域的應用將更加廣泛和深入,為科學家們提供更多的研究工具和方法
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    人工智能在科學研究中的核心技術(shù),包括機器學習、深度學習、神經(jīng)網(wǎng)絡等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的
    發(fā)表于 10-14 09:16

    NV080D-S8 高品質(zhì)otp語音芯片:讓漱口水售貨機更智能和人性化

    體驗與人性化服務。這款芯片憑借其卓越的音質(zhì)輸出與靈活的編程能力,讓每一次與售貨機的交互都變得生動有趣。當顧客走近漱口水售貨機時,該芯片能夠即時感知并觸發(fā)預設的歡迎
    的頭像 發(fā)表于 10-12 08:02 ?126次閱讀
    NV080D-S8 高品質(zhì)otp語音芯片:讓漱口水售貨機更智能和<b class='flag-5'>人性化</b>

    智慧醫(yī)療:讓醫(yī)療更智慧、更高效、更人性化

    一、智慧醫(yī)療簡介 智慧醫(yī)療是指運用人工智能、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)等技術(shù),將醫(yī)療機構(gòu)內(nèi)外的醫(yī)療資源和信息進行整合和共享,實現(xiàn)醫(yī)療服務的智能管理和優(yōu)化。通過智能的設備、系統(tǒng)和算法,智慧醫(yī)療能夠?qū)崿F(xiàn)
    的頭像 發(fā)表于 06-25 11:20 ?1378次閱讀

    業(yè)界標桿,用戶首選:三星AI電視引領(lǐng)視聽體驗與智慧生活新紀元

    能夠提供極致的視聽體驗,更通過智能算法深度理解用戶需求,并與家居設備無縫連接,實現(xiàn)個性內(nèi)容推薦和人性化智慧交互。三星AI電視讓用戶在享受視聽盛宴的同時,也能感受到科技帶來的便利與舒適,為大眾的娛樂生活帶來更多可能。
    的頭像 發(fā)表于 06-17 11:03 ?271次閱讀

    請問ESP-VA-SDK中怎么獲取alexa技能響應返回的內(nèi)容?

    目前在基于 ESP32-Vaquita-DSPG 開發(fā)板調(diào)研 alexa 控制相關(guān)的開發(fā)流程,目前需求是希望可以在 開發(fā)板 上獲取通過 alexa 語音控制,返回的響應內(nèi)容。 目前翻閱了大量資料文章,好像沒有找到相關(guān)的內(nèi)容,是否有人有相關(guān)開發(fā)經(jīng)驗,能指點一下。
    發(fā)表于 06-13 07:13

    達實智能物聯(lián)網(wǎng)整體解決方案打造人性化通行空間!

    但是這些問題,在達實大廈都得到了解決!達實基于自主研發(fā)的AIoT智能物聯(lián)網(wǎng)管控平臺,運用自主研發(fā)的物聯(lián)網(wǎng)系列終端產(chǎn)品,聚合模塊的空間場景應用,實現(xiàn)了自建總部的暢通無阻與人性化通行。
    的頭像 發(fā)表于 05-30 10:10 ?746次閱讀

    Medium禁止發(fā)布AI生成的付費文章,加強機器人生態(tài)管理

    Medium 作為一個致力于推動人性化講故事體驗的平臺,并非 AI 寫作競技場。盡管 AI 能輔助提高部分人群寫作水平或助力創(chuàng)作者用陌生語言創(chuàng)作,但完全依賴 AI 的內(nèi)容并不受歡迎。
    的頭像 發(fā)表于 04-22 14:13 ?271次閱讀

    智慧燈桿-智慧交通發(fā)展新方向

    智慧燈桿系統(tǒng)通過集成智能控制、智能顯示、數(shù)據(jù)采集等技術(shù),實現(xiàn)智能、高效人性化管理,為城市交通管理帶來了革命性的變化。
    的頭像 發(fā)表于 03-28 16:44 ?341次閱讀

    NanoEdge AI技術(shù)原理、應用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在將人工智能算法應用于物聯(lián)網(wǎng)(IoT)設備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    美格智能在MWC 2024展示5G-A和端側(cè)AI解決方案

    2024年世界移動通信大會(MWC)在西班牙巴塞羅那圓滿落幕。本屆大會以“未來先行”為主題,聚焦“超越5G”、“智聯(lián)萬物”和“AI人性化”等核心議題,吸引了全球2400多家業(yè)界領(lǐng)先企業(yè)參展。
    的頭像 發(fā)表于 03-03 15:37 ?772次閱讀

    高通亮相MWC 2024:AI+連接助力創(chuàng)新與協(xié)作,讓智能計算無處不在

    2月26日,全球最具影響力的移動通信盛會2024世界移動通信大會(MWC)在巴塞羅那拉開帷幕,以“未來先行”為主題,圍繞“超越5G”、“智聯(lián)萬物”、“AI人性化”等話題展開。
    的頭像 發(fā)表于 02-28 15:57 ?485次閱讀

    The Green Light | 取智于人,用智予人:以人性化的解決方案貫穿集裝箱物流

    原文標題:The Green Light | 取智于人,用智予人:以人性化的解決方案貫穿集裝箱物流 文章出處:【微信公眾號:westwell西井科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
    的頭像 發(fā)表于 12-12 19:45 ?635次閱讀
    The Green Light | 取智于人,用智予人:以<b class='flag-5'>人性化</b>的解決方案貫穿集裝箱物流