0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從藍海殺成紅海的語音科技,如何才能轉化成智能家庭的入口

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-10-12 14:30 ? 次閱讀

從藍海殺成紅海的語音科技,如何才能轉化成智能家庭的入口

各種調查數(shù)據(jù)顯示,智能家居市場規(guī)模在未來幾年,將會突破萬億,巨大蛋糕吸引了眾多玩家參與,也涌現(xiàn)出眾多創(chuàng)新企業(yè),然而,要實現(xiàn)智慧的生活,這其中涉及到跨平臺、跨品牌等互聯(lián)互通是基礎,處在產(chǎn)業(yè)鏈核心斷的公司積極搭建生態(tài)建設,在這個智能家居市場整頓中,誰能聚攏更多第三方資源,誰就占住主導權,一個簡單的語音人機交互對話場景中,機器穩(wěn)中帶皮的表現(xiàn)算是我們對于智能音箱最基本層面、最直觀的認識了。而事實上,這并非智能音箱的最終形態(tài)。

智能音箱大混戰(zhàn)從前年開始,已經(jīng)在作為中國硅谷科技的前沿的巨頭間打得焦頭爛額。然而一直被全球認為是消費潛力巨大的中國市場,卻在智能音箱領域陷入尷尬的境地。目前為止,國內還未出現(xiàn)單品銷量突破1000萬臺的智能音箱產(chǎn)品。

互聯(lián)網(wǎng)巨頭眼中,智能音箱被定義為是繼PC電腦圖形化系統(tǒng)+鍵鼠外設交互方式、智能手機+觸屏操作交互方式之后的新形態(tài)交互方式,是后互聯(lián)網(wǎng)時代的下一個超級入口??凑麄€互聯(lián)網(wǎng)技術,就是數(shù)字技術顛覆性的變革和機會。我們最近在大力的推語音(智能音箱),其實都是一樣的,智能音箱的工作原理:人發(fā)出指令——音箱對聲音處理識別——傳輸服務器作出回應——傳回智能音箱或者其他服務器——得出結果(其他設備開始運行)。

毫無疑問語音是未來一個互聯(lián)網(wǎng)入口。有效的搶占了下一個互聯(lián)網(wǎng)的超級入口就意味著在互聯(lián)網(wǎng)的下一個時代里會擁有更多的主動權和話語權,因此被譽為下一個互聯(lián)網(wǎng)超級入口的智能音箱產(chǎn)業(yè)早已形成巨頭環(huán)伺的競爭形態(tài)。

目前,各品牌的智能音箱除了充當語音交互方式的鬧鐘設定、天氣提醒查詢、翻譯、算數(shù)等基本生活小助手之外,同時還兼顧路況、百科查詢,點外賣、叫專車等貼身小管家一職。技能的拓展性、應用場景的適應性在不斷增強。

僅僅在深圳南山區(qū)一公里以內,就有112家公司做語音智能?!庇腥绱酥嗟墓驹谧鲋悄芤粝洌嬲蔀榱水a(chǎn)品用戶的公司卻少之又少,對于智能硬件來說,沒有銷量,都是空談。有人曾用這么一句話形容目前國內的智能音箱市場:行業(yè)爆款轉身變成了雞肋。

在智能音箱領域,用戶體驗是經(jīng)常被強調的點,語音交互與服務內容則是競爭核心。而智能音箱行業(yè)發(fā)展的最大瓶頸則是AI技術的不成熟。目前AI技術雖愈加火爆,但仍處于弱人工智能階段,其語音識別、語音合成、自然降噪等技術僅僅處于“可用”階段,遠未能滿足人類的深度體驗。

在智能音箱使用之前,需要加入局域網(wǎng),而這一步需要在相應的手機app中操作才能實現(xiàn)。雖然這只是初始的一步,卻反映出手機在智能家居體系中的重要地位。與小巧便攜的手機相比,智能音箱顯得臃腫了很多,尤其是對于許多經(jīng)常出差的商務人士而言,智能音箱的使用率更是大打折扣。

在智能音箱背后,真正起作用的是語音助手,語音助手的背后則是基于大數(shù)據(jù)的人工智能。而人類是情感動物,智能音箱發(fā)展到今天之所以還沒有成為人們生活中的常態(tài),是由于AI技術還停留在機械化階段,無法消解人類的孤獨感。

盡管現(xiàn)在的AI音箱能夠完成人類的一些指令,但想要進一步發(fā)展,需要完成從機械式執(zhí)行到情感式對話的轉變。要實現(xiàn)這一點,就需要AI技術更加成熟,需要AI朝著人性化的方向發(fā)展。

術硬傷難以突破:語義識別以及中文語言識別

智能音箱相關分析表示:在對話方式上,一些中國制造商生產(chǎn)的設備語音識別準確率低,中文自然語言的整體理解和反應依舊不夠成熟,這是阻礙普及的一個關鍵原因。

語義識別是目前智能音箱的一個痛點,但也是AI技術的一大問題。AI可以下圍棋戰(zhàn)勝李世石,但它現(xiàn)在不一定能聽明白每個人在講什么。"

因為智能音箱的語音技術可以分為三個階段:噪聲抵消、語音識別,和語義識別。相對于國外,我國在于AI智能語音助理上的發(fā)展水平暫處于相對落后的狀態(tài)。而對于智能家居這種產(chǎn)品來說,其技術核心是依賴語音聲控,背后是人工智能的智能識別能力與深度學習能力。

雖然現(xiàn)在國內在相關技術上已經(jīng)有一定的突破,比如科大訊飛,思必馳等公司都是具備語音識別能力的廠商。但當前,國內的智能音箱廠商還沒有人工智能方面的平臺優(yōu)勢,可以像亞馬遜、谷歌那樣跨越多個垂直領域進行資源整合的能力。

另外,除了在技術實力的原因以外,其語義識別的主要問題在于中國復雜的語言環(huán)境。

目前市面上的AI音箱只支持中文普通話交互,與中國的人文環(huán)境有所差異,實際情況卻不如想象中那般簡單:中國地域廣袤,方言語系多樣,據(jù)不完全統(tǒng)計,僅彼此不能相互溝通的方言就有80多種。

雖然普通話已經(jīng)普及了幾十年,但截至今日,仍有不少人不會說普通話;而夾雜方言的“偽普通話”更是多如牛毛。在語境方面,也不利于機器的語音學習和大數(shù)據(jù)手機。相比國外的智能產(chǎn)品,我國在本土智能音箱的發(fā)展過程中,僅在語言關方面,就需要多耗費數(shù)倍的研發(fā)精力。

因此,由于智能音箱在漢語的語音識別和語義交互等對話式交互技術還尚未成熟,都嚴重影響著用戶體驗。在目前的過渡階段,提高音箱耳機產(chǎn)品本身的性能才是企業(yè)的重中之重。而只有當語言交互界面技術成型,并發(fā)展為標準服務時,智能音箱在有可能在中國市場真正普及起來實際上,國內對于人工智能的技術還沒有使用習慣,智能音箱算是整個AI領域發(fā)展較為快速的。其實,我們也能從中看出一大問題,就是智能音箱的核心價值沒有標準化,沒有抓取到用戶的核心需求,很多人都是在為智能而不是音質等需求買單,總的來說,不論關鍵在不在于技術,而是如何讓技術符合你的生活需求,AI需要實實在在的應用。

盡管今年互聯(lián)網(wǎng)巨頭在智能音箱上價格戰(zhàn)劇烈,但智能音箱發(fā)展仍呈現(xiàn)差異化的幾個方向,這主要源于智能音箱品牌全品類布局與差異化布局。在十幾家智能音箱品牌的二三十款音箱中呈現(xiàn)出4個特點:入門mini產(chǎn)品、大眾產(chǎn)品、高端產(chǎn)品、兒童產(chǎn)品。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1196

    瀏覽量

    55245
  • 智能語音
    +關注

    關注

    10

    文章

    772

    瀏覽量

    48657

原文標題:從藍海創(chuàng)新到紅海突圍:智能語音核實能飛入尋常百姓家

文章出處:【微信號:mojay_semi,微信公眾號:茂捷半導體】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AIC23B語音芯片的linein輸入口和micin輸入口能否同時使用?

    有一個問題想求助一下論壇的大佬們,AIC23B這個語音芯片的linein輸入口和micin輸入口能否同時使用,從而達到接收兩路不同的聲信號,將兩路不同的信號輸入開發(fā)板進行后面的算法運算呢?如果可以的話,需要什么條件呢?
    發(fā)表于 10-14 06:07

    輸入文字轉化語音

    一、介紹 基于鴻蒙Next模擬一個輸入用戶文字,轉化成語音播報效果二、場景需求 輔助功能:為視障人士提供幫助:將文字內容轉化語音,使視覺障礙用戶能夠獲取信息。 教育與學習:語言學習:幫助學習者通過
    發(fā)表于 08-28 10:54

    如何將小電流信號轉化成高壓信號?

    因為是高速信號。脈寬在30ns。 電流小到26uA,想轉化成電壓信號再進行放大。有什么好的方法嗎
    發(fā)表于 08-21 08:30

    OPA615把輸出的信號接一個小電阻轉化成電壓信號直接送入STM32的ADC采集口是否可以?

    如果想把輸出的信號接一個小電阻轉化成電壓信號直接送入STM32的ADC采集口是否可以?還是輸出級要加入緩沖級?
    發(fā)表于 08-13 06:37

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術,載語音識別系統(tǒng)通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語言數(shù)字,從而達到實現(xiàn)車輛控制、
    的頭像 發(fā)表于 06-19 15:52 ?292次閱讀
    車載<b class='flag-5'>語音</b>識別系統(tǒng)<b class='flag-5'>語音</b>數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術,載語音識別系統(tǒng)通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語言數(shù)字,從而達到實現(xiàn)車輛控制、
    的頭像 發(fā)表于 06-19 15:49 ?404次閱讀

    用yolov5的best.pt導出onnx轉化成fp32 bmodel后在Airbox上跑,報維度不匹配怎么處理?

    用官方的模型不出錯,用自己的yolov5訓練出來的best.pt導出onnx轉化成fp32 bmodel后在Airbox上跑,出現(xiàn)報錯: linaro@bm1684:~/yolov5/python
    發(fā)表于 05-31 08:10

    FPGA設計中 Verilog HDL實現(xiàn)基本的圖像濾波處理仿真

    今天給大俠帶來FPGA設計中用Verilog HDL實現(xiàn)基本的圖像濾波處理仿真,話不多說,上貨。 1、用matlab代碼,準備好把圖片轉化成Vivado Simulator識別的格式,即每行一
    發(fā)表于 05-20 16:44

    華騰喜獲“格客車2023年度合格供應商”獎!

    3月22日,2024蘇州金龍供應商大會在蘇州隆重召開,華騰受邀參加。會上,華騰榮獲“格客車2023年度合格供應商”。
    的頭像 發(fā)表于 04-02 10:26 ?386次閱讀
    <b class='flag-5'>藍</b><b class='flag-5'>海</b>華騰喜獲“<b class='flag-5'>海</b>格客車2023年度合格供應商”獎!

    語音數(shù)據(jù)集在智能語音助手中的應用與挑戰(zhàn)

    。本文將詳細介紹語音數(shù)據(jù)集在智能語音助手中的應用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。 二、語音數(shù)據(jù)集在智能
    的頭像 發(fā)表于 01-18 15:46 ?331次閱讀

    ADUCM350可以同時處理生物阻抗信號、聲音轉化成的電流信號嗎?

    請問,ADUCM350可以同時處理生物阻抗信號、聲音轉化成的電流信號嗎? ADUCM350可以處理慣性傳感器收集的運動信號嗎? 同時收集和處理生物阻抗、聲音、運動信號,除了評估套裝(EVAL-ADUCM350EBZ)以外,還需要購買其他配套的評估板嗎?
    發(fā)表于 01-11 07:10

    怎么用verdi將fsdb格式的波形轉化成txt呢?

    和大家分享一個小技巧,你在debug問題的時候,是不是也曾經(jīng)想過將波形中的某些信號轉化成txt,然后用txt的值復現(xiàn)某些波形或者與理論值對比。
    的頭像 發(fā)表于 01-10 09:19 ?2281次閱讀
    怎么用verdi將fsdb格式的波形<b class='flag-5'>轉化成</b>txt呢?

    oracle將clob轉化成string

    將CLOB(Character Large Object)轉換為字符串是一種常見的需求,特別是在處理大文本數(shù)據(jù)時。Oracle數(shù)據(jù)庫提供了幾種方法和函數(shù)來實現(xiàn)這個轉換過程。本文將詳細介紹這些方法和函數(shù),并提供示例代碼和使用提示。 一、使用DBMS_LOB包 DBMS_LOB是Oracle提供的一個內置包,提供了許多操作LOB類型(包括CLOB)的函數(shù)。 使用DBMS_LOB.GETLENGTH函數(shù)獲取CLOB的長度: DECLARE v_clob CLOB; v_length NUMBER; BEGIN v_clob := 'This is a sample CLOB.'; v_length := DBMS_LOB.GETLENGTH(v_clob); DBMS_OUTPUT.PUT_LINE(
    的頭像 發(fā)表于 11-21 11:24 ?1.4w次閱讀

    pid值如何轉化成pwm占空比 pid輸出是怎么計算出來的

    PID控制輸出通常是連續(xù)的,而PWM占空比是離散的。因此,在每個PID更新周期內,需要將連續(xù)的PID輸出轉化為離散的PWM占空比,可以通過取整操作(如四舍五入)或舍入操作來實現(xiàn)。   此外
    的頭像 發(fā)表于 11-10 17:11 ?9205次閱讀

    51單片機如何將程序轉化成硬件變化??

    51單片機如何將程序轉化成硬件變化
    發(fā)表于 11-01 08:19