智能語(yǔ)音作為人機(jī)交互的新型方式,有望大規(guī)模推廣,中國(guó)市場(chǎng)是更適合語(yǔ)音交互的市場(chǎng)。
2017年中國(guó)人工智能市場(chǎng)規(guī)模達(dá)約220億元,智能語(yǔ)音占中國(guó)人工智能市場(chǎng)份額的22%,價(jià)值約48億元,僅次于計(jì)算機(jī)視覺(jué)。
IDC在2018年10月的報(bào)告中預(yù)測(cè),中國(guó)對(duì)話式人工智能市場(chǎng)規(guī)模將在2022年達(dá)到約78億人民幣,2018-2022年年復(fù)合增速將為57%。
中國(guó)企業(yè)在智能語(yǔ)音領(lǐng)域已經(jīng)非常領(lǐng)先,有望超越西方國(guó)家。主要原因是:1)各個(gè)應(yīng)用場(chǎng)景的市場(chǎng)體量要遠(yuǎn)超西方,比如在教育領(lǐng)域,每個(gè)老師需要面對(duì)的學(xué)生數(shù)量,以及銀行客服領(lǐng)域,每一個(gè)客戶需要處理的請(qǐng)求數(shù)量都是遠(yuǎn)超西方市場(chǎng)。2)相比于西方語(yǔ)言,中文更難書(shū)寫,但是句法和語(yǔ)法更易理解。因此對(duì)于中文,語(yǔ)音是相比于書(shū)寫和輸入來(lái)說(shuō),更自然的交互方式。
早在1952年,貝爾實(shí)驗(yàn)室就創(chuàng)造了一臺(tái)名為Audrey的機(jī)器,能夠以90%的準(zhǔn)確度理解數(shù)字0-9。耐人尋味的是,這個(gè)準(zhǔn)確度僅在機(jī)器發(fā)明者發(fā)言時(shí)可以達(dá)到。
僅僅是在近幾年,語(yǔ)音識(shí)別技術(shù)才為公眾所知。技術(shù)巨頭紛紛舉辦聲勢(shì)浩大的發(fā)布活動(dòng),Siri、Cortana、Alexa的出現(xiàn)讓社會(huì)的關(guān)注度和預(yù)期提升,但也因?yàn)槠涔δ苡邢薅鵁o(wú)法達(dá)到用戶的預(yù)期。
隨著深度學(xué)習(xí),機(jī)器學(xué)習(xí)芯片和算法取得突破,ASR、NLP和TTS在過(guò)去5年中迅速進(jìn)步。語(yǔ)音識(shí)別的單詞錯(cuò)誤率大幅降低,這主要是由于使用了更高效的聲學(xué)模型,運(yùn)用深度神經(jīng)網(wǎng)絡(luò)(DNN)取代高斯混合模型(GMM,之前多年以來(lái)的首選方法)等統(tǒng)計(jì)技術(shù)。
Nuance的研究主管NilsLenke展示數(shù)據(jù)顯示,在將深度神經(jīng)網(wǎng)絡(luò)算法成功納入語(yǔ)音識(shí)別系統(tǒng)后,單詞錯(cuò)誤率從2010年左右開(kāi)始急劇下降,每年降低約18%。
語(yǔ)音識(shí)別和自然語(yǔ)言處理這兩個(gè)相鄰領(lǐng)域很難相互跨越。不同的公司可能專注于其中一個(gè)領(lǐng)域。比如,科大訊飛更專注于語(yǔ)音領(lǐng)域,而小i機(jī)器人更專注于自然語(yǔ)言理解。語(yǔ)音識(shí)別的公司在自然語(yǔ)言領(lǐng)域看起來(lái)并不成功,而專注自然語(yǔ)言的公司在語(yǔ)音識(shí)別領(lǐng)域也難有斬獲。
相比西方國(guó)家,語(yǔ)音識(shí)別技術(shù)和自然語(yǔ)言處理技術(shù)在中國(guó)發(fā)展迅速主要是自身的獨(dú)特因素導(dǎo)致,分別是用戶規(guī)模和中文特點(diǎn)。
▌中國(guó)智能語(yǔ)音市場(chǎng)規(guī)模不斷擴(kuò)大
市場(chǎng)規(guī)模:根據(jù)中國(guó)信息通信研究院的數(shù)據(jù),2017年人工智能市場(chǎng)規(guī)模達(dá)約220億元,預(yù)計(jì)到2020年將達(dá)到710億元,年均復(fù)合增速為48%。2017年,智能語(yǔ)音占中國(guó)人工智能市場(chǎng)份額的22%,約合48億元。
主要參與廠商:在國(guó)內(nèi)智能語(yǔ)音市場(chǎng),科大訊飛以44%的市占率高居榜首。
2015年,國(guó)內(nèi)智能語(yǔ)音市場(chǎng)排名前五的廠商是科大訊飛、百度、蘋果,Nuance和小i機(jī)器人,合計(jì)占據(jù)85%的市場(chǎng)份額??拼笥嶏w在國(guó)內(nèi)市場(chǎng)的市場(chǎng)份額達(dá)到44%。
在全球市場(chǎng),2015年的全球智能語(yǔ)音行業(yè)市值達(dá)到61億美元,Nuance、谷歌、蘋果、微軟和科大訊飛前五大廠商市場(chǎng)份額合計(jì)占比80%。
隨著語(yǔ)義理解技術(shù)運(yùn)用頻率增加,對(duì)話式人工智能技術(shù)應(yīng)用領(lǐng)域和場(chǎng)景將望快速擴(kuò)展。
IDC在2018年10月的報(bào)告中預(yù)測(cè),中國(guó)對(duì)話式人工智能市場(chǎng)規(guī)模將在2022年將達(dá)到78億人民幣,2018-2022年年復(fù)合增速為57%。
從IDC的能力象限來(lái)看,科大訊飛、百度、阿里巴巴、小i機(jī)器人和思必馳為領(lǐng)先企業(yè)。我們認(rèn)為,在收入方面,科大訊飛和小i機(jī)器人應(yīng)最為領(lǐng)先。
雖然IDC將科大訊飛和小i機(jī)器人都列為對(duì)話式人工智能平臺(tái)廠商,但兩者之間存在重大差異:科大訊飛主要是一家語(yǔ)音識(shí)別和語(yǔ)音自動(dòng)化公司,而小i機(jī)器人主要是一家自然語(yǔ)言處理公司。
▌國(guó)內(nèi)語(yǔ)音AI市場(chǎng)參與者不斷加入
國(guó)內(nèi)語(yǔ)音AI市場(chǎng)上參與者不斷涌入,中國(guó)市場(chǎng)主要參與者可分為以下四類:
第一類是在深度學(xué)習(xí)算法大規(guī)模應(yīng)用之前,就已經(jīng)從事這個(gè)領(lǐng)域的專業(yè)語(yǔ)音公司,比如科大訊飛或者小i機(jī)器人,專注于需要豐富行業(yè)知識(shí)的垂直領(lǐng)域。
第二類是AI初創(chuàng)公司,如思必馳、云知聲、出門問(wèn)問(wèn)。這些公司主要關(guān)注多用途的云平臺(tái)和一些特定的垂直領(lǐng)域,如智能汽車或智能家居。
第三類是百度、阿里、騰訊等互聯(lián)網(wǎng)公司,主要推出移動(dòng)端消費(fèi)者語(yǔ)音產(chǎn)品。BAT的多用途云平臺(tái)源自他們自己的核心產(chǎn)品,如騰訊的微信。
第四類是亞馬遜、蘋果、Nuance等海外互聯(lián)網(wǎng)公司。我們認(rèn)為這些公司有三個(gè)重要看點(diǎn):
技術(shù)的準(zhǔn)確性和可靠性。
科大訊飛或小i機(jī)器人等垂直領(lǐng)域提供商的準(zhǔn)確性和可靠性遠(yuǎn)遠(yuǎn)高于BAT的通用消費(fèi)者平臺(tái)。這是因?yàn)锽AT平臺(tái)大多是免費(fèi)的,而科大訊飛或小i機(jī)器人主要面向企業(yè)客戶提供服務(wù),相比普通網(wǎng)民,企業(yè)客戶對(duì)價(jià)格敏感程度低,但對(duì)功能的準(zhǔn)確性和可靠性要求高。
是否擁有針對(duì)場(chǎng)景開(kāi)發(fā)的方案和產(chǎn)品。
科大訊飛或小i機(jī)器人擁有專門針對(duì)特定行業(yè)和場(chǎng)景進(jìn)行技術(shù)和內(nèi)容研發(fā)的團(tuán)隊(duì);我們認(rèn)為BAT在這方面不會(huì)直接投入,一方面因?yàn)锽端市場(chǎng)尚未成為他們最核心的盈利來(lái)源,另一方面因?yàn)閱蝹€(gè)細(xì)分領(lǐng)域或者場(chǎng)景的盈利規(guī)模太小,不足以吸引他們投入。
針對(duì)的是企業(yè)級(jí)還是消費(fèi)技術(shù)市場(chǎng)?
我們認(rèn)為消費(fèi)者市場(chǎng)的直接變現(xiàn)機(jī)會(huì)很少,因?yàn)?)消費(fèi)者注重的是便利性(比如詢問(wèn)Alexa收音機(jī):“今天天氣怎么樣?”),而企業(yè)則注重節(jié)約成本、減少員工人數(shù)等因素,2)在消費(fèi)市場(chǎng)中,一些硬件+語(yǔ)音提供商以成本價(jià)或接近成本價(jià)的價(jià)格銷售設(shè)備/服務(wù)(亞馬遜和小米就是最好的例子),然后在其他業(yè)務(wù)中盈利。
▌一級(jí)市場(chǎng)公司:各有所長(zhǎng),各有所專
小i機(jī)器人:AI領(lǐng)域早期領(lǐng)導(dǎo)者,掌握NLP領(lǐng)域核心競(jìng)爭(zhēng)力聊天機(jī)器人早期參與者
對(duì)于外國(guó)讀者來(lái)說(shuō),小i讀作Xiao-I或“smalli”,也就是小i機(jī)器人的意思。公司于2001年在上海成立,是中國(guó)首批研發(fā)自然語(yǔ)言處理(NLP)和對(duì)話式人工智能應(yīng)用程序的公司之一。
聯(lián)合創(chuàng)始人兼董事長(zhǎng)袁輝先生曾在惠普和微軟工作。聯(lián)合創(chuàng)始人兼首席執(zhí)行官朱頻頻是中國(guó)科學(xué)院博士,昵稱PP。朱博士持有多項(xiàng)專利,包括聊天機(jī)器人系統(tǒng)和SMS機(jī)器人系統(tǒng)。他在微信上開(kāi)發(fā)了中國(guó)第一款智能機(jī)器人。
2017年,GartnerSymposium將小i機(jī)器人、Siri、微軟的Cortana、亞馬遜的Echo一起被推薦為“會(huì)話+”領(lǐng)導(dǎo)者?!皶?huì)話+”是指將會(huì)話功能集成到所有類型的服務(wù)和應(yīng)用中,這意味著聊天機(jī)器人將取代搜索成為互聯(lián)網(wǎng)的唯一入口。
此外,小i機(jī)器人還被Gartner列為2017年虛擬客戶助理(VCA)代表供應(yīng)商,與IBM和Nuance在同一陣營(yíng)推動(dòng)全球AI發(fā)展。由Gartner定義的VCA是一個(gè)通過(guò)模擬會(huì)話來(lái)傳遞信息和代替客戶采取行動(dòng)的應(yīng)用程序。
從語(yǔ)音交互到認(rèn)知產(chǎn)品的巨大轉(zhuǎn)變
與其他人工智能公司相比,小i機(jī)器人的獨(dú)特優(yōu)勢(shì)在于其豐富的數(shù)據(jù)量以及在NLP領(lǐng)域的核心競(jìng)爭(zhēng)力。依托行業(yè)特定的知識(shí)庫(kù),小i得以為企業(yè)客戶推出新的解決方案,提高他們的工作效率,從而將技術(shù)轉(zhuǎn)化為實(shí)際應(yīng)用。Gartner定義了兩種語(yǔ)音交互系統(tǒng):
1.基本上只進(jìn)行簡(jiǎn)單的問(wèn)答聊天的虛擬個(gè)人系統(tǒng),例如Siri、Alexa、Cortana。在我們看來(lái),這種模式很難找到一個(gè)變現(xiàn)的商業(yè)模式,因?yàn)?1)消費(fèi)者注重的是便利性(Alexa,今天天氣怎么樣?),而企業(yè)注重節(jié)約成本、減少員工人數(shù)等因素,2)在消費(fèi)市場(chǎng)中,一些硬件+語(yǔ)音提供商以成本價(jià)或接近成本價(jià)的價(jià)格銷售設(shè)備/服務(wù)(亞馬遜和小米就是最好的例子),然后在其他業(yè)務(wù)中盈利。
2.虛擬客戶系統(tǒng)或虛擬客戶助理(VCA)。
思必馳:專注人性化的智能語(yǔ)音交互技術(shù)
思必馳2007年創(chuàng)立,是一家專注于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解和智能對(duì)話的語(yǔ)音技術(shù)提供商。
公司核心產(chǎn)品包括語(yǔ)音識(shí)別算法和麥克風(fēng)陣列算法、對(duì)話用戶界面(DUI)和會(huì)話精靈。該公司目前與超過(guò)8,000家客戶合作,為汽車、智能揚(yáng)聲器和機(jī)器人提供終端應(yīng)用。
公司擁有500多名員工,其中70%是研發(fā)人員,有70多人持有博士學(xué)位。公司總部位于蘇州,在蘇州和北京設(shè)有獨(dú)立的研發(fā)中心。另外與上海交通大學(xué)在上海共同組建了聯(lián)合研究實(shí)驗(yàn)室。
創(chuàng)始人高始興先生畢業(yè)于劍橋大學(xué),持有計(jì)算機(jī)科學(xué)與管理雙碩士學(xué)位。他于2007年與劍橋大學(xué)校友俞凱一起創(chuàng)立了思必馳。思必馳的首席科學(xué)家俞凱是劍橋大學(xué)工程博士,上海交通大學(xué)計(jì)算機(jī)科學(xué)系智能語(yǔ)音實(shí)驗(yàn)室主任。
在上海交大擔(dān)任研究教授之前,他是劍橋大學(xué)的高級(jí)研究員,還曾聯(lián)合創(chuàng)始VocalIQ,該公司后被蘋果收購(gòu)。思必馳已經(jīng)獲得了D輪投資,募資金額7600萬(wàn)美金。
出門問(wèn)問(wèn):軟硬結(jié)合的智能語(yǔ)音廠商
出門問(wèn)問(wèn)由前谷歌科學(xué)家李志飛先生于2012年創(chuàng)立,專注于語(yǔ)音識(shí)別、自然語(yǔ)言處理、搜索和推薦以及數(shù)字信號(hào)處理。出門問(wèn)問(wèn)不僅提供軟件應(yīng)用程序,還提供硬件產(chǎn)品。
該公司擁有700名員工,其中60%專注于研發(fā)。出門問(wèn)問(wèn)已完成了6輪融資,募集資金超過(guò)2.55億美元。在公司官網(wǎng)中顯示,谷歌在2015年的C輪中投資,而大眾汽車在2017年的D輪中投資。
公司的創(chuàng)始人李志飛是約翰霍普金斯大學(xué)的博士,對(duì)自然語(yǔ)言處理、機(jī)器翻譯和機(jī)器學(xué)習(xí)有著濃厚的興趣。
在2012年創(chuàng)立出門問(wèn)問(wèn)之前,李博士曾在谷歌擔(dān)任研究科學(xué)家,并且是谷歌移動(dòng)離線翻譯系統(tǒng)的主要開(kāi)發(fā)人員。
CTO雷欣先生是華盛頓大學(xué)電子工程專業(yè)博士,研究重點(diǎn)是普通話語(yǔ)音識(shí)別的聲學(xué)建模。
在加入出門問(wèn)問(wèn)之前,李博士曾是谷歌語(yǔ)音搜索團(tuán)隊(duì)短期聘請(qǐng)的研究科學(xué)家。
工程副總裁黃美玉女士于1993年獲得卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)專業(yè)博士學(xué)位,專攻語(yǔ)音識(shí)別。她是微軟Bing翻譯和中文版小娜背后的主要科學(xué)家。她現(xiàn)在是華盛頓羽扇智AI實(shí)驗(yàn)室主任,還在華盛頓大學(xué)電氣工程系擔(dān)任副教授。
出門問(wèn)問(wèn)開(kāi)發(fā)了可穿戴設(shè)備、汽車、家庭產(chǎn)品類別的消費(fèi)產(chǎn)品,這些產(chǎn)品嵌入了該公司的語(yǔ)音識(shí)別、自然語(yǔ)言處理和垂直搜索技術(shù)。
以上一級(jí)市場(chǎng)的公司,多專注于幾個(gè)細(xì)分場(chǎng)景,有自己的技術(shù)獨(dú)特優(yōu)勢(shì)。
其中,我們最看好小i機(jī)器人。一方面公司將企業(yè)級(jí)市場(chǎng)作為目標(biāo),在付費(fèi)能力強(qiáng)的金融機(jī)構(gòu)客戶中,小i機(jī)器人的智能客服系統(tǒng)找到了突破點(diǎn),已經(jīng)有較大優(yōu)勢(shì)。另一方面,在技術(shù)上,小i機(jī)器人專注于自然語(yǔ)言處理,更多在認(rèn)知端進(jìn)行投入。
▌二級(jí)市場(chǎng)公司:中國(guó)智能語(yǔ)音領(lǐng)導(dǎo)者科大訊飛
科大訊飛注重技術(shù)創(chuàng)新,智能語(yǔ)音技術(shù)在國(guó)際上處于領(lǐng)先水平。公司在核心技術(shù)領(lǐng)域保持高強(qiáng)度的研發(fā)投入,2/3的員工為技術(shù)人員,研發(fā)支出占收入的20%。公司主要研究語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音評(píng)估和翻譯。
公司連續(xù)13年在卡內(nèi)基梅隆大學(xué)組織的BlizzardChallenge語(yǔ)音合成比賽中奪冠。在《麻省理工科技評(píng)論》(MITTechnologyReview)“2017年度全球最聰明公司”榜單上排名第六,一同上榜的科技巨擘谷歌位列第五。
科大訊飛主要收入來(lái)自軟件開(kāi)發(fā)與服務(wù),語(yǔ)音智能化應(yīng)用為公司帶來(lái)穩(wěn)定收入增長(zhǎng)。
公司主要提供特定的應(yīng)用軟件開(kāi)發(fā)和服務(wù),主要客戶來(lái)自政府部門和教育行業(yè):其中教育、司法和智慧城市等業(yè)務(wù)占收入的66%,其它大型開(kāi)放式技能和工具平臺(tái)占收入的26%。
公司在中國(guó)院校部分實(shí)現(xiàn)語(yǔ)言考試智能化,在人民法院部分實(shí)現(xiàn)取證和聽(tīng)證的智能化,不再需要書(shū)記員現(xiàn)場(chǎng)速記,另外,該公司還基于長(zhǎng)期積累的數(shù)據(jù)和領(lǐng)域知識(shí),為學(xué)生提供定制課程,為法官提供先例和判詞的交叉參考。在教育、政法等領(lǐng)域都有望實(shí)現(xiàn)較快收入增長(zhǎng)。
人工智能專業(yè)公司和互聯(lián)網(wǎng)公司各有所長(zhǎng),不會(huì)發(fā)生激烈競(jìng)爭(zhēng)。BAT、科大訊飛、華宇軟件、小i機(jī)器人在人工智能的特定垂直領(lǐng)域各有所長(zhǎng)。預(yù)計(jì)人工智能專業(yè)公司和互聯(lián)網(wǎng)公司之間不會(huì)發(fā)生激烈競(jìng)爭(zhēng)。
2017年11月,中國(guó)政府宣布與四家公司合作構(gòu)建國(guó)家AI開(kāi)放平臺(tái)的計(jì)劃:百度將致力于開(kāi)發(fā)自動(dòng)駕駛;阿里巴巴的云計(jì)算部門將研究智慧城市中的“城市大腦”;騰訊將為醫(yī)療設(shè)備開(kāi)發(fā)計(jì)算機(jī)視覺(jué);科大訊飛將專注于其主要的專業(yè)領(lǐng)域—語(yǔ)音智能。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1196瀏覽量
55244 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
771瀏覽量
48657
原文標(biāo)題:中國(guó)智能語(yǔ)音行業(yè)研究
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論