0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

高始興表示給有技術積累的創(chuàng)業(yè)公司帶來非常大的機會

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-06 10:16 ? 次閱讀

極客公園在上海科技館舉辦“2016奇點創(chuàng)新者峰會”,下午舉辦的內(nèi)部高峰論壇中,思必馳CEO高始興也給大家?guī)砹朔浅>实姆窒怼?/p>

高始興表示從工業(yè)革命、信息革命,現(xiàn)在人工智能的革命,進入人工智能時代確實對眾多的創(chuàng)業(yè)公司,特別是技術驅(qū)動的,有技術積累的創(chuàng)業(yè)公司帶來非常大的機會。

以下為演講實錄:

思必馳創(chuàng)立8年左右,在8年時間,基本上或多或少已經(jīng)成功見證人工智能,特別是語音行業(yè)越來越往后加速發(fā)展的階段,我們最早是做教育方面的語音技術,后來專注智能硬件垂直行業(yè)做語音技術和產(chǎn)品服務。

早期語音更多是在傳統(tǒng)的非常窄的市場去應用,包括呼叫中心。后來Siri發(fā)布,引爆整個語音在互聯(lián)網(wǎng)的市場,吸引了很多眼球,吸引了很多資本,吸引巨頭發(fā)展,推動整個市場,推動技術的進步。再到智能硬件物聯(lián)網(wǎng)行業(yè),語音成為剛性痛點的需求,在各個行業(yè),各個垂直產(chǎn)品進行落地,整個行業(yè)確實爆發(fā)力很強。技術早期還是單點的技術,后來技術的提升,包括語音識別、合成、智能識別等等,包括現(xiàn)在從感知走向認知,對話技術。

以前這個題目有可能有點大,現(xiàn)在人工智能加速滲透到商業(yè)、生活的方方面面,語音在各個終端連接了各種各樣的服務。早期的時候,還是一個簡單的模擬,簡單的算法,雖然期望特別大,但是落地特別少。真正再一次掀起一個小浪潮是80年代,在歐洲、日本商業(yè)的企業(yè),包括聲音網(wǎng)絡,遺傳算法。但是真正大的技術變革,真正在行業(yè)上掀起爆發(fā)式應用,還是在近10多年互聯(lián)網(wǎng)時代,摩爾定律處理能力,大數(shù)據(jù)、云計算,讓能力循環(huán)成為可能?,F(xiàn)在確實在各個產(chǎn)業(yè)上,我們看到更多的應用場景。

語音技術是人工智能的關鍵

AI從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)到物聯(lián)網(wǎng),現(xiàn)在到智聯(lián)網(wǎng),現(xiàn)在它的滲透率,推動率越來越大。早期在互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng),更多還是產(chǎn)品驅(qū)動,是一個商業(yè)模式驅(qū)動?,F(xiàn)在在智能硬件物聯(lián)網(wǎng),泛人工智能行業(yè),我們看到AI,人工智能驅(qū)動,讓各種新型商業(yè)、新型商業(yè)產(chǎn)品成為一種可能。包括現(xiàn)在人工智能創(chuàng)業(yè)公司價值體現(xiàn)也越來越多。

從工業(yè)革命、信息革命,現(xiàn)在人工智能的革命,進入人工智能時代確實對眾多的創(chuàng)業(yè)公司,特別是技術驅(qū)動的,有技術積累的創(chuàng)業(yè)公司帶來非常大的機會。我們現(xiàn)在看移動互聯(lián)網(wǎng),不說互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)更多還是搶奪存量市場,一片紅海甚至血海,現(xiàn)在這個市場行業(yè)不是A的就是T的,或者是B的,當然B最近口碑不是太好,但是他們確實在人工智能布局還挺早,挺大?,F(xiàn)在在整個巨頭占據(jù)足夠的市場,影響力的時候,我相信在若干個場景能成就很多獨角獸,包括技術公司,包括結(jié)合行業(yè)的一些公司。


如果簡單分的話,人工智能行業(yè),語音智能應用在應用層、技術層和技術設施層,應用層,像一些產(chǎn)品類的公司,像暴風和小米,小米用我們思必馳語音技術,包括像人臉商湯,包括現(xiàn)在思必馳語音公司。在技術設施層,包括慶科等一些優(yōu)秀公司,當然還有巨頭公司,在這里面,技術還是核心的驅(qū)動力,這里面有一個趨勢,我們看到一個是技術層和技術設施層,產(chǎn)品落地,產(chǎn)品服務的整合,我們確實做得還不錯,整個大語音在諸多行業(yè),傳統(tǒng)行業(yè)科大訊飛也在做設施層。再一個,應用層和底層設施技術層融合和整合,像樂視自己在做語音,現(xiàn)在估計有五六十人,服務于它的大生態(tài)。還有一個技術層、應用層向后端技術設施層去整合,去聯(lián)合。比如說一起去做相關的芯片摸索,像京東、小米他們都在做。

現(xiàn)在各個模態(tài)人工技術發(fā)展特別快,剛才講的人工識別,體感識別,包括像我們語音識別等等這些,VR、AR進展特別快。我覺得應該在很多場景下,我們在手機端,我們基本上特別是服務場景是打通的,我們通過觸摸交互訂票、訂餐、購物等等這些行為,如果說我們在智能硬件物聯(lián)網(wǎng)幾個場景里面,比如說在開車的時候,我們在家里面對音響和機器人的時候,我們?nèi)ビ啅埰?,語音可能是唯一的入口。第一的,它是很自然,很便捷,還有一個它是唯一能傳遞復雜信息的。未來,多模態(tài)整個人機交互兩個趨勢非常關鍵。一個是多模態(tài)融合和整合,融合是一個必然?,F(xiàn)在人機交互還是被動式,未來在場景數(shù)據(jù)積累,用戶行為數(shù)據(jù)等等這些,形成能力循環(huán),未來人機交互會變成更多是主動式。未來的機器,從一個簡單的秘書,真正成為一個助理。

如果從語音上,實現(xiàn)人對機器的控制,我們喊一嗓子,把空調(diào)調(diào)高一點,控制電視,調(diào)整音量,簡單的查詢,搜一些歌,未來場景力量,一個生態(tài)一定讓用戶能夠enjoy更多的服務,一定需要對話交互,像手機端觸摸交互一樣,能獲取更多的服務。再一個隨著情感識別,情緒識別,包括各種的人臉識別等等一些人工智能交互模態(tài)的進步整合,未來情緒識別富裕這個機器形態(tài),現(xiàn)在機器人很嚇人,未來情感世界會大大解決這個問題。再往后思想交互,我們機器能夠自學習,自適應,未來我們進行人機交互的時候,如果你不看到它,不知道對面是一個機器。像去年6、7月份,劍橋和蘇黎士理工做實驗,母機器人孵化子機器人,而且自己檢測這個完備性。

現(xiàn)在在智能硬件物聯(lián)網(wǎng)上,未來我們讓智能設備向我們手機一樣,我們隨地隨時可以去獲取很多的服務,訂餐、訂票,玩游戲等等這些,一定是對話交互, 對話交互分成三類,一類是問答式,有明確的確定和否。第二類是閑聊式,像現(xiàn)在Siri,基本屬于閑聊式,一般沒有明確的確定和否,沒有聊天的本體,再就是任務式對話,任務式像現(xiàn)在估計在座大家都知道,做得非常棒的亞馬遜echo,echo基于場景用戶去完成一個任務,假設在人機交互里面,說一句我餓了怎么辦?如果是問答式,他會回答你你要一天三餐,保證健康。聊天式有可能有很多答案,比如說它會回答,主人你餓了嗎?你隨便吃一點,陪我聊天呀。如果任務式,結(jié)合你的歷史信息,甚至結(jié)合你的位置,結(jié)合你其他歷史行為,給你推薦周邊的餐廳,有可能你愿意吃辣的,周邊推薦湘菜館,火鍋店推薦幾家,進而形成對話交互,規(guī)劃交互一定是近幾年的發(fā)展趨勢。

我們思必馳基于自然語言理解和處理,再一個是我們整合了我們對話邏輯,一軟一硬兩個產(chǎn)品,我們提供給三個垂直行業(yè),車載、家居、機器人,讓每個設備成為智能助理,幫助用戶完成任務。

語音是產(chǎn)品創(chuàng)新的關鍵技術

語音交互一切,語音改變更多,它除了連接一切,交互一切,未來會在產(chǎn)品創(chuàng)新,行業(yè)的一些變化,甚至變革上起到很大的推動作用。

幾個觀點,這個就是當前的一些語音在智能電視上的應用。這個是當時給小米電視,小米電視整個語音交互是用思必馳,這里面用的語音喚醒,我們找的是林志玲模擬她的聲音。目前還比較簡單,喚醒跟簡單的查詢。下一步,一定會走向從感知走向認知,不僅僅讓人機的交互能夠?qū)崿F(xiàn)控制和簡單查詢,一定在各個場景里面,整合更多的服務。

再一個,現(xiàn)在移動互聯(lián)網(wǎng)很多的行業(yè)生態(tài),商業(yè)模式,在智能硬件物聯(lián)網(wǎng)領域不一定完全能遷移,會發(fā)生一定的變化,甚至是顛覆。比如說搜索,現(xiàn)在PC互聯(lián)網(wǎng),移動互聯(lián)網(wǎng),我們端是手機,在智能硬件物聯(lián)網(wǎng)是各個端,不單是端,交互界面都發(fā)生變化。再一個用戶行為,在PC互聯(lián)網(wǎng),移動互聯(lián)網(wǎng),人機搜索更多是信息的查詢,在智能硬件互聯(lián)網(wǎng)上,更多還是服務的獲取。再一個,就是傳統(tǒng)的一些商業(yè)模式,像CBC,在新的智能硬件物聯(lián)網(wǎng)上,新的語音搜索有可能也是CBC,再就是智能語音發(fā)展促進產(chǎn)品創(chuàng)新,甚至產(chǎn)品形態(tài)的變化,包括其他人工智能的發(fā)展。現(xiàn)在說智能終端,智能硬件,硬件的智能化,我覺得大概兩類,一類是真正通過人工智能,語音智能提升它的效率,提升它的體驗,向一些消費電子,比如說我舉的例子,空調(diào),我們跟一些大的消費電子合作,像海爾、美的等等合作,不改變它的產(chǎn)品的屬性,但是提升它的體驗,我在房間任何一個角度,我在晚上起來以后,或者遙控器找起來不方便,喊一嗓子“我冷了,調(diào)一下溫”。這個不改變產(chǎn)品整體功能和形態(tài)。再就是通過人工智能,語音智能,改變了它的產(chǎn)品的核心功能,甚至拓展了服務,成為一個中心態(tài)勢,比如說echo,未來像echo設備越來越多。未來像翻譯耳機,好像日本公司做的,未來耳機不是打電話,我們出國,甚至假設有方言的話,特別是南方隔一個縣,甚至隔一個村就是一個方言,我們戴著耳機就可以自由對話。包括未來的會議,我們現(xiàn)在會議電話還是開會,未來的會議電話加上身份識別,語音識別,它其實就是一個秘書。因為電話只要加了一個通信模塊,任何東西都可能成為電話。所以未來有很多產(chǎn)品創(chuàng)新和融合,包括未來我們有可能燈泡,我們插排、插座,有可能我們就是的speaker。

再一個,現(xiàn)在我們看到的智能硬件交互,還是很難完成閉環(huán),未來在智能音響、電視,機器人等上面,加上身份識別或者其他的生物識別,身份能夠通過身份密碼完成支付,形成一個交易的閉環(huán),這樣整個大的生態(tài)才能起來。包括一些行業(yè)的融合和創(chuàng)新。比如說未來我們在家里,我們通過電視,通過音響,我們在車里,通過車載智能終端學習英語,在家里可以做一些遠程醫(yī)療等等,包括還有一些創(chuàng)新點子,包括前段時間有人提出來,監(jiān)測兒童呼聲,做一些相應的看護,剛才阿里朋友講,鑒黃,通過圖像識別去鑒黃。在今年年初的時候,有人提出來用聲音去鑒黃,就是她的叫聲,當然沒有做,我覺得都是創(chuàng)新點。包括未來傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu),未來更多的在智能硬件物聯(lián)網(wǎng)上,大量、大規(guī)模的數(shù)據(jù),語音數(shù)據(jù),視頻數(shù)據(jù)等等,人臉數(shù)據(jù),新型的數(shù)據(jù)結(jié)構(gòu),包括一些新型用戶畫像,包括借助我們設備識別,老人可能Push腦黃金廣告,年輕人可能Push一些年輕的產(chǎn)品,可能小孩子Push一些玩具的廣告。

還有整個市場出現(xiàn)幾百上千的語音助手,包括有一些獲得投資的,基本上也都銷聲匿跡了,在幾年前整個語音在通用環(huán)境下能做好,這么幾年從感知智能走向認知智能,通過對話交流可以打通一個一個信息通道,未來手機可以看成一個端,類似于像智能音響一樣,智能電視一樣,因此我個人覺得,未來智能手機上,成為新型語音助手。

思必馳還是專注于在智能硬件,物聯(lián)網(wǎng),車載、家居、機器人,我們提供人機對話交互的方案、產(chǎn)品和服務。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能語音
    +關注

    關注

    10

    文章

    772

    瀏覽量

    48664
  • 信息革命
    +關注

    關注

    0

    文章

    3

    瀏覽量

    5807
  • 工業(yè)革命

    關注

    0

    文章

    107

    瀏覽量

    15786
收藏 人收藏

    評論

    相關推薦

    OPA1622在播放中將EN接到GND會產(chǎn)生嚴重的噗聲,非常大,為什么?

    OPA1622在播放中將EN接到GND會產(chǎn)生嚴重的噗聲,非常大
    發(fā)表于 10-25 07:24

    使用adau1961 codec進行錄音,發(fā)現(xiàn)錄制的音頻文件噪聲非常大,請問什么辦法可以優(yōu)化嗎?

    (1)我這邊使用adau1961 codec進行錄音,發(fā)現(xiàn)錄制的音頻文件噪聲非常大,請問什么辦法可以優(yōu)化么,我這邊已經(jīng)排除MIC導入噪聲的可能,實際使用AMIC。 (2)我這邊使用tas2505作為pa接speaker播放一個wav文件,發(fā)現(xiàn)同樣噪聲
    發(fā)表于 10-12 07:35

    LM6172無論什么電路,噪聲都非常大,為什么?

    最近使用這款芯片的時候,無論什么電路,噪聲都非常大,甚至在電路中沒有任何效果。我采用5V單電源供電,同相端給2.5V參考電壓,后來看datasheet發(fā)現(xiàn)最低5.5V供電,請問這個有影響嗎?應該不至于這么大影響吧
    發(fā)表于 08-26 06:07

    TPA3116在播放音樂時,聲音非常大時會啪啪響,請問辦法解決嗎?

    TPA3116在播放音樂時,聲音非常大時(已出現(xiàn)截止失真)會啪啪響,請問辦法解決么? 用TCD-781曲目測試發(fā)現(xiàn),當播放曲目3,4,5時(17hz/0db正弦波),推挽輸出幅度只要超過最大
    發(fā)表于 08-13 08:32

    使用opa2836搭了一個簡單的電壓跟隨,衰減非常大的原因?

    使用opa2836搭了一個簡單的電壓跟隨,我輸入的1V的正弦波,從1hz到5Khz,按照數(shù)據(jù)手冊來說不會有衰減,但是實際用鎖相放大器測試下來,發(fā)現(xiàn)衰減非常大 請教大家
    發(fā)表于 08-05 06:01

    LOG2112A雙通道測試時,電壓差異非常大是怎么回事?

    LOG2112A雙通道測試時,電壓差異非常大,A通道輸出1.2V,B通道就只有50mV,單獨焊接第一通道:輸出電壓為-3.358V 單獨焊接第二通道:輸出電壓為-3.063V。有沒有什么解決方法,有沒有其它芯片能滿足設計。
    發(fā)表于 08-01 07:00

    研華科技宣布與技術公司達成戰(zhàn)略合作,共創(chuàng)邊緣智能新未來

    今日,在世界嵌入式展覽會上,研華科技宣布與技術公司達成戰(zhàn)略合作,攜手為邊緣計算領域帶來變革,共創(chuàng)邊緣人工智能生態(tài)系多元且開放的新格局。
    的頭像 發(fā)表于 04-11 09:24 ?540次閱讀

    星宸科技登陸深交所創(chuàng)業(yè)

    全球視頻監(jiān)控芯片領域的佼佼者——星宸科技股份有限公司,成功在深交所創(chuàng)業(yè)板掛牌上市!星宸科技在SoC設計的全流程中積累了豐富的經(jīng)驗,始終堅持自主研發(fā)核心IP,在圖像信號處理(ISP)、音視頻編解碼
    的頭像 發(fā)表于 03-28 16:15 ?603次閱讀

    思索技術終止創(chuàng)業(yè)板IPO

    近日,深交所披露了一則關于東莞市思索技術股份有限公司(簡稱:思索技術)終止首次公開發(fā)行股票并在創(chuàng)業(yè)板上市審核的決定。這一決定引發(fā)了市場對思索技術未來發(fā)展方向的廣泛關注和討論。
    的頭像 發(fā)表于 03-07 14:25 ?585次閱讀

    科通技術擬在深交所創(chuàng)業(yè)板上市

    知名芯片應用設計和分銷服務商深圳市科通技術股份有限公司(以下簡稱“科通技術”)計劃在深交所創(chuàng)業(yè)板上市,并計劃募資20.49億元。
    的頭像 發(fā)表于 02-01 15:18 ?720次閱讀

    采集到的ADIS16477-2的imu數(shù)據(jù),測試陀螺、加速度計的漂移非常大怎么解決?

    我現(xiàn)在采集到的ADIS16477-2的imu數(shù)據(jù),測試陀螺、加速度計的漂移非常大,IMU是放在臺面上鏡子不動的。 下圖第一排陀螺x、y、z的原始數(shù)據(jù),第二排分別是5s鐘平滑后的數(shù)據(jù)。 下圖第一排
    發(fā)表于 12-28 07:25

    DSP28335通過SPI與AD7689通訊,讀出的數(shù)據(jù)變化非常大,也沒有規(guī)律是怎么回事?

    大家好,我現(xiàn)在用TI的DSP28335通過SPI與AD7689通訊,讀出的數(shù)據(jù)變化非常大,也沒有規(guī)律(比如0,540,2048,3680,4,1024等等),AD7689配置寄存器是0xF104。請問哪位能指導一下,或者有沒有程序參考一下,謝謝!
    發(fā)表于 12-08 07:58

    在使用AD9251-40做FPGA控制采集時發(fā)現(xiàn)由ADC采集上來的信號非常大的串擾是為什么?

    在使用AD9251-40 做FPGA 控制采集時候發(fā)現(xiàn)由ADC采集上來的信號非常大的串擾,懷疑是ADC差分時鐘的問題。所用FPGA 型號是EP4CE40F23I7, 采用方式是直接用FPGA IO 口產(chǎn)生LVDS差分時鐘輸出給ADC,請問一下各位高手這里是否會出問題
    發(fā)表于 12-05 07:33

    EVAL-AD5940BIOZ開發(fā)板測量10K電阻的阻抗值波動非常大的原因?

    硬件設備用的官方開發(fā)板套裝,程序燒寫的是EDA的程序,然后用SensorPal軟件觀察數(shù)據(jù)發(fā)現(xiàn)測量10K電阻的阻抗值波動非常大,不知道是什么原因,大家有遇到這種情況嗎
    發(fā)表于 12-01 07:09

    #共建FPGA開發(fā)者技術社區(qū),為FPGA生態(tài)點贊#+2023.11.7+IC工程師說職場:從入職面試到升職加薪......

    IC 行業(yè)的崗位以下幾類: ? 市場銷售:負責推廣和賣東西的,跟客戶打交道最多。低門檻淘汰率,做得好的年入百萬不是夢,做得差的靠底薪混生活。 ? 技術支持:
    發(fā)表于 11-07 10:06