0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟黃學(xué)東:企業(yè)應(yīng)用最后一個(gè)痛點(diǎn)是會(huì)議中的語(yǔ)音

DPVg_AI_era ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-05-23 16:07 ? 次閱讀

昨天下午,微軟全球技術(shù)院士黃學(xué)東博士、微軟大中華區(qū)副總裁兼市場(chǎng)營(yíng)銷(xiāo)及運(yùn)營(yíng)總經(jīng)理康容、ROOBO CTO雷宇接受了包括新智元在內(nèi)的媒體專(zhuān)訪,詳細(xì)解答了微軟的語(yǔ)音技術(shù)、產(chǎn)品落地以及生態(tài)合作。

在昨天的微軟人工智能大會(huì)上,微軟全球技術(shù)院士黃學(xué)東展示了微軟多項(xiàng)語(yǔ)音、翻譯等技術(shù),微軟Build大會(huì)上的“黑科技”全球首創(chuàng)AI會(huì)議系統(tǒng)再次被演示。

昨天下午,黃學(xué)東博士、微軟大中華區(qū)副總裁兼市場(chǎng)營(yíng)銷(xiāo)及運(yùn)營(yíng)總經(jīng)理康容、ROOBO CTO雷宇接受了包括新智元在內(nèi)的媒體專(zhuān)訪,詳細(xì)解答了微軟的語(yǔ)音技術(shù)、產(chǎn)品落地以及生態(tài)合作。

新智元根據(jù)現(xiàn)場(chǎng)速記進(jìn)行整理,部分內(nèi)容有刪節(jié)。

黃學(xué)東:評(píng)價(jià)谷歌沒(méi)有什么意思,微軟的“全武功”最有意思

問(wèn):您一直關(guān)注語(yǔ)音技術(shù),現(xiàn)在很多搜索引擎還是通過(guò)輸入文字來(lái)進(jìn)行交互,什么時(shí)候我們能夠看到像語(yǔ)音識(shí)別或圖像技術(shù)真正改變到搜索引擎現(xiàn)在的狀況?

黃學(xué)東:搜索引擎現(xiàn)在很復(fù)雜,我做語(yǔ)音之前做過(guò)搜索引擎,后臺(tái)要完全了解所有的文件內(nèi)容和關(guān)鍵是字是什么東西,還要匹配用戶意圖,找到相應(yīng)的文本,它也有很多人工智能深度學(xué)習(xí)的技術(shù)。

語(yǔ)音識(shí)別在現(xiàn)在的媒體階段,是文本輸入還是語(yǔ)音輸入還是圖像輸入?基本上還是一個(gè)相對(duì)比較松的耦合。語(yǔ)音進(jìn)步的主要標(biāo)桿是把波形轉(zhuǎn)換成文字,這個(gè)過(guò)程中中文字也可以有不同的選擇,因?yàn)檎Z(yǔ)音識(shí)別不是完全的準(zhǔn)確,就像搜索引擎一樣,有第一個(gè)好結(jié)果,有第二好結(jié)果、第三結(jié)果,把整個(gè)結(jié)果給搜索引擎,搜索引擎在搜索的時(shí)候可以搜索不僅僅是第一好的結(jié)果,而且把語(yǔ)音識(shí)別第二好的結(jié)果也考慮進(jìn)去?,F(xiàn)在工業(yè)界的狀態(tài)基本上是這樣。

問(wèn):麥克風(fēng)陣列部分經(jīng)常在語(yǔ)音識(shí)別場(chǎng)景下遇到噪音問(wèn)題,微軟可以解決這個(gè)問(wèn)題嗎?還是說(shuō)未來(lái)我們可以有更好的方法?

黃學(xué)東:我們有麥克風(fēng)陣列的核心技術(shù),并且已經(jīng)有長(zhǎng)足的進(jìn)步,在業(yè)界是領(lǐng)先的。再加上360度的攝像頭,這兩者的結(jié)合讓會(huì)議“AI神器”達(dá)到了很高的高度。不管是講了什么話,各方面的指標(biāo)都上了一個(gè)臺(tái)階。今后,我們的前景非常非常樂(lè)觀。

問(wèn):之前谷歌Duplex打電話號(hào)稱(chēng)已經(jīng)通過(guò)了圖靈測(cè)試,你對(duì)這個(gè)怎么評(píng)價(jià)?

黃學(xué)東:不敢評(píng)價(jià)。媒體上很多評(píng)價(jià)說(shuō)他們?cè)谧骷?,很多人質(zhì)疑谷歌,讓谷歌發(fā)言人出來(lái)認(rèn)證,他們不出來(lái)認(rèn)證,也不說(shuō)話。

微軟會(huì)議“AI神器”在多人自由交談的情況下能知道誰(shuí)在說(shuō)話,而且知道說(shuō)了什么話,做了現(xiàn)場(chǎng)演示。不僅做了中文,還做了英文,這是我們要表達(dá)的微軟在語(yǔ)音識(shí)別業(yè)界的領(lǐng)導(dǎo)地位,是全武功,那個(gè)武是武力的“武”,不是一二三四五的五。

所以說(shuō)批評(píng)谷歌沒(méi)有什么意思,我們的“全武功”最有意思。

不僅能支持全雙工,而且能支持“全武功”

問(wèn):上午微軟展示了人工智能的系統(tǒng),有哪些東西是微軟從底層基礎(chǔ)研發(fā)到開(kāi)放再到產(chǎn)品的生產(chǎn)制造?有哪些是把底層的技術(shù)開(kāi)放給伙伴,他們基于平臺(tái)和技術(shù)做產(chǎn)品的研發(fā)和人工智能應(yīng)用產(chǎn)品?

黃學(xué)東:首先,這些是研究的演示,微軟從來(lái)不預(yù)先宣布我們產(chǎn)品什么時(shí)候出來(lái)、以什么方式出來(lái)。我們產(chǎn)品有幾個(gè)東西可以講,第一是我們的認(rèn)知服務(wù),語(yǔ)音這一部分云的API、模型、服務(wù),有一套新的規(guī)律,這是在微軟Build大會(huì)上已經(jīng)宣布了的。

第二是定制服務(wù)增加了語(yǔ)音合成,想要換成自己想要聽(tīng)的聲音,可以上傳三個(gè)小時(shí)、十個(gè)小時(shí),越多質(zhì)量越好,可以定制到你想要的聲音。所以我們?nèi)€語(yǔ)音和翻譯都實(shí)現(xiàn)了量身定制。

現(xiàn)在如果你是開(kāi)發(fā)商要開(kāi)發(fā)自己的音箱,可以用微軟剛剛推出來(lái)的MSDDK,這是我們和ROOBO合作推出來(lái)的一個(gè)最新解決方案,不僅僅有微軟和ROOBO合作推出來(lái)的硬件,而且有最新的麥克風(fēng)陣列,包括四麥線性的和七麥原型的麥克風(fēng)陣列。這個(gè)黑科技是絕對(duì)引導(dǎo)業(yè)界潮流的,我們不僅能支持全雙工,而且能支持“全武功”。

康容:我補(bǔ)充一下,因?yàn)槲④浭且粋€(gè)平臺(tái)和工具的企業(yè),我們是提供平臺(tái)和工具,我們的黑科技、研發(fā)團(tuán)隊(duì)、我們的大咖博士發(fā)明的東西,他們漸漸的會(huì)落地到我們自己的產(chǎn)品中,也會(huì)提供給我們的生態(tài)合作伙伴讓他們來(lái)開(kāi)發(fā)。

微軟大中華區(qū)副總裁兼市場(chǎng)營(yíng)銷(xiāo)及運(yùn)營(yíng)總經(jīng)理康容

今天早上看到哪一個(gè)黑科技會(huì)在什么時(shí)候落地,很難講出來(lái),但是遲早會(huì)發(fā)生。我們會(huì)盡快的落地,我們會(huì)看市場(chǎng)的需求。所以,我們聽(tīng)到越多的客戶和合作伙伴的聲音,我們就會(huì)加速某某功能盡量落地。我們一系列的很多新東西都會(huì)提供給生態(tài)一起來(lái)合作。

問(wèn):ROOBO本身是針對(duì)不同的應(yīng)用場(chǎng)景解決人工智能軟硬結(jié)合方案的設(shè)計(jì),然后去生產(chǎn)銷(xiāo)售,過(guò)去這幾年做這種場(chǎng)景化的人工智能設(shè)計(jì),然后再去推廣。人工智能產(chǎn)品怎么更成功的被市場(chǎng)接受,讓消費(fèi)者更容易去掏錢(qián)買(mǎi)?如何落地和激活?為什么這次和微軟合作語(yǔ)音的開(kāi)發(fā)及機(jī)會(huì)在哪里?微軟的技術(shù)怎么獨(dú)特的激活這個(gè)市場(chǎng)?

雷宇:其實(shí)這兩個(gè)問(wèn)題是一個(gè)問(wèn)題。我們知道AI落地沒(méi)有一個(gè)通用AI可以應(yīng)用到每個(gè)垂直領(lǐng)域,這里面最核心的問(wèn)題是如何產(chǎn)品化。

康容與雷宇(右)

在我們創(chuàng)業(yè)過(guò)程中我們發(fā)現(xiàn),所有的方案只考慮技術(shù),不考慮內(nèi)容和服務(wù)。這在本質(zhì)上違反了市場(chǎng)原則,用戶永遠(yuǎn)要的是服務(wù)和功能,我覺(jué)得技術(shù)只是提升它的體驗(yàn),我覺(jué)得這是一個(gè)本質(zhì)的問(wèn)題。

我們的痛點(diǎn)是在通用AI技術(shù)上,沒(méi)有達(dá)到我們滿意的效果,所以我們需要和國(guó)際上最頂尖的公司進(jìn)行合作。

微軟認(rèn)知服務(wù)是全面性,微軟服務(wù)本身也是有機(jī)體,本身考慮的就很完善。我們和微軟的合作,因?yàn)槲覀兛吹搅恕懊魈臁钡臇|西,可以少走一些彎路,多模態(tài)和多場(chǎng)景的東西必然帶來(lái)很大的變革。

企業(yè)應(yīng)用最后一個(gè)痛點(diǎn):會(huì)議中的語(yǔ)音

問(wèn):微軟開(kāi)發(fā)出了很好的語(yǔ)音識(shí)別等的技術(shù),你們打算用這些技術(shù)開(kāi)發(fā)出一些什么樣的產(chǎn)品?智能音箱有很多企業(yè)都在做,但是具體的有沒(méi)有什么更好的應(yīng)用可以為大家更好的服務(wù)呢?

黃學(xué)東:語(yǔ)音交互過(guò)程中,在所有的商業(yè)場(chǎng)景中,用電子郵件、微信等等其他的產(chǎn)品都已經(jīng)數(shù)字化了,會(huì)議中的語(yǔ)音是現(xiàn)在沒(méi)有數(shù)字化的一個(gè)主要媒體,這對(duì)生產(chǎn)力的提高、對(duì)消費(fèi)的提高是最后的痛點(diǎn)。在企業(yè)的應(yīng)用中,最后的一個(gè)痛點(diǎn)就在這個(gè)地方。

會(huì)議比較難做,不像全雙工,只有兩個(gè)人在講話,超過(guò)三個(gè)人的會(huì)議就比兩個(gè)人會(huì)議難很多。如果能做到七八個(gè)人開(kāi)會(huì),都可以轉(zhuǎn)錄和翻譯,可以變成數(shù)字化的形式處理。

問(wèn):如何看待目前的人工智能市場(chǎng)?

黃學(xué)東:我覺(jué)得人工智能造就的“餅”足夠大,傳統(tǒng)公司和新生公司都可以在這個(gè)餅上發(fā)揮自己的空間,為用戶提供更優(yōu)質(zhì)的服務(wù)。微軟云是提供全球很寬泛的一個(gè)平臺(tái),它的覆蓋力不管是全球語(yǔ)言還是數(shù)據(jù)中心的覆蓋力都應(yīng)該是引導(dǎo)潮流的。在這樣一個(gè)平臺(tái)上,微軟的從計(jì)算機(jī)視覺(jué)到自然語(yǔ)言處理,再到語(yǔ)音和搜索、知識(shí)表達(dá)等服務(wù),都是業(yè)界領(lǐng)導(dǎo)潮流的。

所以在這個(gè)平臺(tái)上和人工智能的深度上微軟有非常大的優(yōu)勢(shì),所以我們希望在提供這個(gè)寬度和深度這樣的架構(gòu)下,有更多的開(kāi)發(fā)商可以在這個(gè)平臺(tái)上開(kāi)發(fā)出我們還沒(méi)有想到的應(yīng)用,這個(gè)才是平臺(tái)做的事情。大家要知道微軟有廣度且有深度,這個(gè)情況下開(kāi)發(fā)商應(yīng)該加入這個(gè)平臺(tái),在上面創(chuàng)造他們新的價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6537

    瀏覽量

    103808
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46338

    瀏覽量

    236499

原文標(biāo)題:黃學(xué)東:微軟“全武功”解決企業(yè)會(huì)議的痛點(diǎn)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    神州數(shù)碼郭為:數(shù)字化轉(zhuǎn)型面臨三大點(diǎn),中國(guó)科技企業(yè)出海迎來(lái)重要機(jī)會(huì)點(diǎn)

    個(gè)數(shù)字原生為底層支撐的架構(gòu)是件任重而道遠(yuǎn)的事。對(duì)此,神州數(shù)碼董事長(zhǎng)郭為表示,目前中國(guó)政企在數(shù)字化轉(zhuǎn)型的過(guò)程主要面臨三個(gè)
    的頭像 發(fā)表于 07-29 15:03 ?337次閱讀

    四麥語(yǔ)音會(huì)議方案

    四麥語(yǔ)音會(huì)議方案是種使用四個(gè)麥克風(fēng)進(jìn)行語(yǔ)音捕捉和處理的會(huì)議解決方案,旨在提高
    的頭像 發(fā)表于 07-23 22:37 ?195次閱讀
    四麥<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>會(huì)議</b>方案

    有效提升智能會(huì)議系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確性案例分享

    語(yǔ)音識(shí)別技術(shù)是在智能會(huì)議系統(tǒng)至關(guān)重要,準(zhǔn)確的智能會(huì)議語(yǔ)音識(shí)別能力,意味著會(huì)議參與者可以通過(guò)
    的頭像 發(fā)表于 06-21 11:15 ?252次閱讀
    有效提升智能<b class='flag-5'>會(huì)議</b>系統(tǒng)<b class='flag-5'>語(yǔ)音</b>識(shí)別準(zhǔn)確性案例分享

    有效提升智能會(huì)議系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確性案例分享

    語(yǔ)音識(shí)別技術(shù)是在智能會(huì)議系統(tǒng)至關(guān)重要,準(zhǔn)確的智能會(huì)議語(yǔ)音識(shí)別能力,意味著會(huì)議參與者可以通過(guò)
    的頭像 發(fā)表于 06-21 11:13 ?392次閱讀
    有效提升智能<b class='flag-5'>會(huì)議</b>系統(tǒng)<b class='flag-5'>語(yǔ)音</b>識(shí)別準(zhǔn)確性案例分享

    微軟網(wǎng)頁(yè)版PPT新增語(yǔ)音識(shí)別及字幕生成功能

    據(jù)報(bào)道,微軟計(jì)劃于今年六月份推出網(wǎng)頁(yè)版PowerPoint全新語(yǔ)音識(shí)別功能。此項(xiàng)功能將能夠監(jiān)控PowerPoint視頻的聲音,進(jìn)而自動(dòng)生成字幕。
    的頭像 發(fā)表于 05-16 14:36 ?319次閱讀

    學(xué)鴻蒙的1萬(wàn)個(gè)理由,北京中關(guān)村現(xiàn)大幅鴻蒙海報(bào)

    ,學(xué)習(xí)鴻蒙已成為高校和企業(yè)的熱門(mén)趨勢(shì)。隨鴻蒙生態(tài)的飛速發(fā)展,正如張朝陽(yáng)所說(shuō),現(xiàn)在是學(xué)習(xí)鴻蒙的黃金時(shí)期。 最后 如果大家覺(jué)得這篇內(nèi)容對(duì)學(xué)習(xí)鴻蒙開(kāi)發(fā)有幫助,我想邀請(qǐng)大家?guī)臀胰?b class='flag-5'>個(gè)小忙: 點(diǎn)
    發(fā)表于 05-08 20:31

    工業(yè)級(jí)路由器:解決網(wǎng)絡(luò)傳輸?shù)?b class='flag-5'>痛點(diǎn)

    工業(yè)級(jí)路由器專(zhuān)為工業(yè)應(yīng)用場(chǎng)景設(shè)計(jì),具備高可靠性、穩(wěn)定性和帶寬,解決實(shí)時(shí)性要求高、大量數(shù)據(jù)傳輸、復(fù)雜網(wǎng)絡(luò)環(huán)境等點(diǎn),適用于制造業(yè)和能源行業(yè),提升生產(chǎn)效率、產(chǎn)品質(zhì)量和企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)。
    的頭像 發(fā)表于 04-29 11:40 ?360次閱讀

    訊維融合通信系統(tǒng):解決企業(yè)通信點(diǎn)的利器

    融合通信系統(tǒng),作為解決企業(yè)通信點(diǎn)的利器,正日益受到廣泛關(guān)注和應(yīng)用。該系統(tǒng)通過(guò)集成多種通信技術(shù)和功能,為企業(yè)提供了種全面、高效、靈活的通信
    的頭像 發(fā)表于 04-12 16:27 ?356次閱讀

    數(shù)據(jù)采集邊緣網(wǎng)關(guān)解決企業(yè)數(shù)據(jù)采集點(diǎn)的關(guān)鍵

    網(wǎng)關(guān) 應(yīng)運(yùn)而生,成為解決企業(yè)數(shù)據(jù)采集點(diǎn)的關(guān)鍵所在。 、企業(yè)背景與
    的頭像 發(fā)表于 04-07 13:56 ?315次閱讀

    電梯物聯(lián)網(wǎng)技術(shù)如何解決電梯管理的點(diǎn)?

    隨著物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,電梯行業(yè)也迎來(lái)了新的變革。電梯物聯(lián)網(wǎng)技術(shù)的應(yīng)用為電梯管理帶來(lái)了許多新的機(jī)遇和優(yōu)勢(shì),同時(shí)也有效地解決了傳統(tǒng)電梯管理存在的各種點(diǎn)。 本文梯云物聯(lián)網(wǎng)將探討電梯物聯(lián)網(wǎng)技術(shù)如何解決電梯管理的
    的頭像 發(fā)表于 03-19 10:09 ?425次閱讀

    高效管理會(huì)議空間:了解會(huì)議室屏蔽器的作用與應(yīng)用?|深圳特信電子有限公司.

    高效管理會(huì)議空間:了解會(huì)議室屏蔽器的作用與應(yīng)用?|深圳特信電子有限公司在現(xiàn)代商務(wù)環(huán)境會(huì)議室屏蔽器作為種重要的設(shè)備,在保障
    發(fā)表于 03-11 09:08

    微軟Outlook新增&quot;In-person event&quot;功能,提升混合會(huì)議體驗(yàn)?

    根據(jù)微軟的介紹,混合辦公已成為后疫情時(shí)代不可逆轉(zhuǎn)的趨勢(shì),然而如何有效管理線上及線下融合的會(huì)議變得極具挑戰(zhàn)性。為了解決這個(gè)問(wèn)題,微軟推出了“In-person event”功能,旨在協(xié)助企業(yè)
    的頭像 發(fā)表于 02-27 11:27 ?515次閱讀

    數(shù)據(jù)中心機(jī)房建設(shè)的關(guān)鍵點(diǎn)及解決方案

    隨著信息技術(shù)的飛速發(fā)展,數(shù)據(jù)中心機(jī)房已成為企業(yè)信息系統(tǒng)的核心。然而,在機(jī)房系統(tǒng)的建設(shè)過(guò)程,投資及運(yùn)行維護(hù)成為項(xiàng)目管理的關(guān)鍵點(diǎn)。合理的投資決策和高效的運(yùn)維管理是確保機(jī)房系統(tǒng)經(jīng)濟(jì)性和可
    的頭像 發(fā)表于 02-03 10:26 ?1084次閱讀

    數(shù)據(jù)中心機(jī)房建設(shè)的點(diǎn):投資與運(yùn)維之間的博弈

    在數(shù)字化浪潮的推動(dòng)下,數(shù)據(jù)中心機(jī)房建設(shè)成為企業(yè)發(fā)展不可或缺的環(huán)。然而,這一過(guò)程中存在系列的點(diǎn)
    的頭像 發(fā)表于 02-03 09:54 ?547次閱讀

    通過(guò)Goooood?狗帝 融合CDN解決內(nèi)容傳遞點(diǎn)

    Goooood?狗帝 融合CDN解決了與內(nèi)容傳遞相關(guān)的點(diǎn),為企業(yè)提供了個(gè)全面的解決方案,優(yōu)化性能、增強(qiáng)安全性、擴(kuò)展全球覆蓋范圍并實(shí)現(xiàn)可擴(kuò)
    的頭像 發(fā)表于 01-08 14:36 ?348次閱讀