0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Eros Now利用Google Cloud實現(xiàn)AI驅(qū)動的字幕功能

倩倩 ? 來源:慧譯講視頻,風(fēng)尚網(wǎng),互 ? 作者:慧譯講視頻,風(fēng)尚 ? 2021-03-15 13:44 ? 次閱讀

Google 用三個項目:Live Transcribe、Live Caption、Live Relay,來幫助聽障人群融入正常社會,實現(xiàn)無障礙溝通。

1 Live Transcribe(實時轉(zhuǎn)錄):打開應(yīng)用軟件后,手機設(shè)備可以實時監(jiān)聽周圍環(huán)境中的語音,并實時顯示出對應(yīng)的文字。

2 Live Caption(實時字幕):使用自動語音識別,為視頻添加字幕。適用于播放音頻的任何媒體,包括視頻,音頻等消息,尤其是無字幕的直播,甚至和家人視頻聊天,都可以實時添加字幕。

3 Live Relay(實時語音)基于Live Transcribe的實時的文字轉(zhuǎn)語音的產(chǎn)品,以便聾啞人在打電話需求場景下,能打字轉(zhuǎn)換成語音播放達到溝通目的。

Eros Now周二表示,它已與Google Cloud合作,使用后者的AI技術(shù),以自動字幕的形式流式傳輸其全部電影和原著。

AI驅(qū)動的字幕功能將首先以阿拉伯語提供。該公司表示,語言支持將迎合喜歡印度電影和其他消費印度娛樂內(nèi)容市場的“大量阿拉伯觀眾”。

Eros Now還詳細說明了其如何在其流媒體平臺上使用尖端技術(shù)。

“通過使用AI框架和大量預(yù)先存在的數(shù)據(jù),Eros Now的內(nèi)部數(shù)據(jù)科學(xué)團隊模擬,培訓(xùn)和開發(fā)了一種先進的模型,該模型的性能相當(dāng)于人類,并且能夠生成所需的字幕電影和原著中使用的語言”,該公司在一份新聞稿中說。

該公司表示,該部署將有助于推動更高的消費者參與度,并為“文本到語音”自動化打開新的機會窗口。該公司指出,該模型可用于不同類型和語言。

“應(yīng)對性別非中立語言以及各種使用不同語言的標(biāo)點符號只是最大的挑戰(zhàn)中的幾個。自動化過程花了六個月的時間才能使數(shù)據(jù)科學(xué)家完善?!痹摴狙a充說。

Eros Now由Eros STX Global Corporation擁有。OTT平臺擁有使用印地語和當(dāng)?shù)卣Z言發(fā)行的12,000多部電影的權(quán)利。截至2020年9月,該平臺擁有超過2.11億注冊用戶和3,620萬付費用戶。

過去,愛神(Eros)也嘗試了其他新時代的技術(shù)。去年,它與美國視頻游戲和軟件公司Epic Games合作,將“虛幻引擎”技術(shù)引入了印度電影。以Fortnite之類的游戲而聞名的Epic Games表示,它將提供實時渲染,更好的VFX和虛擬制作等技術(shù)。

在2019年,Eros Now與Microsoft合作,利用Azure云平臺托管和流傳輸其數(shù)字視頻產(chǎn)品。

利用Google Assistant 中由AI驅(qū)動的新功能非常方便

在Google助手首次為家庭采用解釋器模式大約一年后,該功能終于在移動設(shè)備上發(fā)布。這是根據(jù)最近的報道援引Google自己的話說的,該模式即將到來。

為清楚起見,解釋器模式是一種實時翻譯器,可以進行對話。因此,使用后,用戶將能夠閱讀和聽到某人對他們說的另一種語言的翻譯。他們還可以進行交談或點擊智能回復(fù)并鍵入回復(fù)。

Google助理會以相應(yīng)的語言大聲朗讀所有內(nèi)容。用戶不必為外國的發(fā)音和語法上的細微差別而苦惱。目前,一長串可用的語言總共有44種。明顯的內(nèi)容包括德語,法語和類似的通用語言。但是Google也包含了一些在世界許多地方都不太常用的東西。

例如,用于移動設(shè)備的新解釋器模式可以幫助用戶說泰語或其他常用但使用較少的語言。

利用Google Assistant 中由AI驅(qū)動的新功能非常方便。實際上,通常只需在“ Okay”或“ Hey Google”之后加上幾個字即可使事情向前發(fā)展。關(guān)鍵短語也很簡單。因此,整個過程和小程序的使用應(yīng)非常直觀,而不是要求口頭體操來完成。

例如,用戶可以說“嘿Google,幫我說西班牙語”。正如所暗示的那樣,該短語將在西班牙語的解釋器模式下啟動。“好吧,谷歌,當(dāng)我的泰語翻譯者”同樣可以很好地工作。

從那里開始,Google的解釋器模式將按預(yù)期工作。口語單詞會在屏幕上翻譯并大聲說出來。智能答復(fù)似乎可以從中選擇,當(dāng)然,還會顯示一個鍵盤圖標(biāo)來鍵入響應(yīng)。語音響應(yīng)也會被捕獲,并以其他語言大聲朗讀。

Google似乎并未提供太多有關(guān)哪些移動設(shè)備將能夠使用由Assistant AI支持的新解釋器模式的確切信息。但是,它確實說它正在同時出現(xiàn)在iOSAndroid上。該模式將通過更新到達??梢詮腁pp Store或Google Play商店中找到專門用于Google Assistant應(yīng)用程序的內(nèi)容。

這意味著,盡管它現(xiàn)在正在推出,但要花一些時間才能敲打那里的所有設(shè)備。部署通常需要幾個星期才能完成。

(慧譯講視頻,風(fēng)尚網(wǎng),互聯(lián)網(wǎng)分析沙龍網(wǎng)綜合整理 )

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1752

    瀏覽量

    57330
  • 流媒體
    +關(guān)注

    關(guān)注

    1

    文章

    192

    瀏覽量

    16640
  • 解釋器
    +關(guān)注

    關(guān)注

    0

    文章

    103

    瀏覽量

    6479
收藏 人收藏

    評論

    相關(guān)推薦

    聯(lián)想與Meta合作推出AI Now個人AI智能體

    聯(lián)想集團近日在美國西雅圖舉辦了年度Tech World大會,會上聯(lián)想CEO楊元慶與Meta創(chuàng)始人兼CEO馬克?扎克伯格共同宣布了一項重要合作。雙方基于Meta的Llama大模型,推出了面向PC的個人AI智能體——AI Now
    的頭像 發(fā)表于 10-17 16:58 ?416次閱讀

    Google Cloud AI助力衛(wèi)安智能推出機器人解決方案

    Google Cloud 基于神經(jīng)網(wǎng)絡(luò)的語音識別技術(shù)讓衛(wèi)安智能得以滿足小語種地區(qū)用戶對機器人交互的需求,為其節(jié)省約60%與第三方溝通協(xié)作的人力成本,并運用高性能的計算資源將產(chǎn)品的開發(fā)周期縮短了一半。
    的頭像 發(fā)表于 10-16 11:11 ?371次閱讀

    Commvault Cloud平臺提供Cloud Rewind功能

    混合云企業(yè)網(wǎng)絡(luò)彈性和數(shù)據(jù)保護解決方案領(lǐng)先提供商Commvault(納斯達克代碼:CVLT)宣布在Commvault Cloud平臺上提供Cloud Rewind功能。這項獨特的產(chǎn)品集成了通過收購
    的頭像 發(fā)表于 10-15 09:21 ?258次閱讀

    NetApp與Google Cloud深化合作,強化分布式云存儲

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)導(dǎo)者NetApp?宣布,其與Google Cloud的戰(zhàn)略合作再升級。此次合作中,NetApp將統(tǒng)一數(shù)據(jù)存儲和智能服務(wù)融入Google Distributed Cloud
    的頭像 發(fā)表于 10-11 17:21 ?390次閱讀

    谷歌Vertex AI助力企業(yè)生成式AI應(yīng)用

    過去的一段時間,我們看到了許多 Google Cloud 客戶對生成式 AI 和 agent 的精彩應(yīng)用,令我們拍案叫絕。為了讓企業(yè)能夠更快推出功能強大的
    的頭像 發(fā)表于 09-09 15:59 ?382次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    Google Cloud 一如既往地踐行打造開放、靈活的 AI 生態(tài)系統(tǒng)的承諾,幫助您構(gòu)建最能滿足您需求的解決方案。
    的頭像 發(fā)表于 08-02 15:42 ?314次閱讀

    谷歌將優(yōu)化安卓系統(tǒng)的實時字幕功能,用戶可更改字幕行數(shù)

    Live Captions作為安卓系統(tǒng)的輔助工具,能自動識別并實時將音頻轉(zhuǎn)化為字幕。此功能對聽力受損或環(huán)境嘈雜時難以理解內(nèi)容的人群十分有用。
    的頭像 發(fā)表于 05-30 14:28 ?542次閱讀

    微軟網(wǎng)頁版PPT新增語音識別及字幕生成功能

    據(jù)報道,微軟計劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識別功能。此項功能將能夠監(jiān)控PowerPoint視頻中的聲音,進而自動生成字幕
    的頭像 發(fā)表于 05-16 14:36 ?325次閱讀

    Flutter首次亮相Google Cloud Next大會

    Flutter 團隊在近期首次參加了 Google Cloud Next 大會,這意味著 Flutter 在開發(fā)社區(qū)中的影響力正在日益增長。
    的頭像 發(fā)表于 05-09 10:15 ?421次閱讀

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺已成為云服務(wù)提供商優(yōu)化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google Axion 處理器,面向通用計算和人工智能
    的頭像 發(fā)表于 04-16 14:30 ?554次閱讀

    Cognizant與Google Cloud深化合作,提升軟件交付效率

    近日,知名IT服務(wù)提供商Cognizant與Google Cloud宣布將進一步擴大合作伙伴關(guān)系,共同致力于增強軟件交付生命周期,并顯著提升開發(fā)人員的工作效率。
    的頭像 發(fā)表于 03-26 10:01 ?302次閱讀

    Imagen 2 現(xiàn)已在 Vertex AI 上全面推出

    Google Cloud 圖像生成功能帶來的重大升級——這是我們最先進的文生圖技術(shù),現(xiàn)在已向許可名單 (即獲準(zhǔn)訪問) 上的 Vertex AI 客戶全面開放。 Vertex
    的頭像 發(fā)表于 12-22 10:10 ?351次閱讀
    Imagen 2 現(xiàn)已在 Vertex <b class='flag-5'>AI</b> 上全面推出

    Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作負載

    以下文章來源于谷歌云服務(wù),作者 Google Cloud Amin Vahdat ML、系統(tǒng)與 Cloud AI 副總裁/總經(jīng)理 Mark Lohmeyer 計算與 ML 基礎(chǔ)設(shè)施副總
    的頭像 發(fā)表于 12-13 16:05 ?511次閱讀
    <b class='flag-5'>Google</b> <b class='flag-5'>Cloud</b> 推出 TPU v5p 和 <b class='flag-5'>AI</b> Hypercomputer: 支持下一代 <b class='flag-5'>AI</b> 工作負載

    Google Cloud 線上課堂 | Google Cloud 遷移最佳實踐

    以下文章來源于谷歌云服務(wù),作者 Google Cloud 立即預(yù)約 長按識別/掃描 右方二維碼 預(yù)約觀看直播 各行各業(yè)的組織都積極將業(yè)務(wù)遷移到云端,但同時發(fā)現(xiàn),無論單個本地應(yīng)用,還是跨多個
    的頭像 發(fā)表于 11-28 17:45 ?441次閱讀

    通過我們的 10 步計劃啟動您的生成式 AI 之旅

    以下文章來源于谷歌云服務(wù),作者 Google Cloud 生成式 AI 是史上最重大的技術(shù)變革之一 這項技術(shù)可能會對個人和企業(yè)的效率產(chǎn)生重大影響,影響之大堪比互聯(lián)網(wǎng)或移動設(shè)備的問世。事實上,在考慮
    的頭像 發(fā)表于 11-15 17:50 ?443次閱讀
    通過我們的 10 步計劃啟動您的生成式 <b class='flag-5'>AI</b> 之旅