0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

你知道屏幕后是誰在和你對話嗎?新研究開發(fā)仿真面對面對話系統(tǒng)

Hf1h_BigDataDig ? 來源:TW ? 2019-09-02 15:48 ? 次閱讀

基于深度神經(jīng)網(wǎng)絡仿真面對面對話系統(tǒng)

近日,CloudMinds和北京航空航天大學的研究人員基于深度學習提出了一種新的仿真面對面對話系統(tǒng)。CloudMinds是一家在機器人和云服務領域的領軍企業(yè),致力于成為針對各種機器人模型需求的供應商。

該會話系統(tǒng)包括用于收聽和說話的兩個序列到序列模型以及基于虛擬代理合成器的生成性對抗網(wǎng)絡(GAN)模型。

當虛擬代理與人通信時,語音音頻和面部圖像被輸入到系統(tǒng)中。面部圖像由面部解析模塊處理,產(chǎn)生面部動作和姿勢。然后將生成的信息傳遞到基于序列到序列的收聽模型中。當虛擬代理在收聽時,輸出被饋送到合成器中以產(chǎn)生逼真的面部圖像作為非語言反應。

語音識別模型將語音音頻變換為文本,然后傳遞到會話模塊中以生成響應語句,該響應語句被傳遞到文本到語音(TTS)模塊以合成語音。響應語句被傳遞到序列到序列的說話模型,其輸出也被輸入到虛擬合成器中以產(chǎn)生逼真的面部圖像,從而呼應語音內(nèi)容。頭像合成器則用于在整個對話期間收聽和說話。

本文顯著改進了傳統(tǒng)的基于3D模型的成果。為了訓練模型,研究人員收集了大約700個ESPN視頻,其中包含來自YouTube的面對面對話場景。

與傳統(tǒng)3D模型的生成結(jié)果相比,該模型所生成的面部圖像更接近現(xiàn)實。毋庸置疑的是,在使得會話更加逼真自然的領域上,該系統(tǒng)還有很大的潛力可供挖掘,未來它還可用于實現(xiàn)個性化表情會話。

原文:

https://arxiv.org/abs/1908.07750

使用DISCo方法改進鈣成像分析

本文中,德國海德堡大學跨學科科學計算中心(IWR)的研究人員介紹了DISCo方法,這是一種使用深度學習,實例分割和相關性研究的新方法,可用于鈣成像分析中的細胞分割步驟。

DISCo將深度學習網(wǎng)絡的優(yōu)勢與最先進的實例分割程序相結(jié)合,允許直接提取單元實例而無需任何復雜的后處理步驟。他們還以非常有效的方式利用鈣成像視頻的時間背景來計算像素之間的分段相關性。然后以摘要圖像的形式將此時間信息與基于形狀的信息相結(jié)合。

DISCo的最大優(yōu)勢在于能夠結(jié)合相關性和圖像特征,而不只依賴于其中一種方法。因此,DISCo可以通過在Neurofinder數(shù)據(jù)集上僅使用單個模型來使神經(jīng)研究人員獲得良好的整體性能。此外,當在幾個數(shù)據(jù)集系列上訓練單個網(wǎng)絡時,研究人員能夠超越在Neurofinder數(shù)據(jù)集上訓練的所有其他方法。

原文:

https://arxiv.org/abs/1908.07957

用于科研教育的低成本開源機器人賽車平臺

華盛頓大學保羅G.艾倫計算機科學與工程學院的研究人員最近介紹了MuSHR,即多代理的非完整賽車系統(tǒng)。MuSHR是一個低成本、開源的機器人賽車平臺,致力于教育和研究,由MuSHR的個人機器人實驗室開發(fā),旨在促進機器人領域的公民化。作為一個低成本的平臺,參與者可以通過說明,開源文檔和動手教程參與其中。

賽車的硬件設計基于一系列現(xiàn)成的組件,這些組件可以從世界各地的線上和線下硬件商店中輕松地找到,而軟件架構(gòu)則是在個人機器人實驗室中開發(fā)的。該平臺為華盛頓大學的移動機器人課程開發(fā)了一套演示系統(tǒng)和許多寶貴的實踐經(jīng)驗,是機器人平臺開發(fā)的里程碑。

MuSHR的低成本開發(fā)模式和綜合的文檔記錄是寶貴的機器人研究資源。該平臺向?qū)W術研究實驗室,機器人研究者及機器人愛好者等展示各種機器人研究項目提供了一個出色的測試平臺。

MuSHR具有開源指令和教程帶領用戶完成硬件開發(fā)。文檔托管在Github上,免費供一般公眾下載使用。

代碼:

https://github.com/prl-mushr

原文:

https://arxiv.org/abs/1908.08031

三維掃描與CAD對象的聯(lián)合嵌入

近日,慕尼黑工業(yè)大學、斯坦福大學以及 Facebook 人工智能研究所共同提出了一種學習三維掃描和CAD之間的聯(lián)合嵌入空間的技術。而在這兩者中有很多聯(lián)系緊密且十分相似的事物。這一學習方法基于一種全新的3D CNN 技術,通過學習聯(lián)合嵌入空間中事物的相似性來實現(xiàn)嵌入。

為了學習一個掃描對象和CAD模型可以相互交織的共享空間,研究人員提出使用堆疊沙漏的方式將前景、背景與掃描對象分開,并將其轉(zhuǎn)換為完整的類CAD表示,以此將它整合到共享嵌入空間中。這樣操作得到的嵌入空間可以用于CAD模型檢索。為了更好地完成這一任務,研究人員引入了一個全新數(shù)據(jù)集,其中包括了掃描CAD相似性注釋。在這一數(shù)據(jù)集的幫助下,他們能夠?qū)AD模型檢索進行細粒度的評估,并對雜亂、嘈雜部分進行掃描。

這一新型學習方式比現(xiàn)有的CAD模型在實例檢索上的準確率高出10% 以上。

因此,它在CAD模型檢索方面的表現(xiàn)比原有模型更好。學習這樣的聯(lián)合掃描- CAD嵌入空間不僅為CAD模型檢索提供了新的解決方案,也為這兩個領域之間的知識映射提供了新的可能性。

當然,雖然這個技術在掃描與學習CAD對象空間方面非常有效,但它仍然有很多局限性——目前研究人員僅考慮了掃描和CAD對象領域中對象的幾何形狀;而這篇論文中未提及的顏色信息可能是聯(lián)合嵌入或CAD模型檢索的另一強大信號。

原文:

https://arxiv.org/abs/1908.06989

Google發(fā)布Turbo,可視化工具的里程碑式突破

Turbo 是由Google研究人員提出的一種著色工具,它既有Jet的優(yōu)勢功能,同時也解決了Jet的一些短板,例如細節(jié)錯誤、條帶、和顏色混淆等。

在開發(fā)人員的精心調(diào)試下,Turbo的強大性能能夠勝任各種可視化任務。在開發(fā)過程中,研究人員們制作了一個簡單的交互界面,在其中他們能夠使用7節(jié)立方條來調(diào)整RGB曲線,同時將樣本結(jié)果與其他知名彩繪程序的結(jié)果進行比較。

Turbo可以作為順序和發(fā)散的可視化工具,因此它很適合開發(fā)人員保存在自己的“工具箱”中。它用于解決均勻性不那么重要的數(shù)據(jù)可視化任務非常有效,尤其是在需要展現(xiàn)強烈對比的情況下。

Google的團隊將這個工具用于實現(xiàn)視差貼圖、誤差貼圖以及許多其他標量的可視化中。您可以在下方鏈接中找到在Python和C/C++ 中的使用這幾技術的方法,以及多項式逼近的方法——用于可能查表查詢不太方便的情況中。

Python:

https://gist.github.com/mikhailov-work/ee72ba4191942acecc03fe6da94fc73f

C/C++:

https://gist.github.com/mikhailov-work/6a308c20e494d9e0ccc29036b28faa7a

Polynomial approximation:

https://gist.github.com/mikhailov-work/0d177465a8151eb6ede1768d51d476c7

原文:

https://ai.googleblog.com/2019/08/turbo-improved-rainbow-colormap-for.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4726

    瀏覽量

    100326
  • AI
    AI
    +關注

    關注

    87

    文章

    29435

    瀏覽量

    267733

原文標題:狗還是機器人?誰在屏幕后和你對話?新研究開發(fā)仿真面對面對話系統(tǒng) | 一周AI最火論文

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ChatGPT 在游戲開發(fā)中的創(chuàng)新應用

    在游戲開發(fā)領域,人工智能技術的應用正變得越來越廣泛。ChatGPT,作為一種先進的自然語言處理(NLP)模型,為游戲開發(fā)帶來了許多創(chuàng)新的應用。 1. 動態(tài)對話系統(tǒng) ChatGPT的強項
    的頭像 發(fā)表于 10-25 18:05 ?119次閱讀

    esp32-lyrat接DuerOS有了對話功能之后,是否還可以進行錄音?

    想問一下,esp32-lyrat 接入 DuerOS 有了對話功能之后,還是否可以進行錄音? 也就是,想要問一下,加入DuerOS是否會將esp32-lyrat開發(fā)板的錄音功能全程占用? 有無解決辦法?
    發(fā)表于 06-28 16:30

    定時關閉對話

    發(fā)一個項目上用的定時對話
    發(fā)表于 06-07 10:07

    基于微機電系統(tǒng)的智能手表

    微機電系統(tǒng)采用的是梳狀驅(qū)動式致動器。要理解其工作原理,可以設想兩個梳齒間隔很大的梳子,它們面對面擺放,梳齒交錯。
    的頭像 發(fā)表于 04-28 11:18 ?552次閱讀

    Mode Maison利用基于OpenUSD的高保真數(shù)字孿生推動零售業(yè)創(chuàng)新

    “ Omniverse 先鋒面對面”系列文章主要介紹使用 OpenUSD 為 3D 工作流和物理精確的虛擬世界構(gòu)建工具、應用和服務的個人創(chuàng)作者和開發(fā)者。
    的頭像 發(fā)表于 04-03 10:04 ?295次閱讀
    Mode Maison利用基于OpenUSD的高保真數(shù)字孿生推動零售業(yè)創(chuàng)新

    蘋果WWDC24將于6月10日至14日召開

    蘋果指出,WWDC規(guī)模宏大,是蘋果每年最重要的開發(fā)者盛典之一。屆時,開發(fā)人員不僅能了解蘋果最新研發(fā)的各項技術和平臺,也可體驗如何對應用程序和游戲進行改造。據(jù)稱,開發(fā)者還有機會與蘋果設計及工程部門的專家進行
    的頭像 發(fā)表于 03-27 13:54 ?2513次閱讀

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對話

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對話
    的頭像 發(fā)表于 03-21 09:44 ?349次閱讀
    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次<b class='flag-5'>對話</b>

    鴻蒙開發(fā)實戰(zhàn)-手寫文心一言AI對話APP

    本文我們學習使用了基本組件的使用,網(wǎng)絡請求以及狀態(tài)管理,使用了ForEach循環(huán)渲染來構(gòu)建對話界面。并且在HarmonyOS設備上成功運行
    的頭像 發(fā)表于 01-24 18:02 ?948次閱讀
    鴻蒙<b class='flag-5'>開發(fā)</b>實戰(zhàn)-手寫文心一言AI<b class='flag-5'>對話</b>APP

    《用“開源”的方式講開源的法律,有問必答,一問到底》——開源合規(guī)分論壇為答疑解惑

    12月16-17日,2023開放原子開發(fā)者大會在江蘇無錫隆重舉辦。期間舉辦的開源合規(guī)論壇,別出心裁地摒棄了傳統(tǒng)的嘉賓演講和圓桌討論,而是采用了互動答疑模式,開源合規(guī)專家與開發(fā)面對面直接交流,通過
    的頭像 發(fā)表于 12-18 15:55 ?299次閱讀

    GUI高級組件對話框代碼

    簡單輸入對話框 simpledialog(簡單對話框)包含如下常用函數(shù): 實操代碼 """簡單對話框""" from tkinter.simpledialog import *root = Tk
    的頭像 發(fā)表于 11-26 17:05 ?839次閱讀
    GUI高級組件<b class='flag-5'>對話</b>框代碼

    GUI圖形界面編程文件對話

    文件對話框 文件對話框幫助我們實現(xiàn)可視化的操作目錄、操作文件. 將文件、目錄的信息傳入到程序中 文件對話框包含如下一些常用函數(shù) 命名參數(shù) options 的常見值如下: 實操代碼——文件對話
    的頭像 發(fā)表于 11-26 16:58 ?794次閱讀
    GUI圖形界面編程文件<b class='flag-5'>對話</b>框

    冠軍面對面 | OpenHarmony競賽訓練營冠軍團隊專訪

    訓練營” 在現(xiàn)場舉行了星光閃耀的頒獎儀式 來自華中科技大學的“名稱暫定”隊勇奪一等獎 每一場勝利背后都有全力以赴的汗水 向冠軍之巔攀登的途中又經(jīng)歷了怎樣的困難? 年輕的技術力量還將如何推動OpenHarmony開源生態(tài)的發(fā)展? 一起來看看 冠軍團隊及指導老師的獨家幕后分享↓ 當一行行代碼構(gòu)筑起萬物智聯(lián)
    的頭像 發(fā)表于 11-16 21:40 ?524次閱讀

    自然對話語音開啟人機交互的未來之窗

    隨著人工智能的快速發(fā)展,自然對話語音技術成為了人機交互的重要領域。這項技術讓計算機能夠理解、生成和回應人類的語言,使得交流變得更加便捷和自然。在過去幾年里,自然對話語音技術取得了令人矚目的進展,不僅
    的頭像 發(fā)表于 11-09 15:52 ?373次閱讀

    自然對話語音數(shù)據(jù):人機交互的新紀元與挑戰(zhàn)

    自然對話語音數(shù)據(jù)是指以自然語言進行交流的語音數(shù)據(jù),它代表著人機交互技術的巨大進步。隨著人工智能和語音識別技術的飛速發(fā)展,我們正逐漸邁入一個可以通過聲音與計算機進行自然對話的新時代。本文將深入探討自然對話語音數(shù)據(jù)的重要性,技術原理
    的頭像 發(fā)表于 11-08 17:01 ?396次閱讀

    全網(wǎng)尋找“何同學,對話“極客”CEO

    點擊藍字?關注我們 還記得那個對話蘋果CEO的何同學么? 自信自如的談吐,收獲全網(wǎng)點贊!? 其實,給您一個機會, 您一樣也可以是下一個“何同學”! 機會來啦,您來么? 2023年11月, 安森美
    的頭像 發(fā)表于 10-27 09:35 ?467次閱讀
    全網(wǎng)尋找“何同學,<b class='flag-5'>對話</b>“極客”CEO