午夜福利视频日韩美女一级毛片a,久久午夜夜伦鲁鲁片无码免费

如何從混雜的背景噪音中過(guò)濾出特定的聲音，這一“經(jīng)典雞尾酒會(huì)問(wèn)題”有望在AI的幫助下得以解決。

因?yàn)槲覀兊拇竽X可以專注于想聽(tīng)到的內(nèi)容，所以人耳可以準(zhǔn)確地從嘈雜聲中分辨出特定的聲音。然而，基于機(jī)器的“聲源分離”技術(shù)多年來(lái)卻一直讓工程師們束手無(wú)策。麻省理工學(xué)院的研究人員正在利用MV（音樂(lè)短片）訓(xùn)練神經(jīng)網(wǎng)絡(luò)，以便更好地定位聲音來(lái)源。

該團(tuán)隊(duì)的深度學(xué)習(xí)系統(tǒng)可以“直接通過(guò)一些未經(jīng)標(biāo)記的YouTube視頻進(jìn)行學(xué)習(xí)，分辨出每種物體對(duì)應(yīng)的聲音，”麻省理工學(xué)院研究人員Hang Zhao說(shuō)道。他也曾是NVIDIA研究部門的實(shí)習(xí)生。

Zhao認(rèn)為，該技術(shù)極具突破性，在語(yǔ)音、聽(tīng)力學(xué)、音樂(lè)和機(jī)器人學(xué)領(lǐng)域均有廣泛的應(yīng)用。

通過(guò)“刷視頻”來(lái)學(xué)習(xí)

麻省理工學(xué)院開(kāi)發(fā)出了一種新方法，即通過(guò)YouTube視頻中的圖像和聲音來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。他們的目標(biāo)是讓神經(jīng)網(wǎng)絡(luò)能夠精確定位視頻中圖像的位置（精確到像素級(jí)）。

該團(tuán)隊(duì)將其系統(tǒng)稱為PixelPlayer，并通過(guò)YouTube上的MV對(duì)PixelPlayer進(jìn)行了60個(gè)小時(shí)的訓(xùn)練。到目前為止，該系統(tǒng)已經(jīng)可以識(shí)別20多種樂(lè)器。

該團(tuán)隊(duì)在麻省理工學(xué)院的計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室 (Computer Science and Artificial Intelligence Lab) 開(kāi)展了這項(xiàng)研究，共開(kāi)發(fā)出了三個(gè)卷積神經(jīng)網(wǎng)絡(luò)，它們可協(xié)同工作以生成相應(yīng)結(jié)果。其中一個(gè)卷積神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)對(duì)視覺(jué)輸入進(jìn)行編碼，一個(gè)負(fù)責(zé)對(duì)音頻輸入進(jìn)行編碼，第三個(gè)則負(fù)責(zé)基于視覺(jué)和音頻輸入合成輸出。

PixelPlayer訓(xùn)練數(shù)據(jù)集由714個(gè)YouTube視頻組成?！坝捎谖覀兪褂昧怂膲KNVIDIA GPU，卷積神經(jīng)網(wǎng)絡(luò)才能夠以非?？斓乃俣忍幚頂?shù)據(jù)，”Zhao表示，“它大約用了一天的時(shí)間便學(xué)會(huì)了。”

PixelPlayer是一個(gè)自我監(jiān)督型（self-supervised）的系統(tǒng)。這意味著該系統(tǒng)不需要人類對(duì)樂(lè)器或樂(lè)器聲音進(jìn)行任何標(biāo)注，也可以識(shí)別出大號(hào)和小號(hào)等樂(lè)器的外觀、樂(lè)器聲音以及發(fā)聲方式。

吹響勝利的號(hào)角

對(duì)視頻中的聲源進(jìn)行定位后，PixelPlayer即可分離出其波形。目前，PixelPlayer在識(shí)別兩種或三種不同樂(lè)器時(shí)表現(xiàn)最佳，但該團(tuán)隊(duì)的目標(biāo)是盡快擴(kuò)大其識(shí)別范圍。在談到分離樂(lè)器聲音的過(guò)程時(shí)，Zhao說(shuō)道：“我們正在努力將一個(gè)MP3文件分離為多個(gè)MP3文件?！?/p>

PixelPlayer在音樂(lè)領(lǐng)域有諸多用途。據(jù)Zhao介紹，音頻工程師可以應(yīng)用此款A(yù)I工具增強(qiáng)某些音量較低的樂(lè)器聲音，或去除某種背景噪音。此外，它還可以幫助音頻工程師改善現(xiàn)場(chǎng)錄音或重新灌錄音樂(lè)的效果。

改善助聽(tīng)器功能也是研究人員為“雞尾酒會(huì)問(wèn)題”開(kāi)發(fā)深度學(xué)習(xí)解決方案的目的。

不僅是音樂(lè)和聽(tīng)力學(xué)領(lǐng)域，其應(yīng)用范圍還可用于識(shí)別我們周圍的聲音。例如，聆聽(tīng)森林中珍稀鳥(niǎo)類的鳴叫聲?！皺C(jī)器人也可以借助該系統(tǒng)理解周圍環(huán)境中的聲音?！盳hao補(bǔ)充道。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4726

瀏覽量
100332
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46397

瀏覽量
236612
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5442

瀏覽量
120800

原文標(biāo)題：讓音樂(lè)更悅耳：AI助力解決“雞尾酒會(huì)問(wèn)題”

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

如何訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)來(lái)解決問(wèn)題？

在神經(jīng)網(wǎng)絡(luò)建模中，經(jīng)常會(huì)出現(xiàn)關(guān)于神經(jīng)網(wǎng)絡(luò)應(yīng)該有多復(fù)雜的問(wèn)題，即它應(yīng)該有多少層，或者它的濾波器矩陣應(yīng)該有多大。這個(gè)問(wèn)題沒(méi)有簡(jiǎn)單的答案。與此相關(guān)，討論網(wǎng)絡(luò)過(guò)擬合和欠擬合非常重要。過(guò)擬合是模

發(fā)表于 11-24 15:35 ?672次閱讀

如何<b class='flag-5'>訓(xùn)練</b>這些<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b><b class='flag-5'>來(lái)</b>解決問(wèn)題？

詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

在如今的網(wǎng)絡(luò)時(shí)代，錯(cuò)綜復(fù)雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境，讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年，深度學(xué)習(xí)逐漸走進(jìn)人們的視線，通過(guò)深

發(fā)表于 01-11 10:51 ?1776次閱讀

從AlexNet到MobileNet，帶你入門深度神經(jīng)網(wǎng)絡(luò)

通過(guò)堆疊卷積層使得模型更深更寬，同時(shí)借助GPU使得訓(xùn)練再可接受的時(shí)間范圍內(nèi)得到結(jié)果，推動(dòng)了卷積神經(jīng)網(wǎng)絡(luò)甚至是深度學(xué)習(xí)的發(fā)展。下面是AlexNet的架構(gòu)：AlexNet的特點(diǎn)有：1.借助

發(fā)表于 05-08 15:57

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

FPGA 上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類深度神經(jīng)網(wǎng)絡(luò)，在處理大規(guī)模圖像識(shí)別任務(wù)以及與機(jī)器學(xué)習(xí)類似的其他問(wèn)題方面已大獲成功。在當(dāng)前案例

發(fā)表于 06-19 07:24

如何移植一個(gè)CNN神經(jīng)網(wǎng)絡(luò)到FPGA中？

）第二步：使用Lattice sensAI 軟件編譯已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)，定點(diǎn)化網(wǎng)絡(luò)參數(shù)。該軟件會(huì)根據(jù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和預(yù)設(shè)的FPGA資源進(jìn)行分析并給出性能評(píng)估報(bào)告，此外用戶還可以在軟件

發(fā)表于 11-26 07:46

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

為提升識(shí)別準(zhǔn)確率，采用改進(jìn)神經(jīng)網(wǎng)絡(luò)，通過(guò)Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過(guò)程分為兩步：圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。

發(fā)表于 12-23 08:07

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛應(yīng)用于圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割以及自然語(yǔ)言處理等領(lǐng)域。首先分析了典型卷積神經(jīng)網(wǎng)絡(luò)模型為提高其性能增加網(wǎng)絡(luò)深度以及寬度的模

發(fā)表于 08-02 10:39

NVIDIA GPU加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷

深度學(xué)習(xí)是推動(dòng)當(dāng)前人工智能大趨勢(shì)的關(guān)鍵技術(shù)。在 MATLAB 中可以實(shí)現(xiàn)深度學(xué)習(xí)的數(shù)據(jù)準(zhǔn)備、網(wǎng)絡(luò)設(shè)計(jì)、訓(xùn)練和部署全流程開(kāi)發(fā)和應(yīng)用。聯(lián)合高性能

發(fā)表于 02-18 13:31 ?1975次閱讀

卷積神經(jīng)網(wǎng)絡(luò)如何識(shí)別圖像

多層卷積層、池化層和全連接層。CNN模型通過(guò)訓(xùn)練識(shí)別并學(xué)習(xí)高度復(fù)雜的圖像模式，對(duì)于識(shí)別物體和進(jìn)行圖像分類等任務(wù)有著非常優(yōu)越的表現(xiàn)。本文將會(huì)詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)如何識(shí)別

發(fā)表于 08-21 16:49 ?1828次閱讀

卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn) 卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的區(qū)別

深度神經(jīng)網(wǎng)絡(luò)是一種基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法，其主要特點(diǎn)是由多層神經(jīng)元構(gòu)成，可以根據(jù)數(shù)據(jù)自動(dòng)調(diào)整神經(jīng)元之間的權(quán)重，從而實(shí)現(xiàn)對(duì)大規(guī)模數(shù)據(jù)進(jìn)行預(yù)

發(fā)表于 08-21 17:07 ?3791次閱讀

如何訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域的重要分支，廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域。然而，要使神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中取得良好效果，必須進(jìn)行有效的訓(xùn)

發(fā)表于 07-01 14:14 ?333次閱讀

卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks，簡(jiǎn)稱CNN）是一種深度學(xué)習(xí)模型，廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積

發(fā)表于 07-03 09:15 ?276次閱讀

bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎

BP神經(jīng)網(wǎng)絡(luò)（Backpropagation Neural Network）是一種常見(jiàn)的前饋神經(jīng)網(wǎng)絡(luò)，它使用反向傳播算法來(lái)訓(xùn)練網(wǎng)絡(luò)。雖然BP

發(fā)表于 07-03 10:14 ?508次閱讀

怎么對(duì)神經(jīng)網(wǎng)絡(luò)重新訓(xùn)練

重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)是一個(gè)復(fù)雜的過(guò)程，涉及到多個(gè)步驟和考慮因素。引言 神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型，廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)音識(shí)別等領(lǐng)域。然而，隨著時(shí)間的推移，數(shù)據(jù)分布可

發(fā)表于 07-11 10:25 ?376次閱讀

殘差網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎

殘差網(wǎng)絡(luò)（Residual Network，通常簡(jiǎn)稱為ResNet）是深度神經(jīng)網(wǎng)絡(luò)的一種，其獨(dú)特的結(jié)構(gòu)設(shè)計(jì)在解決深層網(wǎng)絡(luò)訓(xùn)練

發(fā)表于 07-11 18:13 ?865次閱讀

搜索歷史

通過(guò)YouTube視頻中的圖像和聲音來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)

評(píng)論

如何訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)來(lái)解決問(wèn)題？

詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

從AlexNet到MobileNet，帶你入門深度神經(jīng)網(wǎng)絡(luò)

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

如何移植一個(gè)CNN神經(jīng)網(wǎng)絡(luò)到FPGA中？

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

NVIDIA GPU加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷

卷積神經(jīng)網(wǎng)絡(luò)如何識(shí)別圖像

卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn) 卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的區(qū)別

如何訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎

怎么對(duì)神經(jīng)網(wǎng)絡(luò)重新訓(xùn)練

殘差網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎