国产一级一片免费播放放,av苍井空a片无限看

該團(tuán)隊(duì)的非實(shí)時(shí)系統(tǒng)是性能最好的，而它的實(shí)時(shí)系統(tǒng)在整個(gè)系統(tǒng)中排名第三，在實(shí)時(shí)系統(tǒng)中排名第二，盡管只使用了4%的CPU核心。

文 / Arvindh Krishnaswamy 原文鏈接： https://www.amazon.science/blog/amazon-team-takes-first-place-in-interspeech-2020-deep-noise-suppression-challenge

在電子語音通信中，噪音和混響不僅會損害語音清晰度，而且會導(dǎo)致聽者在長時(shí)間努力理解低質(zhì)量語音時(shí)感到疲勞。在COVID-19大流行期間，我們花在遠(yuǎn)程會議上的時(shí)間越來越多，這一問題比以往任何時(shí)候都更加重要。在今年的Interspeech會議上的深度噪聲抑制挑戰(zhàn)便是為了幫助解決這個(gè)問題的一個(gè)嘗試，分別在實(shí)時(shí)語音增強(qiáng)和非實(shí)時(shí)語音增強(qiáng)上進(jìn)行比賽。在19個(gè)團(tuán)隊(duì)中，Amazon取得了最好的結(jié)果，在非實(shí)時(shí)賽道上獲得了第一名(階段1 |階段2-final)，在實(shí)時(shí)賽道上獲得了第二名。

上面是一個(gè)有噪聲的語音樣本(上圖) 下面是被研究者的系統(tǒng)抑制了噪聲的同一個(gè)樣本(下圖) 為了滿足真實(shí)世界的需求，我們將實(shí)時(shí)輸入限制在CPU使用量的4%(在i7-8565U內(nèi)核上測量)，這遠(yuǎn)遠(yuǎn)低于競賽所允許的最大限度。然而，我們的實(shí)時(shí)輸入非常接近(0.03平均意見分?jǐn)?shù))的第一名，并且擊敗了其他非實(shí)時(shí)的輸入。 Amazon團(tuán)隊(duì)實(shí)時(shí)和非實(shí)時(shí)噪聲抑制結(jié)果的音頻示例可以在這里找到。我們還發(fā)表了兩篇論文(paper1-offline | paper2-real)來更詳細(xì)地描述我們的技術(shù)方法。在Interspeech中獲勝的技術(shù)已經(jīng)在Alexa通信公告和Drop in Everywhere功能中發(fā)布，并且從今天開始，我們的客戶也可以通過使用Amazon Chime蘋果macOS和微軟Windows客戶端來進(jìn)行視頻會議和在線會議。

優(yōu)化的感知傳統(tǒng)的語音增強(qiáng)算法使用人工調(diào)整的語音和噪聲模型，通常假設(shè)噪聲是恒定的。對于某些類型的噪音(例如汽車噪音)，在噪音不太大或低混響的環(huán)境下，這種方法工作得相當(dāng)好。不幸的是，它們經(jīng)常在非平穩(wěn)噪音上失敗，比如鍵盤噪音和雜音。因此，研究人員轉(zhuǎn)向了深度學(xué)習(xí)方法。

語音增強(qiáng)不僅需要從噪音和混響中提取原始語音，而且需要以一種人類耳朵感覺自然和愉快的方式進(jìn)行。這使得自動回歸測試變得困難，并使深度學(xué)習(xí)語音增強(qiáng)系統(tǒng)的設(shè)計(jì)復(fù)雜化。我們的實(shí)時(shí)系統(tǒng)實(shí)際上通過直接優(yōu)化了語音的感知特征(spectral envelope and voicing)，利用了人類的感知因素同時(shí)忽略了與感知無關(guān)的方面。由此產(chǎn)生的算法產(chǎn)生了最先進(jìn)的語音質(zhì)量，同時(shí)保持非常高的計(jì)算效率。對于非實(shí)時(shí)系統(tǒng)，我們采取了一種不妥協(xié)的方法，使用改進(jìn)的U-Net深度卷積網(wǎng)絡(luò)從增強(qiáng)的語音壓縮每一點(diǎn)可能的質(zhì)量，從而贏得了輸入挑戰(zhàn)。

一描繪經(jīng)被允許使用的研究人員的實(shí)時(shí)系統(tǒng)的百分比中央處理器核心降噪后的一語音樣本的平均意見分?jǐn)?shù)（MOS）的變化的圖像在深度噪聲抑制的挑戰(zhàn)中，經(jīng)過處理的音頻示例被盲發(fā)送給人類聽眾，由他們對其進(jìn)行評分，產(chǎn)生平均意見分?jǐn)?shù)(MOS)。在實(shí)時(shí)應(yīng)用程序中，復(fù)雜性和質(zhì)量之間總是需要權(quán)衡的。右邊的圖顯示了我們?nèi)绾瓮ㄟ^增加CPU需求來進(jìn)一步提高實(shí)時(shí)提交的質(zhì)量，或者通過犧牲一些質(zhì)量來進(jìn)一步節(jié)省CPU的使用。紅點(diǎn)表示提交挑戰(zhàn)的實(shí)時(shí)系統(tǒng)，圖像顯示了MOS分?jǐn)?shù)相對于不同CPU負(fù)載的變化。

人們普遍認(rèn)為，深度學(xué)習(xí)最終將對音頻處理產(chǎn)生深遠(yuǎn)影響。雖然仍有很多挑戰(zhàn)，比如數(shù)據(jù)增強(qiáng)，感知相關(guān)的損失函數(shù)或者處理看不見的情況，但未來依然非常令人興奮。

原文標(biāo)題：亞馬遜團(tuán)隊(duì)在Interspeech 2020深度噪聲抑制挑戰(zhàn)賽中獲得第一名

文章出處：【微信公眾號：LiveVideoStack】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10780

瀏覽量
210503
MOS

MOS

+關(guān)注

關(guān)注
31

文章
1227

瀏覽量
93203
噪音

噪音

+關(guān)注

關(guān)注
1

文章
168

瀏覽量
23860
亞馬遜

亞馬遜

+關(guān)注

關(guān)注
8

文章
2613

瀏覽量
83040
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5442

瀏覽量
120800

原文標(biāo)題：亞馬遜團(tuán)隊(duì)在Interspeech 2020深度噪聲抑制挑戰(zhàn)賽中獲得第一名

文章出處：【微信號：livevideostack，微信公眾號：LiveVideoStack】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

AI深度噪音抑制技術(shù)

AI深度噪音抑制技術(shù)通過深度學(xué)習(xí)算法實(shí)現(xiàn)了對音頻中噪聲

發(fā)表于 10-17 10:45 ?230次閱讀

FPGA做深度學(xué)習(xí)能走多遠(yuǎn)？

的發(fā)展前景較為廣闊，但也面臨一些挑戰(zhàn)。以下是一些關(guān)于 FPGA 在深度學(xué)習(xí)中應(yīng)用前景的觀點(diǎn)，僅供參考： ? 優(yōu)勢方面： ? 高度定制化的計(jì)算架構(gòu)：FPGA 可以根據(jù)

發(fā)表于 09-27 20:53

思爾芯賽題正式發(fā)布，邀你共戰(zhàn)EDA精英挑戰(zhàn)賽！

賽題發(fā)布COMPETITIONRELEASE2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽（原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”）現(xiàn)已正式拉開帷幕。作為核心出題企業(yè)之一思爾芯（S2C），已

發(fā)表于 08-03 08:24 ?423次閱讀

深度學(xué)習(xí)算法在集成電路測試中的應(yīng)用

隨著半導(dǎo)體技術(shù)的快速發(fā)展，集成電路（IC）的復(fù)雜性和集成度不斷提高，對測試技術(shù)的要求也日益增加。深度學(xué)習(xí)算法作為一種強(qiáng)大的數(shù)據(jù)處理和模式識別工具，在集成電路測試領(lǐng)域展現(xiàn)出了巨大的應(yīng)用潛力。本文將從

發(fā)表于 07-15 09:48 ?624次閱讀

深度學(xué)習(xí)中的時(shí)間序列分類方法

的發(fā)展，基于深度學(xué)習(xí)的TSC方法逐漸展現(xiàn)出其強(qiáng)大的自動特征提取和分類能力。本文將從多個(gè)角度對深度學(xué)習(xí)在時(shí)間序列分類中的應(yīng)用進(jìn)行綜述，探討常用

發(fā)表于 07-09 15:54 ?545次閱讀

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要分支，近年來在多個(gè)領(lǐng)域取得了顯著的成果，特別是在圖像識別、語音識別、自然語言處理等領(lǐng)域。然而，深度

發(fā)表于 07-09 10:50 ?294次閱讀

深度學(xué)習(xí)中的模型權(quán)重

在深度學(xué)習(xí)這一充滿無限可能性的領(lǐng)域中，模型權(quán)重（Weights）作為其核心組成部分，扮演著至關(guān)重要的角色。它們不僅是模型學(xué)習(xí)的基石，更是模型智能的源泉。本文將從模型權(quán)重的定義、作用、優(yōu)化、管理以及應(yīng)用等多個(gè)方面，深入探討

發(fā)表于 07-04 11:49 ?622次閱讀

深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法

深度學(xué)習(xí)模型在訓(xùn)練過程中，往往會遇到各種問題和挑戰(zhàn)，如過擬合、欠擬合、梯度消失或爆炸等。因此，對深度學(xué)習(xí)

發(fā)表于 07-01 11:41 ?580次閱讀

深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

在人工智能的浪潮中，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨(dú)特的方式推動著技術(shù)的進(jìn)步，為眾多領(lǐng)域帶來了革命性的變化。然而，盡管它們都屬于機(jī)器

發(fā)表于 07-01 11:40 ?977次閱讀

谷歌CEO皮查伊探討AI革命：影響深遠(yuǎn)，AI將融入日常工作

在訪談中，主持人首先詢問皮查伊為何選擇使用谷歌的AI，他回應(yīng)稱，AI將對我們的生活產(chǎn)生深遠(yuǎn)影響?！癆I的應(yīng)用多種多樣，能提升用戶體驗(yàn)，簡化工作流程，還能與AI進(jìn)行

發(fā)表于 05-28 15:00 ?530次閱讀

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

，這使其在 AI 應(yīng)用中面臨著一些挑戰(zhàn)。 Larzul 表示，想要解決這些問題的解決方案便是實(shí)現(xiàn)現(xiàn)場可編程門陣列 (FPGA)，這也是他們公司的研究領(lǐng)域。FPGA 是一種處理器，可以在制造后定制

發(fā)表于 03-21 15:19

詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

在如今的網(wǎng)絡(luò)時(shí)代，錯(cuò)綜復(fù)雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境，讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年，深度學(xué)習(xí)逐漸走進(jìn)人們的視線，通過深

發(fā)表于 01-11 10:51 ?1772次閱讀

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢

學(xué)習(xí)中究竟擔(dān)當(dāng)了什么樣的角色？又有哪些優(yōu)勢呢？一、GPU加速深度學(xué)習(xí)訓(xùn)練并行處理GPU的核心理念在于并行

發(fā)表于 12-06 08:27 ?1159次閱讀

深度學(xué)習(xí)在人工智能中的 8 種常見應(yīng)用

深度學(xué)習(xí)簡介深度學(xué)習(xí)是人工智能（AI）的一個(gè)分支，它教神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和推理。近年來，它解決復(fù)雜問題并在各個(gè)領(lǐng)域提供尖端性能的能力引起了極大的興

發(fā)表于 12-01 08:27 ?3116次閱讀

尋找未來智駕新動能，2023 全球智能汽車 AI 挑戰(zhàn)賽火熱進(jìn)行中

平臺技術(shù)的深度升級、大規(guī)模智駕模型的加速研發(fā)，帶來了對算力和人才需求的爆發(fā)式增長。立足未來的行業(yè)發(fā)展趨勢和布局，吉利汽車集團(tuán)、阿里云、NVIDIA 共同發(fā)起“2023 全球智能汽車 AI 挑戰(zhàn)賽” ，旨在匯聚來自全球各地的杰出 A

發(fā)表于 11-13 20:35 ?540次閱讀