0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟智能語音實(shí)現(xiàn)技術(shù)升級(jí),新增了5 個(gè)聲音角色

工程師鄧生 ? 來源:IT之家 ? 作者:玄隱 ? 2020-12-11 18:03 ? 次閱讀

12月11日消息 近期,微軟智能語音實(shí)現(xiàn)技術(shù)升級(jí),一次性新增了 5 個(gè)聲音角色供用戶自由選擇,覆蓋男女聲和不同年齡段,以及不同性格和聲線特征,包括陽光活潑的男青年(云希)和獨(dú)立自信的女青年(曉萱),溫柔大方的女中青年(曉涵)和多才多藝的女青年(曉墨),以及成熟睿智的女中老年(曉睿)。另外,中年男聲(云野)也同步更新了多種聲音風(fēng)格。他們與此前多個(gè)聲音角色一起,共同組成了微軟豐富的中文智能語音 “家族”。

下面是新增以及更新角色聲音 demo:

類似人類主播在播講一個(gè)有聲小說時(shí)會(huì)模擬不同的角色,微軟最新的智能語音也支持聲線變換,一人模擬多個(gè)角色,比如女生扮演男生,年輕人扮演老人的聲音,做到 “聲隨境轉(zhuǎn)”,大秀聲音 “演技”。同時(shí),不同的聲線變化也包含多種情感變換,讓角色更加活靈活現(xiàn)。

正是基于這些豐富多樣且功能強(qiáng)大的聲音角色,用戶得以自由組合出豐富的音頻產(chǎn)品。

IT之家獲悉,這些新聲音在開發(fā)過程中采用了最新的遷移學(xué)習(xí)技術(shù),僅利用少量表現(xiàn)力語料數(shù)據(jù),便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語音生成能力的源模型。該源模型通過對(duì)人類語音表現(xiàn)力特征的深入挖掘,獲取了穩(wěn)定性高,適應(yīng)性強(qiáng)的語音情感表征,極大地豐富了合成語音的表現(xiàn)力與可控性。微軟還進(jìn)一步構(gòu)建了基于角色和風(fēng)格變換的隱式表達(dá)空間,可以靈活地將多個(gè)不同的角色和風(fēng)格適應(yīng)到一個(gè)新的表現(xiàn)力豐富的說話人模型。

目前,微軟語音合成多角色可應(yīng)用在有聲書、兒童故事、新聞串講等多種場(chǎng)景,滿足不同的產(chǎn)品矩陣。

對(duì)于音頻內(nèi)容產(chǎn)業(yè)而言,微軟此次語音合成多角色技術(shù)更新不僅令聲音風(fēng)格更為多樣且具有感染力,也將進(jìn)一步降低音頻內(nèi)容生產(chǎn)成本、提高制作速度和質(zhì)量。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6537

    瀏覽量

    103809
  • 聲音
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    16206
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    771

    瀏覽量

    48657
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    微軟發(fā)布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發(fā)布智能辦公工具 OfficePLUS V 3.0 版本。全新升級(jí)的 OfficePLUS V 3.0 新增
    的頭像 發(fā)表于 06-27 09:26 ?589次閱讀

    智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    智能語音交互技術(shù)是指通過語音識(shí)別、語音合成和自然語言理解等技術(shù),
    的頭像 發(fā)表于 05-23 15:14 ?320次閱讀

    微軟網(wǎng)頁版PPT新增語音識(shí)別及字幕生成功能

    據(jù)報(bào)道,微軟計(jì)劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識(shí)別功能。此項(xiàng)功能將能夠監(jiān)控PowerPoint視頻中的聲音,進(jìn)而自動(dòng)生成字幕。
    的頭像 發(fā)表于 05-16 14:36 ?319次閱讀

    **十萬級(jí)口語識(shí)別,離線自然說技術(shù),讓智能照明更懂你**

    隨著人工智能技術(shù)的普及,智能家居設(shè)備開始走進(jìn)千家萬戶。而智能照明系統(tǒng)作為其不可或缺的一部分,占據(jù)著舉足輕重的地位。 所謂智能照明,就是通過語音
    發(fā)表于 04-29 17:09

    JXW56語音芯片,智能家居安全新升級(jí)

    智能升級(jí)煙霧語音IC
    的頭像 發(fā)表于 04-28 10:48 ?269次閱讀

    語音IC-智能語音芯片方案-您身邊的智選升級(jí)

    語音IC方案開發(fā)-智能語音升級(jí)OTP開發(fā)應(yīng)用場(chǎng)景
    的頭像 發(fā)表于 04-12 17:00 ?393次閱讀

    車內(nèi)語音識(shí)別技術(shù)智能駕駛中的應(yīng)用與前景

    一、引言 隨著智能駕駛技術(shù)的快速發(fā)展,車內(nèi)語音識(shí)別技術(shù)逐漸成為智能駕駛領(lǐng)域的研究熱點(diǎn)。語音識(shí)別
    的頭像 發(fā)表于 02-19 11:46 ?708次閱讀

    語音合成技術(shù)智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將
    的頭像 發(fā)表于 02-01 18:09 ?567次閱讀

    語音數(shù)據(jù)集:智能語音技術(shù)的燃料與推動(dòng)力

    隨著人工智能技術(shù)的不斷進(jìn)步,語音技術(shù)作為人機(jī)交互的重要方式,正在逐漸滲透到我們的日常生活中。而語音數(shù)據(jù)集作為智能
    的頭像 發(fā)表于 12-29 11:11 ?346次閱讀

    語音數(shù)據(jù)集:開啟智能語音技術(shù)的新篇章

    隨著人工智能技術(shù)的飛速發(fā)展,語音數(shù)據(jù)集在推動(dòng)智能語音技術(shù)的進(jìn)步中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)
    的頭像 發(fā)表于 12-29 11:06 ?550次閱讀

    WT588F02KD-24SS語音芯片集成數(shù)碼管顯示驅(qū)動(dòng)算法:聲音播放提示的智能升級(jí)

    語音技術(shù)的不斷發(fā)展中,一顆新型的WT588F02KD-24SS語音芯片引起了廣泛關(guān)注,其特色在于集成了可直接調(diào)用的數(shù)碼管顯示驅(qū)動(dòng)算法。本文將深入探討這一創(chuàng)新技術(shù)的好處,以及它對(duì)
    的頭像 發(fā)表于 12-15 08:38 ?319次閱讀
    WT588F02KD-24SS<b class='flag-5'>語音</b>芯片集成數(shù)碼管顯示驅(qū)動(dòng)算法:<b class='flag-5'>聲音</b>播放提示的<b class='flag-5'>智能</b><b class='flag-5'>升級(jí)</b>

    唯創(chuàng)知音WTR096A-16S語音芯片:引領(lǐng)喊話器聲音還原新時(shí)代

    隨著科技的不斷發(fā)展,聲音在各種場(chǎng)景中扮演著至關(guān)重要的角色。在喊話器領(lǐng)域,唯創(chuàng)知音的WTR096A-16S語音芯片以其卓越的性能和聲音還原度的提高,為喊話器應(yīng)用帶來了全新的體驗(yàn)。1.
    的頭像 發(fā)表于 12-06 09:26 ?516次閱讀
    唯創(chuàng)知音WTR096A-16S<b class='flag-5'>語音</b>芯片:引領(lǐng)喊話器<b class='flag-5'>聲音</b>還原新時(shí)代

    離線語音識(shí)別及控制是怎樣的技術(shù)

    引言:  隨著人工智能的飛速發(fā)展,離線語音識(shí)別技術(shù)成為了一項(xiàng)備受矚目的創(chuàng)新。離線語音識(shí)別技術(shù)能夠?qū)⑷说?b class='flag-5'>語
    發(fā)表于 11-24 17:41

    芯知識(shí) | Flash可更換聲音語音芯片—引領(lǐng)音頻IC技術(shù)革新的新篇章

    、優(yōu)勢(shì)以及應(yīng)用場(chǎng)景,展望其在未來科技發(fā)展中的潛力。 一、Flash可更換聲音語音芯片概述 Flash可更換聲音語音芯片是一種基于Flash存儲(chǔ)技術(shù)
    的頭像 發(fā)表于 11-23 11:47 ?443次閱讀

    語音識(shí)別技術(shù)智能客服領(lǐng)域的應(yīng)用與挑戰(zhàn)

    的應(yīng)用與挑戰(zhàn)。 二、語音識(shí)別技術(shù)智能客服領(lǐng)域的應(yīng)用 1.語音轉(zhuǎn)文字:語音識(shí)別技術(shù)可以將客戶的
    的頭像 發(fā)表于 10-25 10:37 ?601次閱讀