0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

編譯SDK新絕招快速賦能產(chǎn)品語音交互能力

思必馳 ? 來源:思必馳 ? 作者:思必馳 ? 2022-08-24 14:44 ? 次閱讀

編譯SDK新絕招

快速賦能產(chǎn)品語音交互能力

每個(gè)人或許都想過像科幻片里的主角一樣,用意念去解決工作問題。時(shí)代變遷,在AI時(shí)代,意念工作尚未實(shí)現(xiàn),但人類已經(jīng)能夠“動(dòng)口不動(dòng)手”通過語音去操控機(jī)器,讓一些枯燥的工作變得樂趣橫生。

目前,人機(jī)對(duì)話交互方案主要有純離線交互、在線交互和基于“云+端”的離在線交互。在線交互和離在線交互方案主要滿足智能音箱、車載語音等有云端交互需求的智能產(chǎn)品,純離線方案主要滿足臺(tái)燈、晾衣架、風(fēng)扇等一些語音交互需求較小的產(chǎn)品。在助力家居、家電產(chǎn)品智能化升級(jí)的進(jìn)程中,離線語音交互方案發(fā)揮了重要作用。

84f447c2-2360-11ed-ba43-dac502259ad0.jpg

思必馳智云譯芯(CUI)平臺(tái)可通過界面化的方式快速編譯SDK,助力家居、家電廠商快速打造離線低功耗語音芯片,讓產(chǎn)品更智能。在該平臺(tái),家居及家電廠商可選擇YT系列芯片,根據(jù)產(chǎn)品方案進(jìn)行軟硬件功能的配置,通過平臺(tái)的自動(dòng)化編譯功能,短時(shí)間內(nèi)即可輸出配套的SDK和固件,將固件燒錄至芯片,賦予產(chǎn)品語音交互能力。

目前,思必馳智云譯芯(CUI)平臺(tái)可滿足家居廠商以下幾類產(chǎn)品需求:

●有語音交互剛需的AI產(chǎn)品

做飯時(shí),手上沾滿水,此時(shí)卻需要去手動(dòng)開關(guān)吸油煙機(jī);勞累一天躺在床上,怎么也找不到空調(diào)遙控器;衛(wèi)生間,手動(dòng)沖水馬桶容易傳播細(xì)菌。

此時(shí)“打開吸油煙機(jī)”“打開空調(diào)”“沖水”等一些看似不起眼的簡(jiǎn)單語音操作,卻解放了人類雙手,在提升用戶體驗(yàn)中發(fā)揮了關(guān)鍵性作用。家電廠商將語音功能應(yīng)用到產(chǎn)品中,可為產(chǎn)品加分不少。

●無需依賴網(wǎng)絡(luò)的AI產(chǎn)品

在一些網(wǎng)絡(luò)信號(hào)不好的地區(qū)或密閉空間,通過云端進(jìn)行語音交互反饋,產(chǎn)品響應(yīng)速度比較慢,不適合晾衣架、臺(tái)燈、凈水器等僅需“開關(guān)””調(diào)節(jié)大小”“調(diào)節(jié)高低”等交互需求少的產(chǎn)品。相較于在線語音,離線語音可擺脫對(duì)網(wǎng)絡(luò)的依賴,反應(yīng)速度更快、功耗更低,需求匹配度更高。

●需控制成本的AI產(chǎn)品

智能家居產(chǎn)品“能聽會(huì)說”,離不開語音芯片的功勞,廠商可以選擇性價(jià)比更高的YT系列芯片,通過思必馳智云譯芯(CUI)平臺(tái),快速編譯 SDK 和固件,大大降低人力、物力與時(shí)間成本。

8504228c-2360-11ed-ba43-dac502259ad0.png

目前,思必馳智云譯芯(CUI)平臺(tái)賦能的語音芯片已經(jīng)覆蓋到各類家居場(chǎng)景,例如,廚房中的油煙機(jī)、集成灶、凈水器,客廳場(chǎng)景中的空調(diào)、電燈、風(fēng)扇、茶吧機(jī)、按摩椅、晾衣架等,助力家居產(chǎn)品的智能升級(jí)。

五大優(yōu)勢(shì),開發(fā)So Easy

為了降低開發(fā)門檻,讓開發(fā)更簡(jiǎn)單,思必馳近期已上線發(fā)音人音色訓(xùn)練平臺(tái),并對(duì)思必馳DUI標(biāo)注訓(xùn)練一體化平臺(tái)完成2.0升級(jí)。

思必馳智云譯芯(CUI)平臺(tái)以“低門檻、高效開發(fā)”為出發(fā)點(diǎn),通過簡(jiǎn)易的界面,進(jìn)一步提高開發(fā)效率,具有以下優(yōu)勢(shì):

8541ac88-2360-11ed-ba43-dac502259ad0.jpg

(1)默認(rèn)聲學(xué)模型:智云譯芯(CUI)平臺(tái)提供適用于多品類的默認(rèn)聲學(xué)模型,無需開發(fā)定制,可直接應(yīng)用。

(2)內(nèi)置豐富合成音:智云譯芯(CUI)平臺(tái)內(nèi)置了四十余種精品發(fā)音人,包括女聲、男聲、童聲,具有多種形象和風(fēng)格的 TTS 播報(bào),可以滿足風(fēng)扇、茶吧機(jī)、按摩椅等產(chǎn)品的多樣化需求。

(3)界面化定制SDK:用戶可在智云譯芯(CUI)平臺(tái),通過通俗易懂的界面進(jìn)行芯片Pin腳的功能設(shè)置、自定義喚醒詞和命令詞、選擇音色、設(shè)置離線回復(fù)語等。

(4)自動(dòng)化編譯:智云譯芯(CUI)平臺(tái)可根據(jù)界面上定義的硬件、軟件配置,自動(dòng)編譯 SDK 和固件,同時(shí)支持一鍵下載

(5)管理可視化:完成SDK配置后,可通過可視化的界面對(duì)編譯好的SDK進(jìn)行刪除、編輯等操作,簡(jiǎn)單易用。

在智能產(chǎn)品中,語音交互能力逐漸成為人機(jī)互動(dòng)的重要橋梁,語音芯片需求不斷增加,而語音芯片的“定制化、低功耗、高能效”優(yōu)勢(shì)也越發(fā)重要。思必馳智云譯芯(CUI)平臺(tái)將不斷更新迭代,賦能更多語音交互場(chǎng)景。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1015

    瀏覽量

    45607
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    282

    瀏覽量

    27951
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    270

    瀏覽量

    14252

原文標(biāo)題:思必馳智云譯芯平臺(tái),界面化定制SDK賦能離線語音交互場(chǎng)景

文章出處:【微信號(hào):思必馳,微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    騰訊云SDK如何使用,如何連接騰訊物聯(lián)網(wǎng)開發(fā)平臺(tái)。

    一 概述 SDK C SDK 采用模塊化設(shè)計(jì),分離核心協(xié)議服務(wù)與硬件抽象層,并提供靈活的配置選項(xiàng)和多種編譯方式,適用于不同設(shè)備的開發(fā)平臺(tái)和使用環(huán)境。 具備網(wǎng)絡(luò)通訊能力并使用 Linux
    的頭像 發(fā)表于 09-25 14:34 ?150次閱讀
    騰訊云<b class='flag-5'>SDK</b>如何使用,如何連接騰訊物聯(lián)網(wǎng)開發(fā)平臺(tái)。

    RK3568 編譯sdk技巧

    我司RK3568對(duì)外提供源代碼是以sdk的形式提供,包括但不僅限于uboot、kernel、buildroot、debian源碼。在編譯sdk的過程中往往需要安裝大量的第三方安裝包,同時(shí)也要保證宿主
    的頭像 發(fā)表于 08-30 11:44 ?339次閱讀
    RK3568 <b class='flag-5'>編譯</b><b class='flag-5'>sdk</b>技巧

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評(píng)測(cè)SDK合集)

    大模型語音問答、拍照識(shí)圖、大模型繪圖等豐富供示例,支持語音喚醒、多輪語音交互。 2智能對(duì)話除了大模型
    發(fā)表于 06-18 17:33

    WTK6900G語音識(shí)別芯片在車載語音交互氛圍燈上的應(yīng)用案例解析

    隨著智能汽車的快速發(fā)展,車載語音交互技術(shù)逐漸成為提升駕駛體驗(yàn)的關(guān)鍵技術(shù)之一。傳統(tǒng)的車載燈光控制系統(tǒng)往往依賴于手動(dòng)操作,不僅操作繁瑣,而且在駕駛過程中容易分散駕駛員的注意力。因此,開發(fā)一種高效、便捷
    的頭像 發(fā)表于 05-17 13:57 ?309次閱讀

    快速入門BlueNRG SDK固件開發(fā)流程

    本文檔指導(dǎo)用戶快速地對(duì) BlueNRG SDK 有一個(gè)直觀、清晰的認(rèn)識(shí),了解其軟件架構(gòu),以便順利地學(xué)會(huì)利用 SDK 開發(fā)自己的用戶固件。
    的頭像 發(fā)表于 01-13 10:43 ?1729次閱讀
    <b class='flag-5'>快速</b>入門BlueNRG <b class='flag-5'>SDK</b>固件開發(fā)流程

    思必馳語音算法與芯片的完美結(jié)合 人機(jī)交互

    工智能人機(jī)語音交互解決方案,具有高性能、低功耗等特點(diǎn)。該芯片通過采用軟硬融合的方法,使得TH1520具備快速賦予各類設(shè)備語音交互
    的頭像 發(fā)表于 12-29 11:43 ?803次閱讀
    思必馳<b class='flag-5'>語音</b>算法與芯片的完美結(jié)合 人機(jī)<b class='flag-5'>交互</b>

    DshanMCU-R128s2 SDK 入門

    本章介紹基礎(chǔ)的SDK編譯,打包等操作,方便快速上手 SDK 開發(fā)。
    的頭像 發(fā)表于 12-22 15:40 ?576次閱讀
    DshanMCU-R128s2 <b class='flag-5'>SDK</b> 入門

    離線語音識(shí)別技術(shù):掌控未來的語音交互

    離線語音識(shí)別技術(shù)的核心優(yōu)勢(shì)在于其獨(dú)立性和實(shí)時(shí)性。在沒有網(wǎng)絡(luò)連接的情況下,設(shè)備依然能夠迅速識(shí)別用戶的語音指令,實(shí)現(xiàn)各種功能。這使得語音交互更加自然、流暢,讓用戶隨時(shí)隨地享受智能科技帶來的
    的頭像 發(fā)表于 12-13 11:12 ?514次閱讀
    離線<b class='flag-5'>語音</b>識(shí)別技術(shù):掌控未來的<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    離線語音識(shí)別,“自然說”為產(chǎn)品

    相比于云端語音識(shí)別,離線語音識(shí)別技術(shù)具有更高的識(shí)別準(zhǔn)確率和更快的響應(yīng)速度。因?yàn)殡x線語音識(shí)別技術(shù)是在本地設(shè)備上運(yùn)行,不需要通過網(wǎng)絡(luò)傳輸語音數(shù)據(jù),因此可以避免網(wǎng)絡(luò)延遲和不穩(wěn)定等問題。
    的頭像 發(fā)表于 12-11 11:20 ?409次閱讀
    離線<b class='flag-5'>語音</b>識(shí)別,“自然說”為<b class='flag-5'>產(chǎn)品</b><b class='flag-5'>賦</b><b class='flag-5'>能</b>

    汽車多模態(tài)交互研究:大模型及多模態(tài)融合,推進(jìn)AI Agent上車

    語音交互方面:語音交互在AI大模型的下,功能愈加智能化、情感化。唇動(dòng)識(shí)別、聲紋識(shí)別等技術(shù)的上
    的頭像 發(fā)表于 11-24 16:12 ?1344次閱讀
    汽車多模態(tài)<b class='flag-5'>交互</b>研究:大模型及多模態(tài)融合,推進(jìn)AI Agent上車

    情感語音識(shí)別技術(shù)在人機(jī)交互中的應(yīng)用與展望

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機(jī)交互已經(jīng)滲透到日常生活的方方面面。情感語音識(shí)別作為人機(jī)交互中的關(guān)鍵技術(shù)之一,能夠通過分析人類語音中的情感信息實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)
    的頭像 發(fā)表于 11-22 10:40 ?677次閱讀

    解決星閃芯片BS25 1.0.T20.12版本開發(fā)工具默認(rèn)SDK無法編譯的問題

    本文介紹在BS25 1.0.T20.12版本開發(fā)工具下,默認(rèn)的SDK無法編譯的問題。
    的頭像 發(fā)表于 11-21 09:08 ?1157次閱讀
    解決星閃芯片BS25 1.0.T20.12版本開發(fā)工具默認(rèn)<b class='flag-5'>SDK</b>無法<b class='flag-5'>編譯</b>的問題

    情感語音識(shí)別在人機(jī)交互中的應(yīng)用與挑戰(zhàn)

    一、引言 情感語音識(shí)別是近年來人工智能領(lǐng)域的研究熱點(diǎn)之一,它能夠通過分析人類語音中的情感信息實(shí)現(xiàn)更加智能化和個(gè)性化的人機(jī)交互。本文將探討情感語音識(shí)別在人機(jī)
    的頭像 發(fā)表于 11-15 15:42 ?490次閱讀

    情感語音識(shí)別技術(shù)在人機(jī)交互中的應(yīng)用與挑戰(zhàn)

    ?一、引言 隨著人工智能技術(shù)的不斷發(fā)展,人機(jī)交互已經(jīng)成為了研究的熱點(diǎn)之一。情感語音識(shí)別技術(shù)作為人機(jī)交互中的重要組成部分,能夠通過識(shí)別人的語音情感,實(shí)現(xiàn)更加智能化和個(gè)性化的
    的頭像 發(fā)表于 11-09 15:27 ?732次閱讀

    解決BS25 1.0.T20.12版本開發(fā)工具默認(rèn)SDK無法編譯的問題

    本文介紹在BS25 1.0.T20.12版本開發(fā)工具下,默認(rèn)的SDK無法編譯的問題。
    的頭像 發(fā)表于 11-08 09:40 ?973次閱讀
    解決BS25 1.0.T20.12版本開發(fā)工具默認(rèn)<b class='flag-5'>SDK</b>無法<b class='flag-5'>編譯</b>的問題