0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

腦機接口技術 不說話也能表達言語

Gv1N_smartman16 ? 來源:fqj ? 2019-06-06 14:07 ? 次閱讀

以腦機接口的方式,捕捉大腦電波,然后實現(xiàn)打字的目的,再進行語音合成輸出,并不是一個很難的課題。

去年世界機器人大會上,清華大學研發(fā)的“動態(tài)窗穩(wěn)態(tài)視覺誘發(fā)電位腦機接口系統(tǒng)”就“主導”了一場通過腦機接口來打字的比賽。參賽者們只要在頭上戴上相關設備,將注意力集中到電腦屏幕上的虛擬鍵盤中的字母上,腦電波就會被捕捉,然后將對應的字母顯示出來。

字母打得多了,字也就打出來了。

這種方式和對霍金的一小塊兒肌肉進行捕捉原理上基本上沒有差別,都是通過捕捉人對字母的強烈反應而實現(xiàn)語言的輸出。不同之處在于,霍金由世界頂尖科技團隊開發(fā),可以采用單詞聯(lián)想的方式提高打字的效率。

這種方法聽起來確實很高端,但也存在一定的不足。

第一,打字的速度較慢。英語還好一點,只要字母拼全就完成了打字的過程;而漢語還需要進行轉化,遇到同音詞還需要進一步進行選擇,這就需要進行二次腦電波捕捉。逐字的打字方法令其在單位時間內能夠打出的文字相當有限。

第二,對參與者的精神集中有要求,而且抗干擾較弱。腦電波是非常敏感而且活躍的。一方面人如果注意力無法高度集中,系統(tǒng)就將很難對字母進行定位;另一方面人的大腦在看到字母的時候往往會不由自主地產生聯(lián)想,比如看到“c”會想到“copy”或者“car”等詞,這也會對系統(tǒng)識別產生干擾。

正常人想要順利打個字都極度耗費體力,就更不要說那些身患阿爾茲海默癥或者其他病癥導致無法言語的病人了?;艚鹬皼]有采用類似的方案,就是考慮到無法承受如此的體力消耗。

當然,個人認為這種方案雖然目前僅僅還停留在科技“趣聞”或者“獵奇”的階段,但其本身是一種突破性的。它的意義并不在于有多好用或是取得了多少實際的效果,而是在于探索出了一條腦機接口的新的道路。至少讓人們看到,通過腦機接口來實現(xiàn)“意念”輸處文本甚至是語音輸出是完全可行的。

而這種可行性,被加州大學舊金山分校的一項研究成果,進一步證實并且加強。

把腦電波合成為語音,總共分幾步?

加州大學舊金山分校的神經科學家的解決方案,是從解剖學的角度出發(fā),模擬真人發(fā)音時大腦發(fā)出的口腔喉嚨肌電信號對發(fā)音系統(tǒng)的調動,比如在發(fā)“啊”這個音的時候,嘴唇、下巴、舌頭和喉嚨以及其他成分的動作,然后合成相應的語音。

那么,要把腦電信號合成為語音,總共分幾步呢?

第一步,樣本收集。研究者讓5名完全健康的志愿者在UCSF Epileps接受了一項外科手術,在其大腦中臨時植入了一塊電極。接下來,志愿者被要求大聲朗讀指定的數(shù)百句話。在朗讀的過程中,科學家記錄了不同語言文字在朗讀過程中在大腦區(qū)域內的活動信號。

第二步,破譯信號。通過循環(huán)神經網絡(RNN)的不斷學習,研究者將大腦神經信號轉換成了發(fā)音器官動作的信號,這些信號與發(fā)音器官的動作直接相關,比如嘴唇、下巴、舌頭、喉嚨等。

第三步,虛擬聲道。虛擬不同聲音所產生的聲道運動,就像漢語中雙唇音、唇齒音、舌尖中音等所需要調動的不同發(fā)音部位一樣,正常來說,如果模擬的發(fā)音運動模式和人正常說話時一樣,那么所發(fā)的音也一定是一樣的。

最后一步,就可以進行語音輸出了。

為了測試虛擬語音的流暢性,研究者們在亞馬遜的任務眾包平臺Mechanical Turk上招募聽眾來對這些合成語音的325個單詞和101個句子進行辨認,結果大部分的單詞和句子都被人們成功識別。

這意味著,不用動嘴,通過腦電波來實現(xiàn)語音輸出,完全是有可能的。這對于中風、腦損傷或其他疾病而導致的語言功能障礙的輔助,將具有里程碑式的意義。

技術落地尚遠,“腦機”仍需努力

相較于“字母表模式”,這項研究的優(yōu)勢是顯而易見的。

首先,語音合成速度會得到大大提高。字母表模式下,比如通過眼動或者肌肉塊兒的捕捉,每分鐘能成功輸出10個單詞左右。對于正常交流而言,一分鐘說10個字,一方面的確很不便,另一方面確實很考驗人的耐心。而通過聲道模擬語音,每分鐘輸出的單詞可以達到150個,這與自然語言中每分鐘100-150個單詞已經幾乎沒有差別。實現(xiàn)正常人般的交流,可以說毫無壓力。

其次,相較于捕捉大腦信號對字母的感應,語音產生的機電信號更為強烈,也就更容易捕捉。所以,這在很大程度上可以緩解因信號識別緩慢而導致語音合成效率低下和患者焦慮的問題,更進一步而言,也增加了患者的接受度。

當然,作為一項尚未走出實驗室的技術,它的缺陷也明顯存在。

第一,人工智能識別的準確率和數(shù)據的豐富程度呈正相關。也就是說,利用RNN去進行學習破譯腦電波信號并將其轉化為發(fā)音器官動作的信號,要想實現(xiàn)較高的正確率,就需要大量的數(shù)據。目前的現(xiàn)實是,雖然語音輸出的速度很快,但也只有一半的句子會被識別出來。就像說話的時候嘴里含著一口水,必然是會影響交流的感受和效率的。

第二,不同語言、不同方言之間的通用性很弱,即便是同一種語言,由于方言的差異性也會導致發(fā)音的時候各部位的運動存在著細節(jié)性的發(fā)音差異,會導致語音合成的混淆。比如在漢語中“六”的發(fā)音,不同地域之間的差別達到了二十多個。為一種語言建立一種樣本?似乎有點過于繁瑣。

所以,如果能找到一種更好的方法能夠增強該技術的通用性尚可,如果僅僅停留在這個層面,其產品很可能無法走入尋常百姓家,而是成為顯貴人群的私人訂制。

研究者們自己也承認,聲道運動和語音的最終形成是一個復雜的關系,目前該系統(tǒng)對合成較慢的發(fā)音比較擅長,對說話者的節(jié)奏和語調有一定的要求,距離最終的應用,仍然是有很長的一段路要走。

但不管怎樣,這也應該屬于腦機接口技術的一次重大突破了。試想在不遠的將來,你只需要動動腦子,就會有準確無誤的文本或者語音轉化出來,人機交互將會變得多么順暢而自然;而對于那些長期存在語言表達障礙的弱勢群體而言,或許“福音”二字,已經遠不足以表達其所蘊含的難以估量的價值。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音合成
    +關注

    關注

    2

    文章

    87

    瀏覽量

    16126
  • 腦電波
    +關注

    關注

    0

    文章

    52

    瀏覽量

    16963

原文標題:你盡管“動腦”,話交給腦機接口來說

文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    接口重大進展,AI模仿讓患者發(fā)聲!上游芯片技術在不斷研發(fā)

    電子發(fā)燒友網報道(文/李彎彎)近日,接口技術又取得重大進展,美國加州大學戴維斯分校健康中心開發(fā)出一款新型
    的頭像 發(fā)表于 08-17 00:03 ?7080次閱讀
    <b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口</b>重大進展,AI模仿讓患者發(fā)聲!上游芯片<b class='flag-5'>技術</b><b class='flag-5'>也</b>在不斷研發(fā)

    接口初創(chuàng)公司Synchron稱AI將對設備發(fā)揮重要作用

    接口技術的前沿探索中,初創(chuàng)公司Synchron Inc.正引領一場革命性的變革。該公司近期宣布,他們正攜手OpenAI的最新人工智能模型,共同開發(fā)一項創(chuàng)新技術,旨在通過植入式設備
    的頭像 發(fā)表于 07-16 14:42 ?477次閱讀

    工信部引領未來科技浪潮,接口標準化技術委員會籌建方案揭曉

    在科技日新月異的今天,接口技術作為連接人類大腦與外部設備的橋梁,正逐步從科幻概念走向現(xiàn)實應用的前沿。7月2日,這一重要領域迎來了里程碑式的進展,工業(yè)和信息化部官方網站正式發(fā)布了“工業(yè)和信息化部
    的頭像 發(fā)表于 07-02 14:13 ?299次閱讀

    接口技術如何獲取信號至關重要

    接口又可分為輸出型和輸入型兩種。輸出型接口主要由大腦向外部設備輸出通信或控制指令,在不依
    的頭像 發(fā)表于 04-09 11:16 ?626次閱讀

    馬斯克公布首位接口受試者新進展!微美全息(WIMI.US)深入研究開啟智能革命性飛躍!

    消息顯示,接口初創(chuàng)公司Neuralink的創(chuàng)始人馬斯克表示,第一位植入Neuralink接口技術
    的頭像 發(fā)表于 03-15 14:46 ?340次閱讀

    基于MEMS超聲波方案的“真”無線植入式接口技術

    2024年1月30日,埃隆·馬斯克通過社交平臺發(fā)布消息,聲稱Neuralink公司成功進行了首例接口人體植入手術,被植入者恢復狀況良好;
    的頭像 發(fā)表于 03-15 09:46 ?809次閱讀
    基于MEMS超聲波方案的“真”無線植入式<b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口技術</b>

    接口:探尋大腦活動新解碼技術

    據最新研究,2月20日,英國知名學術期刊《自然》(Nature)特別報道了未來接口的發(fā)展趨勢及潛在影響力。研究強調,
    的頭像 發(fā)表于 02-25 15:50 ?635次閱讀

    馬斯克接口技術迎來歷史性時刻

    馬斯克在X平臺上發(fā)布帖子稱,首位接受Neuralink接口植入的人類患者恢復狀況良好。初步研究成果顯示,神經元尖峰檢測充滿希望。
    的頭像 發(fā)表于 02-22 10:55 ?888次閱讀

    接口,帶火傳感器

    接口研究倫理指引》,以指導接口研究合規(guī)開展。以上種種,都揭示了
    的頭像 發(fā)表于 02-21 09:54 ?371次閱讀

    光纖在植入式接口中的應用

    光纖在植入式接口中的應用? 光纖技術作為一種傳輸信息的重要媒介,已經在各個領域得到了廣泛的應用。而在現(xiàn)代醫(yī)學領域中,光纖技術
    的頭像 發(fā)表于 01-09 14:41 ?367次閱讀

    接口案例:如何用超聲波技術實現(xiàn)無創(chuàng)“讀

    這一研究發(fā)現(xiàn)為確認超聲接口技術的可行性,以及新型微創(chuàng)(硬膜外)接口技術發(fā)展提供重要指引依
    的頭像 發(fā)表于 01-04 11:00 ?820次閱讀
    <b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口</b>案例:如何用超聲波<b class='flag-5'>技術</b>實現(xiàn)無創(chuàng)“讀<b class='flag-5'>腦</b>”

    康復市場需求強烈,接口相較其他方法康復效果最好

    、上海傅利葉智能科技有限公司副總裁楊志豪就康復機器人的優(yōu)勢,市場前景和挑戰(zhàn)等進進行了深度探討。 ? 臻泰智能:相比其他康復方法,接口療效最好 ?
    的頭像 發(fā)表于 12-22 09:05 ?1632次閱讀
    康復市場需求強烈,<b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口</b>相較其他方法康復效果最好

    一場走在科技最前沿的頭腦風暴:接口技術的機遇與挑戰(zhàn)

    (電子發(fā)燒友網原創(chuàng)、2023年12月21日)在今日海南省??谑信e行的第二屆南渡江智慧醫(yī)療與康復產業(yè)高峰論壇上,接口技術無疑是峰會上最受關注的技術之一。
    的頭像 發(fā)表于 12-21 17:08 ?1810次閱讀
    一場走在科技最前沿的頭腦風暴:<b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口技術</b>的機遇與挑戰(zhàn)

    微機原理與接口技術教程

    電子發(fā)燒友網站提供《微機原理與接口技術教程.rar》資料免費下載
    發(fā)表于 11-20 10:29 ?0次下載
    微機原理與<b class='flag-5'>接口技術</b>教程

    什么是接口技術?接口的原理和分類

    根據神經科學研究,在大腦產生神經沖動時,大腦神經系統(tǒng)的電磁活動會發(fā)生相應變化,并會體現(xiàn)出某種節(jié)律和空間分布的特征。因此,接口的基本原理包括三個步驟,即記錄、翻譯和傳達。
    的頭像 發(fā)表于 11-03 15:28 ?6173次閱讀
    什么是<b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口技術</b>?<b class='flag-5'>腦</b><b class='flag-5'>機</b><b class='flag-5'>接口</b>的原理和分類