0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)實現(xiàn)了腦機語言翻譯,那距離“意念交流”還有多遠(yuǎn)

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-10-29 20:51 ? 次閱讀

在《三體》當(dāng)中,大劉為三體文明設(shè)計了一種“思考即說話”的意念交流方式。在嚴(yán)酷的三體環(huán)境下,三體人正是依靠這種高效無誤的意念交流方式,實現(xiàn)了知識的無障礙共享、理性決策的高度統(tǒng)一,才能創(chuàng)造出如此高度發(fā)達(dá)的文明成果和整齊劃一的社會體制。

這一思路就如同去中心化的分布式計算機,只要建立聯(lián)接,每一臺獨立的計算機單元都可以獲知其他計算機單元的數(shù)據(jù),每一臺計算機單元理論上也都能夠共享共同的執(zhí)行命令。

反觀人類,我們就顯得有些“低能”了。首先,我們每個人的大腦都像是一塊白板,任何的數(shù)據(jù)信息都需要經(jīng)過大腦的發(fā)育和長期的經(jīng)驗訓(xùn)練才可能學(xué)到一星半點的知識;其次,我們的大腦又仿佛一個神秘黑箱,每個人都只能通過外在的語言、表情、姿態(tài)等信號來識別對方的動機,所謂知人知面不知心就是這個意思。再次,我們的數(shù)據(jù)信號的輸出又非常低效,我們只能以這種每秒鐘幾 KB 的語音、詞匯等信息來輸出想法,嚴(yán)重制約了溝通效率。

可能有人會質(zhì)疑,我們有必要向三體人那樣通過“意念”直接交流嗎?假如有一天我們的思想真的可以直接交流,即便有那么多的好處,同樣那些個人的貪念、惡意也無法隱瞞,這些對我們?nèi)祟悂碚f都可能是一場巨大災(zāi)難。

在高等文明來臨前,私欲和惡意就會將人類推進深淵。不過,這種推論仍然是杞人憂天。

一方面目前這種程度的“腦機接口”技術(shù)的實現(xiàn)還遙遙無期;另一方面,一旦人類動了“意念交流”的念頭,只要技術(shù)有任何可能的突破,好奇心都會驅(qū)使那些最聰明的人去實現(xiàn)它。至于技術(shù)出來是否“洪水滔天”,那就事后再說了。

當(dāng)前來看,腦機接口技術(shù)正在取得一些顯著的進展。最近一項可以稱之為腦機語言翻譯的技術(shù),又實現(xiàn)了新的突破。

3 月底,在Nature雜志的副刊《神經(jīng)科學(xué)》上面,來自美國加州大學(xué)舊金山分校的研究人員發(fā)表了一項新的研究,他們利用機器學(xué)習(xí)的方法,可以把腦電波信號直接翻譯成了有意義的語音和文字,翻譯準(zhǔn)確度得到大幅提高,最低錯誤率只有 3%。

這一結(jié)果是如何實現(xiàn)的,這一研究意味著什么,距離實現(xiàn)“意念交流”還有多遠(yuǎn)?這些正是我們接下來要討論的內(nèi)容。

人腦語言翻譯規(guī)律,機器學(xué)習(xí)很有一套

我們先來還原一下這項實驗的過程:研究人員找到四名患有癲癇的受試者,事先在其大腦的控制發(fā)音的腦區(qū)植入電極裝置。在實驗中,受試者需要先在一個有限的詞語庫里,反復(fù)地朗讀一些句子。電極裝置就可以在過程中捕捉朗讀瞬間活躍的腦電波信號。

(記錄大腦活動的顱內(nèi) ECoG 電極陣列)

然后,研究人員就可以在在收集到的信號和語句庫之間找規(guī)律,把跟控制發(fā)聲動作相關(guān)的腦電波信息提取出來。接著就可以通過機器學(xué)習(xí)對這些數(shù)據(jù)進行訓(xùn)練,使得 AI 可以在腦電波信號和語句庫之間建立起映射關(guān)系的模型。

最后,你只要在大腦中想象自己說出詞語庫內(nèi)的某一句話,AI 程序就可以根據(jù)訓(xùn)練后的映射關(guān)系,來識別你的內(nèi)心獨白了。

(通過聲波動作的腦電波信號識別語音)

由此可知,實驗得以成功的前提就是復(fù)雜的腦電波信號和明確的語詞之間,可以建立一套準(zhǔn)確的映射關(guān)系。那么基于數(shù)據(jù)標(biāo)記的有監(jiān)督的機器學(xué)習(xí)就很容易在訓(xùn)練中“找到規(guī)律”。

論文中還表明,AI 在學(xué)習(xí)識別人類腦電波的速度非???。實驗結(jié)果顯示,只要經(jīng)過大概 40 分鐘語音數(shù)據(jù)的簡單訓(xùn)練,語音相關(guān)的腦電波的 AI 翻譯,就可以達(dá)到比較高的準(zhǔn)確率了。其中效果最好的一名受試者,在僅僅經(jīng)過 9 次數(shù)據(jù)訓(xùn)練之后,詞錯率就降到只有 3%了。這個詞錯率已經(jīng)接近于迄今為止 AI 讀取人的想法的最佳表現(xiàn)。研究人員認(rèn)為,如果再經(jīng)過更多的訓(xùn)練,識別的效果還會進一步上升。

當(dāng)然,這套映射規(guī)則是限定語種、限定語句庫和限定測試者的基礎(chǔ)上完成的。

首先,在這次的研究中所使用的語句庫,只包含 100 多個詞匯,50-60 個句子,比我們?nèi)粘=涣鞯恼Z句庫少很多。

其次,腦電波的識別是在同一個人的人腦中完成的,也就是還不能證明,不同人之間,腦電波信號的識別規(guī)律是否具有遷移性。

很顯然同樣的一句話,受到不同語言背景、不同理解能力,甚至更為復(fù)雜的生理因素的影響,在不同的人腦中,形成的腦電波可能是完全不同的。

這可能就需要針對每個人的腦電波信號的特點,分別建立完全不同的 AI 識別模型。這也意味著大腦信號之間的直接交流幾乎很難實現(xiàn),仍然需要具有公共涵義的共同語言作為中介來實現(xiàn)思想的交流。這也是哲學(xué)家維特根斯坦提出的“沒有私人語言”的一種現(xiàn)實困境吧。

那么,如果 AI 對于腦電波的文本翻譯能夠達(dá)到實際應(yīng)用的程度,這項技術(shù)對于我們意味著什么呢?

讓失語者重新“說話”,

腦機語言翻譯大有作為

我們先來理解下這項腦機語言翻譯的真正意義。在人類的漫長進化史中,大腦的復(fù)雜和語言的出現(xiàn)成為一對互為因果的因素,幫助人類從嚴(yán)酷的自然環(huán)境中勝出,建立起復(fù)雜的文明和文化形態(tài)。也就是從人之為人的數(shù)萬年時間里,我們?nèi)祟惖淖钪饕换シ绞骄褪钦Z言,以及在語言基礎(chǔ)上衍生出的文字、信號等溝通方式。

而這次腦機語言翻譯的出現(xiàn),意味著人類的交互方式出現(xiàn)了新的形式,也就是由大腦信號直接轉(zhuǎn)化為語言信號。盡管如我們所說,這一方式離三體人的“意念交流”還有很大距離,但已經(jīng)是在向這一“意念交流”的方向前進了一大步。

至于現(xiàn)實意義呢?對于普通人而言,無論是誰也不會輕易嘗試在大腦中植入一塊電極裝置,再是日常語言交流仍然是最廉價、最高效地表達(dá)信息的方式。短期內(nèi),我們還是會習(xí)慣語音和手指作為信息輸入的主要手段。

那么,這項技術(shù)最靠譜的實際應(yīng)用場景就是針對那些失去語言能力或?qū)懽帜芰Φ幕疾∪巳毫?。事實上研究者的出發(fā)點正是幫助因為中風(fēng)偏癱、漸凍癥或者其他因神經(jīng)系統(tǒng)疾病而喪失語言功能和溝通能力的人們,恢復(fù)語言溝通能力。而 AI 腦機語言翻譯,就成為他們重新獲得與世界溝通的工具。

(腦控打字)

在這項技術(shù)實現(xiàn)之前,幫助失語者溝通的主要腦機接口技術(shù)就是“腦控打字”,也就是通過采集腦信號,控制光標(biāo)選擇字母,然后組成單詞后輸出。這個領(lǐng)域做到最好效果的 Facebook 也只能做到每分鐘最多打 8 個單詞。

在腦控打字難以突破效率難關(guān)的情況下,AI 腦機語言翻譯可以直接完成腦電波信號到語言轉(zhuǎn)化,效率一下子提高到了正常人的語速水平。這讓失語者進行語言輸出產(chǎn)生了飛躍的進步。

但現(xiàn)實問題仍然存在,因為這些測試者都是可以正常說話的,那么從他們身上采集數(shù)據(jù)訓(xùn)練而成的 AI 算法,是否可以應(yīng)用到中風(fēng)病人或者漸凍人身上呢?

正如我們上面所述,每個人的腦電波的信號采集可能存在一些差異,那么 AI 算法可能會因人而異,因此很難進行不同人之間的遷移。

那么就目前來說,只能是在有中風(fēng)或漸凍癥發(fā)作前或嚴(yán)重前,提前采集他們的腦電波信號,形成專屬的 AI 翻譯模型,才可能真正幫助患者。

腦機語言翻譯都來了,

那“意念交流”還有多遠(yuǎn)?

相較于我們習(xí)以為常的 AI 語音識別技術(shù),AI 腦機語言翻譯看起來就已經(jīng)非常令人驚嘆了,那么要是達(dá)到用“意念交流”的腦腦交互的水平,那就有點天方夜譚的感覺了。

所謂的腦腦交互,那就是不再借助語言而直接依靠腦電波信號進行人際之間的溝通。這種就類似于三體人的思想共享,《阿凡達(dá)》里的人獸聯(lián)機的技術(shù)。

一般來說,我們通過語言傳輸大腦信息,必然就存在著信息缺失、傳輸損耗以及效率低下的問題。翻譯成人話就是,我們經(jīng)常詞不達(dá)意、左耳朵進右耳朵出,寫篇文章好幾天,聊個天就大半天過去。

腦腦交互則可以大幅提升人們之間交流的速度和信息量,能夠保留和傳輸真實無損的大腦信息,避免誤會,從而根本改變?nèi)祟惖膮f(xié)作方式。

腦腦交互并非完全的空想,現(xiàn)在也有一些基礎(chǔ)的實驗證實了這一可能性。比如 2018 年華盛頓大學(xué),通過以下實驗,讓三個相互隔離的人帶上了腦電圖頭盔這種非侵入式腦機設(shè)備,純靠看和想,共同協(xié)作,來完成俄羅斯方塊游戲。其中 2 個人負(fù)責(zé)觀察底部情況和下落的方塊形狀,操控手柄的人則完全不知道狀況,只能讓這兩個人產(chǎn)生腦電波信號,通過一種叫 TMS 的磁刺激方式來傳遞信息給操控者的大腦,讓其大腦產(chǎn)生操作的指令。

經(jīng)過 5 組不同的實驗中,這種腦腦交互傳達(dá)信息的準(zhǔn)確率達(dá)到了 81.25%。雖然還遠(yuǎn)遠(yuǎn)達(dá)不到人類之間傳輸信息需要的準(zhǔn)確率和復(fù)雜度,但是這一實驗帶來腦腦交互的一種可能性。

但是可能性并不意味著現(xiàn)實性。這一點可能性之后仍然要面對大腦這個神秘黑箱制造的無盡難題。

(大腦皮層的語言分區(qū))

目前,神經(jīng)科學(xué)家已經(jīng)知道人類的認(rèn)知功能跟大腦的分區(qū)有關(guān)。研究人員可以通過對大腦神經(jīng)活動的空間和時間信號進行高分辨率的數(shù)據(jù)采集,并配合機器學(xué)習(xí)算法將各種感知覺、運動、語言等高級認(rèn)知功能所對應(yīng)的神經(jīng)信號互相分離出來。然后,可以實現(xiàn)像一些基本的腦機語言翻譯這樣的功能。

但是真正實現(xiàn)語言的解碼翻譯其實還要面臨眾多的困難。除了上面提到的聲波信號對于每個人的腦區(qū)的刺激會因人而異之外,由于世界上有上萬種的語言及方言,同一個語義在不同語言和方言下可能對應(yīng)著不同的腦電波信號。甚至于不同年齡、不同成長環(huán)境,不同的情緒狀態(tài)都有可能導(dǎo)致完全不同的腦電波信號。

此外,我們閱讀文字也可以引發(fā)語言相關(guān)的腦電波活動,這肯定與語音刺激的反應(yīng)又不相同。同樣,不同的文字形態(tài)又會帶來不同的腦電波信號模式。

也就是實驗室狀態(tài)下的無干擾的測試結(jié)果,極難應(yīng)用到現(xiàn)實場景當(dāng)中。要實現(xiàn)如此多復(fù)雜的腦電波語言翻譯,其難度可能比全世界統(tǒng)一語言和文字的難度還大。那么想要實現(xiàn)后者,你們認(rèn)為其可能性有多大呢?

那么,對于腦腦交互呢?我們是否可以先繞開語言翻譯的這座大山,先去實現(xiàn)一些非語言化或者先于語言化的腦信號交互呢?比如,找到人類共同的一些辨識方向、情緒以及一些本能應(yīng)激反應(yīng)的腦電波信號,通過 AI 學(xué)習(xí),實現(xiàn)信號的解碼和共享。

這確實是有可能的,比如上面俄羅斯方塊游戲的方向測試,以及在一些大鼠身上做的一些頭部預(yù)期運動的信號的測試。但是,再復(fù)雜一些,就可能會必須要從腦電波信號轉(zhuǎn)碼為語言(語音或文字)來進行交互了,不然,這些探測到的腦電波數(shù)據(jù)就僅僅是一些物理信號,而不能具有任何的信息價值。

這可能還是應(yīng)了那個哲學(xué)命題,如果意識不通過語言來表達(dá),我們怎么意識到這個意識呢?

在一個需要靠講故事來撐市值的新型產(chǎn)業(yè),腦機語言翻譯的實現(xiàn),確實再一次給腦機接口的技術(shù)發(fā)展和商業(yè)化注入了一劑強心針。當(dāng)然,我們也要冷靜地看到這一技術(shù)仍然只具有“實驗室”的成功價值,其用于商業(yè)化方面還需要腦機接入的材料成本、安全性,信號檢測的準(zhǔn)確度,翻譯模型的遷移性和普適性等各個方面走向成熟。

至于我們試圖去回答的“意念交流”的腦腦交互,大家其實也看到了,前途茫茫,困難依舊重重,甚至還有一座語言的大山橫亙在人類面前。

畢竟,上帝也是靠“說”才創(chuàng)造了世界,而不是靠“想”創(chuàng)造的世界。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學(xué)習(xí)

    今天來學(xué)習(xí)語言模型在自然語言理解方面的原理以及問答回復(fù)實現(xiàn)。 主要是基于深度學(xué)習(xí)和自然語言處理
    發(fā)表于 08-02 11:03

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 俯瞰全書

    ,了解此書的主要內(nèi)容: 書分四篇,基礎(chǔ)、入門、進階和展望。 基礎(chǔ)篇從人工智能起源開始、之后又介紹機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和大語言模型的基礎(chǔ)知識,如果讀者
    發(fā)表于 07-21 13:35

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領(lǐng)域,DeepL再次以其創(chuàng)新實力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語言模型。這一里程碑式的進展,不僅鞏固DeepL作為頂尖
    的頭像 發(fā)表于 07-19 15:56 ?552次閱讀

    ESP32的BLE最大通信距離多遠(yuǎn)?

    ESP32-S3官方模塊的藍(lán)牙在PCB板載天線,外置天線的不同情況下,125K,500K,1M,2M的不同速率下,通信距離最大可達(dá)多遠(yuǎn)? ESP32的BLE最大通信距離多遠(yuǎn)?
    發(fā)表于 07-01 07:22

    網(wǎng)橋傳輸距離多遠(yuǎn)?

    網(wǎng)橋(Bridge)是一種早期的兩端口二層網(wǎng)絡(luò)設(shè)備,用來連接不同網(wǎng)段。網(wǎng)橋的兩個端口分別有一條獨立的交換信道,不是共享一條背板總線,可隔離沖突域。 網(wǎng)橋傳輸距離多遠(yuǎn)? 網(wǎng)橋的傳輸距離因傳輸環(huán)境和設(shè)備
    的頭像 發(fā)表于 04-02 15:57 ?1714次閱讀

    ST60 GHz RF收發(fā)器能傳輸多遠(yuǎn)距離?

    看了ST60 GHz RF收發(fā)器之后,同時集成發(fā)送和接收路徑,想知道ST60能傳輸多遠(yuǎn)距離?哪位大神知道!
    發(fā)表于 04-02 06:59

    馬斯克旗下接口公司Neuralink展示首位四肢癱瘓者意念控制?

    阿博面對眾多觀看直播的網(wǎng)友稱,“如果你們看到光標(biāo)的運動,便是我在操控,這種感覺真的很棒!”在演示過程中,阿博詳細(xì)闡述了如何借助系統(tǒng)掌控鼠標(biāo)移動方向,并感嘆這項技術(shù)給他帶來的奇妙體驗。
    的頭像 發(fā)表于 03-21 10:49 ?550次閱讀

    清華團隊微創(chuàng)無線接口實現(xiàn)患者意念操作

    在此次突破中,北京天壇醫(yī)院神經(jīng)外科賈旺教授團隊攜手清華大學(xué)洪波教授團隊,運用微創(chuàng)接口幫助高位截癱患者實現(xiàn)意念控制光標(biāo)。這標(biāo)志著我國在該領(lǐng)域取得又一里程碑式進步。
    的頭像 發(fā)表于 02-25 10:37 ?603次閱讀

    我國發(fā)布首部《接口研究倫理準(zhǔn)則》

    接口是一種新穎的交叉技術(shù),能夠在大腦與外部設(shè)備間創(chuàng)建信息通道,實現(xiàn)他們的直接信息交換。其過程為記錄顱內(nèi)或外的大腦神經(jīng)活動,使用機器
    的頭像 發(fā)表于 02-18 14:20 ?574次閱讀

    馬斯克旗下公司完成首例接口設(shè)備人體移植

    近日,馬斯克的接口公司Neuralink宣布一項令人矚目的進展:他們已經(jīng)完成了首款產(chǎn)品的研發(fā),并將其命名為“心靈感應(yīng)”(Telepathy)。這款產(chǎn)品的核心功能是讓用戶僅通過意念
    的頭像 發(fā)表于 01-31 09:55 ?530次閱讀

    雷達(dá)模塊支持多遠(yuǎn)的感應(yīng)距離

    雷達(dá)模塊支持多遠(yuǎn)的感應(yīng)距離? 雷達(dá)模塊是一種使用無線電波進行距離測量和目標(biāo)檢測的設(shè)備。它廣泛應(yīng)用于航空、航天、軍事、車輛導(dǎo)航、智能交通系統(tǒng)等領(lǐng)域。不同類型的雷達(dá)模塊可以實現(xiàn)不同的感應(yīng)
    的頭像 發(fā)表于 12-12 15:06 ?868次閱讀

    基于機器翻譯增加的跨語言機器閱讀理解算法

    近日,阿里云人工智能平臺 PAI 與華南理工大學(xué)朱金輝教授團隊、達(dá)摩院自然語言處理團隊合作在自然語言處理頂級會議 EMNLP2023 上發(fā)表基于機器翻譯增加的跨語言
    的頭像 發(fā)表于 12-12 10:28 ?527次閱讀
    基于<b class='flag-5'>機器翻譯</b>增加的跨<b class='flag-5'>語言</b><b class='flag-5'>機器</b>閱讀理解算法

    接口如何實現(xiàn)人機互聯(lián)?

    如今人們廣泛認(rèn)知到的接口形式,還要來自于1973年亞克·達(dá)維爾教授提出的概念:“可以讓大腦與外部機器直接連接。讓電腦電信號與大腦電信號相互轉(zhuǎn)換,實現(xiàn)大腦和
    的頭像 發(fā)表于 11-22 17:32 ?1087次閱讀

    什么是接口技術(shù)?接口的原理和分類

    根據(jù)神經(jīng)科學(xué)研究,在大腦產(chǎn)生神經(jīng)沖動時,大腦神經(jīng)系統(tǒng)的電磁活動會發(fā)生相應(yīng)變化,并會體現(xiàn)出某種節(jié)律和空間分布的特征。因此,接口的基本原理包括三個步驟,即記錄、翻譯和傳達(dá)。
    的頭像 發(fā)表于 11-03 15:28 ?6180次閱讀
    什么是<b class='flag-5'>腦</b><b class='flag-5'>機</b>接口技術(shù)?<b class='flag-5'>腦</b><b class='flag-5'>機</b>接口的原理和分類

    手機拍照離光學(xué)變焦還有多遠(yuǎn)

    電子發(fā)燒友網(wǎng)站提供《手機拍照離光學(xué)變焦還有多遠(yuǎn).doc》資料免費下載
    發(fā)表于 11-02 11:28 ?0次下載
    手機拍照離光學(xué)變焦<b class='flag-5'>還有</b><b class='flag-5'>多遠(yuǎn)</b>