0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google:將AI 應(yīng)用到語言翻譯上,進(jìn)而彌平語言不通的問題

yrlT_lianggezhi ? 2018-01-29 14:28 ? 次閱讀

Google 的使命是匯集全球資訊,并且讓所有人都能使用這些資訊,不過要能理解各式資訊,最困難的就是語言隔閡,因此在東京舉辦#MadeWithAI 亞太區(qū)媒體活動請來了Google 語言研究計畫總經(jīng)理Linne Ha 來談?wù)勗趺磳I 應(yīng)用到語言翻譯上,進(jìn)而彌平語言不通的問題。

受惠于智慧型手機的普及,網(wǎng)路人口在最近這幾年高速成長,不過網(wǎng)路上有接近50% 的內(nèi)容仍是以英文為主,對于非以英文為母語的人來說,想要獲得資料就多了一道門檻,能讓每個人自在的用自己的原生語言在網(wǎng)路上搜集或提供資料是Google 的目標(biāo),因此在推動語言翻譯或發(fā)展上Google 做了非常多的努力。

▲Google語言研究計畫總經(jīng)理Linne Ha。

推動各種語言上網(wǎng),統(tǒng)一碼(Unicode)是重點

不同語言要能在網(wǎng)路上流動,最重要的就是該語言要能被閱讀,若是出現(xiàn)亂碼或空白文字就容易成為閱讀或理解的障礙,因此Google 長期和統(tǒng)一碼(Unicode)聯(lián)盟合作,鼓勵更多國家利用統(tǒng)一碼的編碼系統(tǒng)上網(wǎng),例如Google 大力鼓勵緬甸不要再使用非統(tǒng)一碼的字型。

有了統(tǒng)一碼這項文字系統(tǒng)后,電腦文字編碼就有了一套標(biāo)準(zhǔn),下一個挑戰(zhàn)就是要確保自行能正確地被轉(zhuǎn)為網(wǎng)路或手機上的文字,去年Google 推出開放的Noto 字型,可以支援800 種語言、11 億個文字,可呈現(xiàn)各式各樣的文字。

但這樣還不夠,雖然文字能呈現(xiàn),但卻不是每個人都知道如何輸入文字,因此除了Gboard 提供300 多種鍵盤、 97 種手寫系統(tǒng)、語音輸入等方法讓使用者可以依照自己方便的方式來輸入文字。

在開發(fā)手寫系統(tǒng)上,Google 也花了一番心力,由于每個人的字跡都不同,因此Google 導(dǎo)入人工智慧技術(shù),搜集很多自愿者的手寫范本,讓機器學(xué)習(xí)來辨認(rèn)文字和書寫風(fēng)格,進(jìn)而達(dá)到更精確的手寫辨識。語音輸入方面則是透過GOOG-411 的服務(wù)來搜集語音資料,類似我們的查號臺,當(dāng)有人打電話進(jìn)去問問題查電話,GOOG-411 就會幫忙轉(zhuǎn)接,在這樣的過程中Google 建立了大量的語音資料庫范本,英文語音搜集還算滿順利的。不過其他語言就沒這么容易了,雖然說Google 有和專門經(jīng)營文字和語音資料庫的業(yè)者合作,但有些語言本身的資料庫就較少,例如廣東話,因此Google 又開啟了下一階段的任務(wù)。

語音搜尋實驗,搜集準(zhǔn)確的語音資料

既然缺乏語音資料,Google 就開始想方法來搜集各種語言的語音訊息,比方說2010 年Google 推出了荷蘭語的Word of Mouth 計畫,提供參與實驗的使用者手機來搜集他們和親友間的對話樣本,進(jìn)而得到準(zhǔn)確的語音資料。

有了語音資料之后下個問題則是口音和俗語,關(guān)于這方面的資料目前Google 仍正在努力發(fā)展中,不過經(jīng)過過去這么長一段時間的努力,到2012 年之后,語音搜尋已可支援到50 種語言,Google 也導(dǎo)入了深度神經(jīng)網(wǎng)路提升語音辨識的準(zhǔn)確性,今年則再新增30 多種的語音輸入,甚至包含了非洲兩種主要語言,斯瓦希里語(Swahili)和阿姆哈拉語(Amharic),對于彌平語言隔閡來說,這是一個重要的里程碑。

怎么將機器學(xué)習(xí)應(yīng)用在語音服務(wù)上

既然有了機器學(xué)習(xí)這項技術(shù),也就意味著Google 能透過演算以及建構(gòu)更有效的模型來解決語音辨識問題。

Google 這回用了一個超級低成本的預(yù)算(2000 美金)來增加孟加拉語的文字轉(zhuǎn)語音服務(wù),首先先準(zhǔn)備一套麥克風(fēng)、USB 轉(zhuǎn)接器和前置聲音放大器,并建立一組便攜式的錄音工作室「ChitChat」讓實驗者可以錄音。

工具有了,下一步就是找來15 名孟加拉的Googler,錄制了2000 多個從維基百科擷取出來的孟加拉語和英語,實驗者每隔30 分鐘至60 分鐘就錄制250 多個句子,平衡的混音成幾個不同的聲音后,再交給Google 社群投票看看大家最偏好哪一個聲音,最終產(chǎn)出的聲學(xué)模型剛好就可以代表平均型的人聲,成功推出了孟加拉語的文字轉(zhuǎn)語音服務(wù)。

除了把更多語言放到網(wǎng)路上,Google 也著手發(fā)展方言領(lǐng)域,像是英文就分成美式英文、英式英文、澳洲英文等等,最近Google 正著手處理新加坡式英語,另外,西班牙語、阿拉伯語也是Google 努力的方向。

Google 的中文語音什么時候會有更多突破?

至于***人最常用的中文呢?Google 語言研究計畫總經(jīng)理Linne Ha 不諱言,中文真的是很有挑戰(zhàn)的語言,比方說中國人說著中文、寫著簡體中文,***人說也說著中文、但寫的是繁體中文,香港人寫的也是繁體中文、不過說的是廣東話,繁體中文、簡體中文、廣東話間各有連結(jié)但又不盡相似。

過去Google 是使用「單一語言模式」來處理,比方說***人說的中文就套用繁體中文資料庫,香港人說廣東話則套用另外一個繁體中文資料庫,但這樣的語音辨識效果發(fā)展有限,近期Google 嘗試著將相近的語言加進(jìn)同一個模型中,目前的實驗結(jié)果還不錯。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1752

    瀏覽量

    57333
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29435

    瀏覽量

    267750
  • 語言
    +關(guān)注

    關(guān)注

    1

    文章

    96

    瀏覽量

    24207

原文標(biāo)題:【Google 談人工智慧】有了機器學(xué)習(xí)后,語言還會是隔閡嗎

文章出處:【微信號:lianggezhizi,微信公眾號:兩個質(zhì)子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領(lǐng)域,DeepL再次以其創(chuàng)新實力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語言模型。這一里程碑式的進(jìn)展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位
    的頭像 發(fā)表于 07-19 15:56 ?551次閱讀

    nlp自然語言處理的應(yīng)用有哪些

    的應(yīng)用。以下是一些NLP的主要應(yīng)用領(lǐng)域,以及它們在各個領(lǐng)域的具體應(yīng)用。 機器翻譯 機器翻譯是NLP的一個重要應(yīng)用領(lǐng)域。它利用計算機自動一種語言的文本
    的頭像 發(fā)表于 07-05 09:55 ?2248次閱讀

    如何加速大語言模型推理

    隨著人工智能技術(shù)的飛速發(fā)展,大語言模型(LLM)已成為自然語言處理領(lǐng)域的核心工具,廣泛應(yīng)用于智能客服、文本生成、機器翻譯等多個場景。然而,大語言模型的高計算復(fù)雜度和資源消耗成為其在實際
    的頭像 發(fā)表于 07-04 17:32 ?409次閱讀

    自然語言處理技術(shù)的原理的應(yīng)用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領(lǐng)域的一個重要分支,旨在使計算機能夠理解和處理人類自然語言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術(shù)的發(fā)展
    的頭像 發(fā)表于 07-02 12:50 ?334次閱讀

    語言模型(LLM)快速理解

    歷史可以追溯到早期的語言模型和機器翻譯系統(tǒng),但其真正的起點可以說是隨著深度學(xué)習(xí)技術(shù)的興起而開始。1.1統(tǒng)計語言模型在深度學(xué)習(xí)技術(shù)出現(xiàn)之前,語言模型主要基于傳統(tǒng)的統(tǒng)
    的頭像 發(fā)表于 06-04 08:27 ?812次閱讀
    大<b class='flag-5'>語言</b>模型(LLM)快速理解

    【大語言模型:原理與工程實踐】大語言模型的基礎(chǔ)技術(shù)

    就無法修改,因此難以靈活應(yīng)用于下游文本的挖掘中。 詞嵌入表示:每個詞映射為一個低維稠密的實值向量。不同的是,基于預(yù)訓(xùn)練的詞嵌入表示先在語料庫中利用某種語言模型進(jìn)行預(yù)訓(xùn)練,然后將其應(yīng)用到下游任務(wù)中,詞
    發(fā)表于 05-05 12:17

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    ,生成能力則使其能生成新的、連貫的文本,而涌現(xiàn)性則讓模型能生成未曾出現(xiàn)但邏輯合理的內(nèi)容。從早期的統(tǒng)計模型到如今的大語言模型,AI領(lǐng)域不斷突破,大語言模型已成為多種應(yīng)用場景的強力助推器
    發(fā)表于 05-04 23:55

    EPSON晶振應(yīng)用到汽車電子產(chǎn)品的型號有哪些

    .愛普生品牌晶振型號就有幾百種,很容易混淆,要想記住汽車?yán)锼?b class='flag-5'>應(yīng)用到的不是件易事.那么EPSON晶振應(yīng)用到汽車電子的型號有哪些呢?1、Car Navigation(
    發(fā)表于 04-18 09:46 ?0次下載

    三星Galaxy AI支持19種語言,覆蓋粵語及法語等

     截止當(dāng)前,三星Galaxy AI共支持13個語言,此舉讓全球更多三星用戶享受到該產(chǎn)品的便利。此外,三星計劃至今年底再增加對羅馬尼亞語、土耳其語等8種語言的支持。
    的頭像 發(fā)表于 04-15 15:56 ?912次閱讀

    Stability AI發(fā)布Stable Code Instruct 3B大語言模型,可編譯多種編程語言

    據(jù)報道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語言模型,此款模型的顯著特點是能夠?qū)崿F(xiàn)編程語言間的自如切換。
    的頭像 發(fā)表于 03-27 10:04 ?396次閱讀

    【從0開始創(chuàng)建AWTK應(yīng)用程序】編譯應(yīng)用到RTOS平臺

    AWTK是基于C語言開發(fā)的跨平臺GUI框架。本系列文章介紹如何從0開始創(chuàng)建AWTK應(yīng)用程序,包括搭建開發(fā)調(diào)試環(huán)境、使用AWTK創(chuàng)建Hello工程并在模擬器運行、AWTK應(yīng)用程序移植到其它平臺。在
    的頭像 發(fā)表于 03-21 08:23 ?510次閱讀
    【從0開始創(chuàng)建AWTK應(yīng)用程序】編譯<b class='flag-5'>應(yīng)用到</b>RTOS平臺

    自然語言處理的研究內(nèi)容

    模態(tài) NLP:NLP 正在與計算機視覺融合,允許 AI 文本和圖像一起處理以獲得更豐富的理解。 3. 對話式AI:聊天機器人和虛擬助手正變得越來越對話,使人與AI的交互更加流暢和自然
    的頭像 發(fā)表于 01-18 16:39 ?385次閱讀

    基于機器翻譯增加的跨語言機器閱讀理解算法

    近日,阿里云人工智能平臺 PAI 與華南理工大學(xué)朱金輝教授團隊、達(dá)摩院自然語言處理團隊合作在自然語言處理頂級會議 EMNLP2023 發(fā)表基于機器翻譯增加的跨
    的頭像 發(fā)表于 12-12 10:28 ?527次閱讀
    基于機器<b class='flag-5'>翻譯</b>增加的跨<b class='flag-5'>語言</b>機器閱讀理解算法

    語言模型簡介:基于大語言模型模型全家桶Amazon Bedrock

    本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶:Bedrock對大語言模型進(jìn)行介紹。大語言模型指的是具有數(shù)十億參數(shù)(B+)的預(yù)訓(xùn)練語言
    的頭像 發(fā)表于 12-04 15:51 ?710次閱讀

    腳本語言和編程語言的區(qū)別

    腳本語言和編程語言是計算機語言的兩個主要分類。盡管兩者都是用于編寫計算機程序的工具,但它們在設(shè)計和運行方式存在一些顯著的區(qū)別。下面詳細(xì)探
    的頭像 發(fā)表于 11-22 14:33 ?2771次閱讀