0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook采用無監(jiān)督機(jī)器學(xué)習(xí)翻譯其平臺(tái)上內(nèi)容

EdXK_AI_News ? 來源:未知 ? 作者:工程師曾玲 ? 2018-10-02 17:36 ? 次閱讀

【概要】臉書公司開始使用無監(jiān)督機(jī)器學(xué)習(xí)來為其用戶提供翻譯服務(wù)。

由于缺少從一種語言到另一種語言的很多翻譯示例——例如從英語到烏爾都語(Urdu),F(xiàn)acebook(臉書)公司已經(jīng)開始使用無監(jiān)督的機(jī)器學(xué)習(xí)來翻譯其平臺(tái)上的內(nèi)容。

Facebook人工智能研究院(FacebookAI Research,F(xiàn)AIR)巴黎實(shí)驗(yàn)室的主任Antoine Bordes表示:該方法由FAIR設(shè)計(jì),并由FAIR和Facebook的應(yīng)用機(jī)器學(xué)習(xí)部門合作用于其平臺(tái)。在實(shí)驗(yàn)中,該方法的表現(xiàn)與經(jīng)過10萬次翻譯訓(xùn)練的有監(jiān)督模型相當(dāng),并且在翻譯示例很少的情況下,其表現(xiàn)優(yōu)于Facebook的語言匹配系統(tǒng)。Bordes說:“當(dāng)你處理像英語到烏爾都語這樣的案例很少的翻譯任務(wù)時(shí),我們系統(tǒng)的表現(xiàn)超過了有監(jiān)督的系統(tǒng)。因此,在沒有足夠數(shù)據(jù)的時(shí)候,訓(xùn)練無監(jiān)督系統(tǒng)比有監(jiān)督系統(tǒng)更好?!?/p>

由Facebook人工智能研究人員Guillaume Lample和Marc'Aurelio Ranzato領(lǐng)導(dǎo)的這項(xiàng)工作的成果將于今年秋季在EMNLP 2018上公布。作為FAIR的一名老員工,Bordes表示這項(xiàng)研究是他見過的最好的翻譯系統(tǒng)。Bordes說:“我們現(xiàn)在可以去一個(gè)使用未知語言的星球—或者說,跟外星人交談—你可以嘗試對(duì)他們所說的內(nèi)容進(jìn)行合理的翻譯。你也可以從一本古老的手稿上找到尚未破譯的語言,你可以真正了解它的含義,因此這項(xiàng)工作真的在這些方面取得了突破,而這就是我如此興奮的原因。”

與FAIR的其他項(xiàng)目一樣,該AI系統(tǒng)將是開源的,可以在GitHub上下載。今年早些時(shí)候,F(xiàn)acebook將Translate做了開源,這是目前Facebook用來輔助翻譯的人工智能系統(tǒng)。Translate等系統(tǒng)需要大量的標(biāo)記數(shù)據(jù)。例如,完成從法語到英語的翻譯需要數(shù)百萬個(gè)樣本句子來創(chuàng)建一個(gè)能夠理解這兩種語言的系統(tǒng)。因此,在缺少翻譯示例時(shí),翻譯工作是非常困難的。

當(dāng)前用于處理這種案例的人工智能系統(tǒng)結(jié)合了三個(gè)要素:逐字翻譯、語言模型和反向翻譯。逐字翻譯的訓(xùn)練原理為:根據(jù)一個(gè)句子中某個(gè)字的前面五個(gè)單詞和后面五個(gè)單詞來推測其上下文含義,然后對(duì)該單詞進(jìn)行預(yù)測。這個(gè)嵌入詞語的方法是在2017年秋天Lample和Ranzato共同撰寫的一篇論文中提出的。然后,使用大量數(shù)據(jù)(如書籍或其他書面文本)訓(xùn)練的語言模型被用于按照英語或?yàn)鯛柖颊Z使用者能夠理解的結(jié)構(gòu)來安排句子。最后,使用反向翻譯來改進(jìn)通過逐字翻譯和語言模型獲得的翻譯結(jié)果。這些方法并不新鮮,但三者的結(jié)合的確是有效的。

Bordes稱:“使用這兩個(gè)系統(tǒng),并在兩種語言之間進(jìn)行雙向翻譯,我可以將它們進(jìn)行同時(shí)訓(xùn)練以獲得相互促進(jìn),所以真正核心思想是使用這些詞語(翻譯模型),利用該語言模型做第一次翻譯,然后用反向翻譯的方法嘗試進(jìn)行改進(jìn)?!?/p>

Facebook將在未來探索將這種人工智能系統(tǒng)用于其他形式的翻譯,但需要更多的數(shù)據(jù),并需要與專業(yè)翻譯人員合作來驗(yàn)證結(jié)果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54582
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8320

    瀏覽量

    132165

原文標(biāo)題:臉書采用無監(jiān)督機(jī)器學(xué)習(xí)提供翻譯服務(wù)

文章出處:【微信號(hào):AI_News,微信公眾號(hào):人工智能快報(bào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的應(yīng)用日益廣泛。然而,將深度學(xué)習(xí)算法部署到資源受限的嵌入式平臺(tái)上,仍然是一個(gè)具有挑戰(zhàn)性的任務(wù)。本文將從嵌入式平臺(tái)的特點(diǎn)、深度
    的頭像 發(fā)表于 07-15 10:03 ?944次閱讀

    神經(jīng)網(wǎng)絡(luò)如何用監(jiān)督算法訓(xùn)練

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分,訓(xùn)練方式多樣,其中監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 07-09 18:06 ?632次閱讀

    深度學(xué)習(xí)中的監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實(shí)現(xiàn)。因此,監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的監(jiān)督學(xué)
    的頭像 發(fā)表于 07-09 10:50 ?278次閱讀

    基于FPGA的類腦計(jì)算平臺(tái) —PYNQ 集群的監(jiān)督圖像識(shí)別類腦計(jì)算系統(tǒng)

    STDP 監(jiān)督學(xué)習(xí)算法,可運(yùn)用于圖像的 監(jiān)督分類。 從平臺(tái)設(shè)計(jì)角度: (1)本設(shè)計(jì)搭建的基于 PYNQ 集群的通用低功耗的大規(guī)
    發(fā)表于 06-25 18:35

    開源項(xiàng)目!設(shè)計(jì)一款智能手語翻譯眼鏡

    這個(gè)項(xiàng)目是一款創(chuàng)新的智能手語翻譯眼鏡,它能夠?qū)崟r(shí)地將手語轉(zhuǎn)換為聽得見的語音。這款眼鏡采用了VIAM平臺(tái)和樹莓派Zero 2 W,能夠幫助聾人或聽力受損的人士更自由、獨(dú)立地與他人交流,減少對(duì)第三方
    發(fā)表于 05-20 15:59

    廣和通發(fā)布機(jī)器人開發(fā)平臺(tái)

    廣和通近日隆重發(fā)布了全新研發(fā)的具身智能機(jī)器人開發(fā)平臺(tái)——Fibot。該平臺(tái)旨在滿足客戶在驗(yàn)證Mobile ALOHA協(xié)同學(xué)習(xí)與簡單示教操作
    的頭像 發(fā)表于 03-29 09:34 ?514次閱讀

    能在Meteor Lake平臺(tái)上使用SDK 3.5嗎?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平臺(tái)上使用 SDK 3.5 嗎? SDK 3.5 - 平臺(tái)選擇有"MTL" 關(guān)鍵字 :
    發(fā)表于 03-04 06:32

    把CY8C4146平臺(tái)上工程移植到CY8C4147平臺(tái)上,用戶程序沒運(yùn)行的原因?

    客戶現(xiàn)在想把CY8C4146平臺(tái)上工程移植到CY8C4147平臺(tái)上,在topdesign重新選擇4147,管腳也調(diào)整了一下,編譯重新生成底層代碼,creator4.2IDE編譯沒報(bào)錯(cuò),同時(shí)同步更新
    發(fā)表于 02-21 06:04

    Meta發(fā)布新型監(jiān)督視頻預(yù)測模型“V-JEPA”

    Meta,這家社交媒體和科技巨頭,近日宣布推出一種新型的監(jiān)督視頻預(yù)測模型,名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注,因?yàn)樗ㄟ^抽象性預(yù)測生成視頻中缺失或模糊的部分來進(jìn)行學(xué)習(xí),提供了一種全新的視頻處理方法。
    的頭像 發(fā)表于 02-19 11:19 ?864次閱讀

    基于機(jī)器翻譯增加的跨語言機(jī)器閱讀理解算法

    近日,阿里云人工智能平臺(tái) PAI 與華南理工大學(xué)朱金輝教授團(tuán)隊(duì)、達(dá)摩院自然語言處理團(tuán)隊(duì)合作在自然語言處理頂級(jí)會(huì)議 EMNLP2023 上發(fā)表基于機(jī)器翻譯增加的跨語言機(jī)器閱讀理解算法 X-STA。通過
    的頭像 發(fā)表于 12-12 10:28 ?523次閱讀
    基于<b class='flag-5'>機(jī)器翻譯</b>增加的跨語言<b class='flag-5'>機(jī)器</b>閱讀理解算法

    基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測方法分享

    鋪設(shè)異常檢測可以幫助減少數(shù)據(jù)存儲(chǔ)、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和自監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。
    的頭像 發(fā)表于 12-06 14:57 ?1328次閱讀
    基于transformer和自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的路面異常檢測方法分享

    監(jiān)督域自適應(yīng)場景:基于檢索增強(qiáng)的情境學(xué)習(xí)實(shí)現(xiàn)知識(shí)遷移

    本文對(duì)比了多種基線方法,包括監(jiān)督域自適應(yīng)的傳統(tǒng)方法(如Pseudo-labeling和對(duì)抗訓(xùn)練)、基于檢索的LM方法(如REALM和RAG)和情境學(xué)習(xí)方法(如In-context learning)。
    發(fā)表于 12-05 14:14 ?491次閱讀
    <b class='flag-5'>無</b><b class='flag-5'>監(jiān)督</b>域自適應(yīng)場景:基于檢索增強(qiáng)的情境<b class='flag-5'>學(xué)習(xí)</b>實(shí)現(xiàn)知識(shí)遷移

    如何在MTK平臺(tái)上添加adau7118?

    怎么在MTK平臺(tái)上,添加adau7118外置codec? 目前添加后發(fā)現(xiàn),錄音數(shù)據(jù)只能錄3s左右,且發(fā)現(xiàn)添加這個(gè)codec后,進(jìn)不了桌面,麻煩幫忙help一下,多謝。
    發(fā)表于 11-28 07:19

    酷派手機(jī)擁抱鴻蒙,成功在展訊T606平臺(tái)上接入OpenHarmony

    最新消息,酷派技術(shù)團(tuán)隊(duì)宣布已成功實(shí)現(xiàn)將 OpenHarmony 系統(tǒng)接入到展訊平臺(tái)上,相信這是一個(gè)重要的里程碑,標(biāo)志著在推動(dòng) OpenHarmony 的發(fā)展環(huán)節(jié)取得了重要進(jìn)展。 在該項(xiàng)目中,酷派
    發(fā)表于 11-21 13:51

    全面總結(jié)機(jī)器學(xué)習(xí)中的優(yōu)化算法

    幾乎所有的機(jī)器學(xué)習(xí)算法最后都?xì)w結(jié)為求一個(gè)目標(biāo)函數(shù)的極值,即最優(yōu)化問題,例如對(duì)于有監(jiān)督學(xué)習(xí),我們要找到一個(gè)最佳的映射函數(shù)f (x),使得對(duì)訓(xùn)練樣本的損失函數(shù)最小化(最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)或結(jié)構(gòu)風(fēng)險(xiǎn))。
    發(fā)表于 11-02 10:18 ?380次閱讀
    全面總結(jié)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的優(yōu)化算法