0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知識(shí)圖譜是NLP的未來(lái)嗎?

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:CSDN ? 作者:CSDN ? 2021-04-15 14:36 ? 次閱讀

知識(shí)圖譜是NLP的未來(lái)嗎?

2021年了,不少當(dāng)年如日中天技術(shù)到今天早已無(wú)人問(wèn)津,而知識(shí)圖譜這個(gè)AI界的大IP最火的時(shí)候應(yīng)該是18,19年,彼時(shí)上到頭部大廠下到明星創(chuàng)業(yè)公司都在PR自己圖譜+NLP布局能夠賦予AI認(rèn)知能力。到了當(dāng)下這個(gè)AI總體降溫的時(shí)間節(jié)點(diǎn),我們是時(shí)候冷靜思考知識(shí)圖譜的未來(lái)到底該何去何從了。

回到這個(gè)問(wèn)題本身:知識(shí)圖譜是否是NLP的未來(lái)呢?

我的看法:知識(shí)圖譜不是NLP的未來(lái),因?yàn)橹R(shí)圖譜是另外一種與NLP有很多交集的技術(shù)。在目前所有已知的發(fā)展方向中,知識(shí)圖譜是最有可能長(zhǎng)期和NLP互利共生的技術(shù)。

那么,知識(shí)圖譜和NLP到底是什么關(guān)系呢?直覺(jué)上看,機(jī)器學(xué)習(xí)可以類(lèi)比我們?nèi)祟?lèi)學(xué)習(xí)。回顧一下我們自己的學(xué)習(xí)過(guò)程,大腦和感官主要負(fù)責(zé)信息獲取、處理、分析、決策。對(duì)于簡(jiǎn)單問(wèn)題或少數(shù)天才,接受到信息后,只需要在大腦中思考一遍即可得出結(jié)論。但是對(duì)于復(fù)雜問(wèn)題,比如工作匯報(bào)或期末考試,只靠大腦很難記住所有信息,這個(gè)時(shí)候,很多人都會(huì)選擇將一些加工過(guò)的結(jié)構(gòu)化或半結(jié)構(gòu)化的知識(shí)整理成筆記,方便需要的時(shí)候快速回顧。

發(fā)現(xiàn)了嗎?大腦的角色非常類(lèi)似NLP以及其他ML技術(shù),而筆記幾乎就是KG的靈感來(lái)源。具體來(lái)說(shuō),NLP在圖譜構(gòu)建過(guò)程中舉足輕重,而圖譜又通過(guò)引入知識(shí)的方式反哺NLP。

不少證據(jù)已經(jīng)表明諸如Bert之類(lèi)的預(yù)訓(xùn)練語(yǔ)言模型本身已經(jīng)存儲(chǔ)了知識(shí),就像我們的大腦中也存在一些關(guān)鍵記憶一樣,但它不可能將所有現(xiàn)實(shí)世界中的事實(shí)全部?jī)?nèi)化,猶如人腦不可能記住所有見(jiàn)過(guò)的東西一樣,而知識(shí)圖譜通過(guò)引入知識(shí)能緩解NLP的學(xué)習(xí)壓力。另一個(gè)嚴(yán)重的問(wèn)題是,由于NLP技術(shù)目前遠(yuǎn)沒(méi)有人腦智能,模型在訓(xùn)練中記住的知識(shí)實(shí)際上是不可控的(此處可以圍觀隔壁的AI偏見(jiàn)問(wèn)題[1]),這對(duì)NLP技術(shù)的落地應(yīng)用是一個(gè)需要考慮的風(fēng)險(xiǎn),而在可解釋性方面,知識(shí)圖譜是Bug級(jí)的存在。

知識(shí)圖譜如何賦能NLP技術(shù)?

NLP技術(shù)如何賦能圖譜構(gòu)建的資料很多,知識(shí)圖譜落地應(yīng)用近些年也是進(jìn)展地如火如荼,但,知識(shí)圖譜如何賦能NLP技術(shù)這個(gè)話(huà)題聊的人卻不太多。

我自己總結(jié)了最近幾年KG賦能NLP技術(shù)的一些打法,歡迎補(bǔ)充~

預(yù)訓(xùn)練中引入知識(shí)

代表工作:

ERNIE[2],使用短語(yǔ)和實(shí)體mask策略在中文NLP任務(wù)上取得了較好的效果,其中短語(yǔ)和實(shí)體來(lái)自KG

aee077aa-9cd8-11eb-8b86-12bb97331649.jpg

圖2. ERNIE

K-BERT[3],預(yù)訓(xùn)練過(guò)程中注入相關(guān)的KG三元組,為模型配備領(lǐng)域知識(shí),提高模型在特定領(lǐng)域任務(wù)上的性能,同時(shí)降低大規(guī)模預(yù)訓(xùn)練成本。

aef208bc-9cd8-11eb-8b86-12bb97331649.jpg

圖3. K-BERT

信息抽取中做遠(yuǎn)程監(jiān)督

用KG對(duì)齊文本做遠(yuǎn)程監(jiān)督標(biāo)注數(shù)據(jù)是信息抽取領(lǐng)域的大殺器,能夠有效降低人工標(biāo)注成本,可以將實(shí)體抽取、關(guān)系抽取、事件抽取等子任務(wù)一網(wǎng)打盡,用過(guò)的小伙伴都說(shuō)好。

aefecd68-9cd8-11eb-8b86-12bb97331649.jpg

圖4. 遠(yuǎn)程監(jiān)督

實(shí)體鏈接中引入實(shí)體信息

實(shí)體鏈接,就是把文本中的mention鏈接到KG里的entity的任務(wù)。如下圖所示[4]:

af1c5676-9cd8-11eb-8b86-12bb97331649.jpg

圖5. 實(shí)體鏈接

顯然,KG中的實(shí)體信息,如實(shí)體描述、實(shí)體屬性、實(shí)體embedding以及實(shí)體間關(guān)系等都是該任務(wù)的關(guān)鍵特征,想深入了解的朋友請(qǐng)移步[4]。

文本生成中融合知識(shí)

通過(guò)知識(shí)圖譜中的顯示事實(shí)來(lái)指導(dǎo)生成文本是實(shí)現(xiàn)可控文本生成的一個(gè)重要方向,如下所示[5]:

af25508c-9cd8-11eb-8b86-12bb97331649.jpg

圖6. 文本生成

具體大致分為4種較為典型的方式[6]:

多任務(wù)學(xué)習(xí)(生成+文本蘊(yùn)含)

基于knowledge graph 的文本生成

基于memory network 的文本生成

結(jié)合分布-采樣進(jìn)行文本生成

想詳細(xì)了解的朋友請(qǐng)移步[6]。

語(yǔ)義匹配中引入關(guān)鍵詞信息

在深度語(yǔ)義匹配任務(wù)中,有人發(fā)現(xiàn),通過(guò)文本中關(guān)鍵詞之間的交互即可較為容易的找到匹配對(duì)象,與其他詞匯關(guān)系不大[7][8]。

af4881b0-9cd8-11eb-8b86-12bb97331649.jpg

圖7. 語(yǔ)義匹配case

因此,考慮通過(guò)從KG中引入特定領(lǐng)域的關(guān)鍵詞表,然后在建模時(shí)highlight關(guān)鍵詞的重要度,從而達(dá)到更好的效果[8]。

af63b5c0-9cd8-11eb-8b86-12bb97331649.jpg

圖8. 關(guān)鍵字注意力機(jī)制

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3058

    瀏覽量

    48570
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    482

    瀏覽量

    21969
  • 知識(shí)圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    7673

原文標(biāo)題:知識(shí)圖譜能否拯救NLP的未來(lái)?

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    革新未來(lái)智能版圖,神州數(shù)碼榮登IDC生成式AI圖譜

    6月19日,國(guó)際權(quán)威市場(chǎng)研究機(jī)構(gòu)IDC正式發(fā)布了《2024年第二季度生成式AI生態(tài)圖譜》,其中,神州數(shù)碼憑借在生成式AI領(lǐng)域的領(lǐng)先布局,以其深度整合算力、模型、知識(shí)與應(yīng)用的核心能力,成功占據(jù)生態(tài)圖譜
    的頭像 發(fā)表于 07-29 15:20 ?334次閱讀
    革新<b class='flag-5'>未來(lái)</b>智能版圖,神州數(shù)碼榮登IDC生成式AI<b class='flag-5'>圖譜</b>

    三星電子將收購(gòu)英國(guó)知識(shí)圖譜技術(shù)初創(chuàng)企業(yè)

    在人工智能技術(shù)日新月異的今天,三星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術(shù)創(chuàng)新實(shí)力。近日,三星正式宣布完成了對(duì)英國(guó)領(lǐng)先的人工智能(AI)與知識(shí)圖譜技術(shù)初創(chuàng)企業(yè)Oxford Semantic Technologies的收購(gòu),此舉標(biāo)志著三星在提升設(shè)備端AI能力、深化個(gè)性化用戶(hù)體驗(yàn)方面邁出了重要一步。
    的頭像 發(fā)表于 07-18 14:46 ?463次閱讀

    知識(shí)圖譜與大模型之間的關(guān)系

    在人工智能的廣闊領(lǐng)域中,知識(shí)圖譜與大模型是兩個(gè)至關(guān)重要的概念,它們各自擁有獨(dú)特的優(yōu)勢(shì)和應(yīng)用場(chǎng)景,同時(shí)又相互補(bǔ)充,共同推動(dòng)著人工智能技術(shù)的發(fā)展。本文將從定義、特點(diǎn)、應(yīng)用及相互關(guān)系等方面深入探討知識(shí)圖譜與大模型之間的關(guān)系。
    的頭像 發(fā)表于 07-10 11:39 ?747次閱讀

    nlp邏輯層次模型的特點(diǎn)

    NLP(自然語(yǔ)言處理)邏輯層次模型是一種用于理解和生成自然語(yǔ)言文本的計(jì)算模型。它將自然語(yǔ)言文本分解為不同的層次,以便于計(jì)算機(jī)更好地處理和理解。以下是對(duì)NLP邏輯層次模型特點(diǎn)的分析: 詞匯層次 詞匯
    的頭像 發(fā)表于 07-09 10:39 ?253次閱讀

    nlp神經(jīng)語(yǔ)言和NLP自然語(yǔ)言的區(qū)別和聯(lián)系

    神經(jīng)語(yǔ)言(Neuro-Linguistic Programming,NLP) 神經(jīng)語(yǔ)言是一種心理學(xué)方法,它研究人類(lèi)思維、語(yǔ)言和行為之間的關(guān)系。NLP的核心理念是,我們可以通過(guò)改變我們的思維方式和語(yǔ)言
    的頭像 發(fā)表于 07-09 10:35 ?635次閱讀

    nlp自然語(yǔ)言處理框架有哪些

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP)是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解和處理人類(lèi)語(yǔ)言。隨著技術(shù)的發(fā)展,NLP領(lǐng)域出現(xiàn)了
    的頭像 發(fā)表于 07-09 10:28 ?395次閱讀

    nlp自然語(yǔ)言處理的主要任務(wù)及技術(shù)方法

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP)是人工智能和語(yǔ)言學(xué)領(lǐng)域的一個(gè)分支,它研究如何讓計(jì)算機(jī)能夠理解、生成和處理人類(lèi)語(yǔ)言。NLP技術(shù)在許多領(lǐng)域都有廣泛
    的頭像 發(fā)表于 07-09 10:26 ?575次閱讀

    NLP技術(shù)在機(jī)器人中的應(yīng)用

    人類(lèi)語(yǔ)言的能力,還使得機(jī)器人能夠以更加自然、流暢的方式與人類(lèi)進(jìn)行交互,從而在服務(wù)、教育、醫(yī)療、娛樂(lè)等多個(gè)領(lǐng)域展現(xiàn)出巨大的潛力和價(jià)值。本文將從NLP技術(shù)在機(jī)器人中的應(yīng)用現(xiàn)狀、核心技術(shù)、應(yīng)用場(chǎng)景、面臨的挑戰(zhàn)及未來(lái)發(fā)展趨勢(shì)等方面進(jìn)行深入探討。
    的頭像 發(fā)表于 07-04 16:04 ?342次閱讀

    NLP技術(shù)在人工智能領(lǐng)域的重要性

    在自然語(yǔ)言處理(Natural Language Processing, NLP)與人工智能(Artificial Intelligence, AI)的交織發(fā)展中,NLP技術(shù)作為連接人類(lèi)語(yǔ)言與機(jī)器
    的頭像 發(fā)表于 07-04 16:03 ?319次閱讀

    NLP模型中RNN與CNN的選擇

    在自然語(yǔ)言處理(NLP)領(lǐng)域,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)與卷積神經(jīng)網(wǎng)絡(luò)(CNN)是兩種極為重要且廣泛應(yīng)用的網(wǎng)絡(luò)結(jié)構(gòu)。它們各自具有獨(dú)特的優(yōu)勢(shì),適用于處理不同類(lèi)型的NLP任務(wù)。本文旨在深入探討RNN與CNN
    的頭像 發(fā)表于 07-03 15:59 ?309次閱讀

    什么是自然語(yǔ)言處理 (NLP)

    自然語(yǔ)言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它專(zhuān)注于構(gòu)建能夠理解和生成人類(lèi)語(yǔ)言的計(jì)算機(jī)系統(tǒng)。NLP的目標(biāo)是使計(jì)算機(jī)能夠像人類(lèi)一樣
    的頭像 發(fā)表于 07-02 18:16 ?699次閱讀

    利用知識(shí)圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動(dòng)的RAG系統(tǒng)(下)

    對(duì)于語(yǔ)言模型(LLM)幻覺(jué),知識(shí)圖譜被證明優(yōu)于向量數(shù)據(jù)庫(kù)。知識(shí)圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺(jué)的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1026次閱讀
    利用<b class='flag-5'>知識(shí)圖譜</b>與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動(dòng)的RAG系統(tǒng)(下)

    知識(shí)圖譜基礎(chǔ)知識(shí)應(yīng)用和學(xué)術(shù)前沿趨勢(shì)

    知識(shí)圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其關(guān)系。是融合了認(rèn)知計(jì)算、知識(shí)表示與推理、信息檢索與抽取、自然語(yǔ)言處理、Web技術(shù)、機(jī)器學(xué)習(xí)與大數(shù)據(jù)挖掘等等方向的交叉學(xué)科。人工智能是以傳統(tǒng)符號(hào)派與目前流行的深度神經(jīng)網(wǎng)路為主,如下圖所示,
    的頭像 發(fā)表于 01-08 10:57 ?801次閱讀
    <b class='flag-5'>知識(shí)圖譜</b>基礎(chǔ)<b class='flag-5'>知識(shí)</b>應(yīng)用和學(xué)術(shù)前沿趨勢(shì)

    智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜

    智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)圖譜智慧燈桿產(chǎn)業(yè)鏈企業(yè)
    發(fā)表于 12-11 17:36 ?1次下載

    知識(shí)圖譜與大模型結(jié)合方法概述

    )LLM+KG協(xié)同使用,主要用于知識(shí)表示和推理兩個(gè)方面。該文綜述了以上三個(gè)路線的代表性研究,探討了未來(lái)可能的研究方向。 知識(shí)圖譜(KG)和大語(yǔ)言模型(LLM)都是知識(shí)的表示
    的頭像 發(fā)表于 10-29 15:50 ?879次閱讀
    <b class='flag-5'>知識(shí)圖譜</b>與大模型結(jié)合方法概述