0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詞義消歧與實體消歧

深度學(xué)習(xí)自然語言處理 ? 來源:AI算法小喵 ? 作者:AI算法小喵 ? 2022-08-02 14:41 ? 次閱讀

寫在前面

最近剛開始調(diào)研實體消歧方面的相關(guān)工作,這里先開一個頭吧。希望大家可以通過這篇簡要的文章對實體消歧任務(wù)本身有一個基本的認(rèn)識。

1. 背景:詞義消歧與實體消歧

1.1 詞義消歧

自然語言文本中存在著大量的多義詞,而多義詞的存在也會影響人對文本的語義理解,讓人對文本的意思產(chǎn)生混淆。

詞義消岐(Word Sense Disambiguation,簡稱WSD) 是NLP中一個非?;镜娜蝿?wù),旨在確定多義詞在具體語境中的確切意義。

在詞義消歧中,同一詞語的不同義項會作為候選詞。我們需要在所有候選詞中找到與文本中目標(biāo)詞語最接近的那個義項。這里“義項”指的是詞是詞典中的某個具體表示。

0ffbd464-118e-11ed-ba43-dac502259ad0.png

如上圖所示,「蘋果」在百度百科中共有25個義項,單說「蘋果」我們可能并不知道說的是「蘋果公司」還是「水果里的蘋果」。但結(jié)合具體的上下文語境,我們就可以很好地對「蘋果」消歧,從而明確「蘋果」的具體含義:

10309532-118e-11ed-ba43-dac502259ad0.png

1.2 實體消歧

實體鏈指/實體鏈接(Entity Linking,簡稱 EL) 在知識圖譜構(gòu)建、信息檢索和問答系統(tǒng)等領(lǐng)域具有廣泛的應(yīng)用價值。

實體鏈指的主要目標(biāo)是識別上下文中的實體指稱具體指代現(xiàn)實世界中的哪一個實體,也就是將實體指稱項映射到知識庫中的相應(yīng)實體上去。

具體而言,實體鏈指一般包括實體識別、候選實體獲取、實體消歧這三個主要環(huán)節(jié)。之所以需要實體消歧,而不是直接將實體識別的結(jié)果放入知識圖譜的原因主要有兩方面:

多樣性(即多詞同義):同一實體在文本中會有不同的指稱。比如:甜瓜、安東尼、和瓜哥都指美國職業(yè)籃球運動員卡梅隆·凱恩·安東尼。

歧義性(即一詞多義):相同的實體指稱在不同的上下文中可以指不同的實體。比如:邁克爾·喬丹可能指美國籃球運動員,也可能指愛爾蘭政治家等。

1.3 總結(jié)

從以上說明來看,其實詞義消歧與實體消歧具有一定相似性, 二者的目的都是處理文本中詞匯歧義的問題. 主要區(qū)別在于:

在詞義消歧中的詞義通常是固定的, 可根據(jù)目標(biāo)詞在詞典中的義項來列舉;

在實體消歧中, 實體詞義無法列舉,所以需要前序步驟候選實體獲?。?/p>

此外,實體詞的詞義數(shù)目大于普通詞,這個主要還是跟知識庫的量級相關(guān)。

2. 相關(guān)論文

這里我們主要給大家推薦兩篇近期發(fā)表的論文:

詞義消歧:《ESC: Redesigning WSD with Extractive Sense Comprehension》

實體消歧:《ExtEnD: Extractive Entity Disambiguation》

兩篇論文的模型都非常簡單,個人覺得關(guān)鍵或者說亮點主要在于他們對問題的轉(zhuǎn)換。其實,從這兩篇論文的名字就能看出端倪:都是將消歧問題轉(zhuǎn)換成了抽取式問題。

2.1 EXTENE 實體消歧

論文名稱:《ExtEnD: Extractive Entity Disambiguation》

論文鏈接:https://aclanthology.org/2022.acl-long.177.pdf

代碼地址:https://github.com/SapienzaNLP/extend.

105e153e-118e-11ed-ba43-dac502259ad0.png

如上圖所示,EXTEND將實體消歧任務(wù)轉(zhuǎn)換為了抽取式任務(wù),或者說MRC類任務(wù)。具體地:

將含有目標(biāo)實體指稱項的文本當(dāng)作Query;

將知識庫中對應(yīng)的所有候選實體及其描述當(dāng)作Context;

二者拼接然后預(yù)測Answer的Span(startend prediction,start-end matching),這里的Answer就是在知識庫中目標(biāo)實體指稱實際關(guān)聯(lián)的實體。

好了,這就是EXTEND論文的核心思想。是不是感覺模型已經(jīng)躍然紙上了,整體上應(yīng)該和我們之前在 一文詳解關(guān)系抽取模型 CasRel、實體識別LEAR論文閱讀筆記、 實體識別BERT-MRC論文閱讀筆記中介紹過的模型類似。

2.2 ESC 詞義消歧

論文名稱:《ESC: Redesigning WSD with Extractive Sense Comprehension》

論文鏈接:https://aclanthology.org/2021.naacl-main.371.pdf

代碼地址:https://github.com/SapienzaNLP/esc

1070bb3a-118e-11ed-ba43-dac502259ad0.png

ESC的模型架構(gòu)和EXTEND是相似的。整體上首先將輸入的上下文和目標(biāo)詞的所有義項拼接,模型的輸出則是目標(biāo)詞真正義項的起始和終止位置。

2.3 總結(jié)

論文的具體細(xì)節(jié)就不在本文里贅述了,大家可根據(jù)鏈接下載原文閱讀。此外,兩篇論文都公布了源碼,大家也可以快速利用源碼在一些開源數(shù)據(jù)上進(jìn)行實驗。

當(dāng)然也有一些相關(guān)比賽,比如百度:實體鏈指[1]目前就還在進(jìn)行中:

10a33e7a-118e-11ed-ba43-dac502259ad0.png

我目前看到的幾個還是比較一致的做法,打分排序:

比如實體鏈指比賽方案分享[2]:

10b95016-118e-11ed-ba43-dac502259ad0.png

CCKS&百度 2019中文短文本的實體鏈指 第一名解決方案[3]:

10e2a970-118e-11ed-ba43-dac502259ad0.png

大家可以將論文的模型適配到中文場景下,然后嘗試在這個比賽的實體消歧環(huán)節(jié)使用,看看效果如何。

還是一樣,如果本文對你有幫助的話,歡迎點贊&在看&分享,這對我繼續(xù)分享&創(chuàng)作優(yōu)質(zhì)文章非常重要。感謝!

參考資料

[1]

百度:實體鏈指: https://aistudio.baidu.com/aistudio/competition/detail/83/0/introduction

[2]

實體鏈指比賽方案分享: https://aistudio.baidu.com/aistudio/projectdetail/1331020?channelType=0&channel=0

[3]

CCKS&百度 2019中文短文本的實體鏈指 第一名解決方案: https://github.com/panchunguang/ccks_baidu_entity_link

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 文本
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    17047
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    483

    瀏覽量

    21976

原文標(biāo)題:一文簡要了解詞義消歧與實體消歧

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    WXZ196微機諧對諧振故障是如何判斷的

    微機諧裝置,采用高性能的單片微機作為核心元件,對PT開口三角電壓進(jìn)行循環(huán)檢測。正常工作下,該電壓小于30V,裝置內(nèi)的大功率諧元件(固態(tài)繼電器)處于阻斷狀態(tài),對系統(tǒng)運行不產(chǎn)生影響。當(dāng)系統(tǒng)發(fā)生故障后
    的頭像 發(fā)表于 07-23 09:27 ?236次閱讀

    STM32F334比較器隱和HRTIM的事件隱功能如何實現(xiàn)?

    1,使用STM32F334制作的數(shù)字電源,用EVENT事件來實現(xiàn)逐周期電流檢測功能,現(xiàn)在開關(guān)管開通瞬間過沖較大,導(dǎo)致比較器誤觸發(fā),比較器隱功能一直配置不起作用,不明白比較器的窗口隱的PWM
    發(fā)表于 06-04 08:38

    弧線圈接地補償裝置

    NS-XHB弧線圈接地補償裝置主要用于電力系統(tǒng)中的中性點非直接接地系統(tǒng)中,其作用是在發(fā)生單相接地故障時,限制故障點的接地電流,減小故障對系統(tǒng)的影響,并能夠在一定條件下使系統(tǒng)恢復(fù)正常運行。 新思達(dá)
    的頭像 發(fā)表于 03-28 15:52 ?481次閱讀
    <b class='flag-5'>消</b>弧線圈接地補償裝置

    微機諧裝置的作用分析

    微機諧裝置是一種智能化的電力諧振消除裝置,微機諧裝置的主要作用是: 1、微機諧裝置,能夠迅速的消除各種鐵磁諧振,提高電力系統(tǒng)的穩(wěn)定性和安全性。 2、微機諧裝置能夠分析、記錄、打
    的頭像 發(fā)表于 03-27 08:43 ?893次閱讀

    微機諧裝置產(chǎn)品介紹# 微機諧裝置# 微機二次諧裝置

    微機諧裝置
    jf_00240081
    發(fā)布于 :2024年03月20日 09:44:35

    微機諧裝置的作用 微機諧裝置的常見故障

    微機諧裝置是一種用于解決電力系統(tǒng)中的諧波問題的電氣裝置。它的作用是對電力系統(tǒng)中的諧波進(jìn)行監(jiān)測和分析,并通過適當(dāng)?shù)目刂剖侄蝸硐驕p少這些諧波的影響,從而保證電力系統(tǒng)的穩(wěn)定運行。下面將從幾個方面詳細(xì)
    的頭像 發(fā)表于 02-18 15:06 ?1078次閱讀

    微機諧裝置的作用 微機諧裝置報接地怎么處理

    微機諧裝置的作用: 微機諧裝置是一種用于消除電力系統(tǒng)中諧波污染的裝置。在現(xiàn)代工業(yè)和商業(yè)電力系統(tǒng)中,電子設(shè)備的普及和大規(guī)模使用導(dǎo)致了越來越多的諧波產(chǎn)生。這些諧波的存在對電力系統(tǒng)的正常運行產(chǎn)生
    的頭像 發(fā)表于 01-30 10:14 ?589次閱讀

    一次諧器類型與選擇

    一次諧器:類型與選擇 在電力系統(tǒng)中的設(shè)備運行過程中,諧波的存在往往會對設(shè)備產(chǎn)生不良影響。為了解決這一問題,諧器應(yīng)運而生。今天,我們將為大家詳細(xì)介紹一次諧器的類型與選擇。 一、一次
    的頭像 發(fā)表于 01-09 10:14 ?451次閱讀

    一次諧和二次諧有什么區(qū)別

    一次諧和二次諧是在交流電電路中進(jìn)行的兩種儲能元件的選擇,旨在改善電流和電壓的波動問題。下面將詳細(xì)介紹一次諧和二次諧的區(qū)別。 一次
    的頭像 發(fā)表于 12-20 14:48 ?1423次閱讀

    一次諧裝置的種類介紹

    一次諧裝置的種類介紹 一次諧,也叫一次諧器和一次諧裝置。 一次諧裝置根據(jù)電壓等級一般可以分為6kV、10kV和35kV幾種!根據(jù)系
    的頭像 發(fā)表于 11-15 11:08 ?483次閱讀

    弧線圈接地補償裝置的使用方法和性能

    在變壓器中性點接入弧線圈的目的是補償網(wǎng)絡(luò)接地電流。弧線圈接于變壓器(或發(fā)電機)的中性點與大地之間,構(gòu)成弧線圈接地系統(tǒng)。
    的頭像 發(fā)表于 11-07 13:56 ?703次閱讀

    新型弧線圈的故障與維修方法

    新型弧線圈的故障與維修方法
    的頭像 發(fā)表于 11-07 13:54 ?726次閱讀

    弧線圈接地裝置的使用方法和性能

    在變壓器中性點接入弧線圈的目的是補償網(wǎng)絡(luò)接地電流。弧線圈接于變壓器(或發(fā)電機)的中性點與大地之間,構(gòu)成弧線圈接地系統(tǒng)。
    的頭像 發(fā)表于 11-07 13:14 ?1007次閱讀

    弧線圈該如何選擇

    在選擇弧線圈的安裝位置時,需注意以下幾點: (1)在任何運行方式下,大部分電網(wǎng)不得失去弧線圈的補償。不應(yīng)將多臺弧線圈集中安裝在一處,并應(yīng)盡量避免在電網(wǎng)中僅安裝一臺弧線圈。 (2
    的頭像 發(fā)表于 11-06 09:44 ?709次閱讀

    按鍵抖都有哪些處理方式?

    按鍵抖都有哪些處理方式除了硬件抖電路用軟件怎么實現(xiàn)
    發(fā)表于 11-01 07:06