0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Fudan DISC實驗室將分享三篇關(guān)于知識圖譜嵌入模型的論文

深度學(xué)習(xí)自然語言處理 ? 來源:復(fù)旦DISC ? 作者:復(fù)旦DISC ? 2021-04-15 14:14 ? 次閱讀

引言

知識圖譜嵌入 knowledge graph embedding是將包含實體和關(guān)系的知識圖譜三元組嵌入到高維向量空間中,獲得實體和關(guān)系的數(shù)值表示,提取圖中相關(guān)信息,并進(jìn)行后續(xù)運算推斷。常用于知識圖譜補全 (KG completion),關(guān)系提取 (relation extraction),實體分類 (entity classification),實體決議 (entity resolution)等等。

本次Fudan DISC實驗室將分享三篇關(guān)于知識圖譜嵌入模型的論文,分別介紹其訓(xùn)練策略、概率校準(zhǔn)、模型設(shè)計三個方面取得的進(jìn)展。

文章概覽

知識圖譜嵌入模型的訓(xùn)練策略(You CAN Teach an Old Dog New Tricks! On Training Knowledge Graph Embeddings)

論文地址:https://openreview.net/pdf?id=BkxSmlBFvr

該篇文章在兩個常見數(shù)據(jù)集上對比了五種知識圖譜嵌入 (Knowledge Graph Embedding) 方法在同樣的訓(xùn)練框架和參數(shù)設(shè)置下的性能,總結(jié)并評測了不同模型架構(gòu)和不同訓(xùn)練策略對模型的影響,正如文章標(biāo)題所說“你可以教給老狗新的技巧”,訓(xùn)練策略對模型的性能有重大影響,并且可能占最近幾年進(jìn)展的很大一部分。

知識圖譜嵌入模型的概率校準(zhǔn)(Probability Calibration for Knowledge Graph Embedding Models)

論文地址:https://openreview.net/pdf?id=S1g8K1BFwS

該篇文章將概率校準(zhǔn)的兩種方法運用到知識圖譜嵌入模型中,解決了當(dāng)前知識圖譜嵌入模型對于實體推斷的打分不是概率的問題。

使用盒嵌入在知識圖譜上推斷(Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings)

論文地址:https://openreview.net/pdf?id=BJgr4kSFDS

該篇文章將盒嵌入引入知識圖譜推斷中,將原有的基于點嵌入的模型升級為基于高維矩形嵌入的模型,解決推斷過程中“一推多”、合取、析取的問題。

論文細(xì)節(jié)

1

69b4f548-9cd8-11eb-8b86-12bb97331649.png

論文動機

目前有很多知識圖譜嵌入模型,是近期的熱點;

這些模型缺少統(tǒng)一的訓(xùn)練策略消融對比;

通常沒有考慮最先進(jìn)的基線。

以此帶來的問題是難以評估模型和訓(xùn)練的貢獻(xiàn)。因此文章將熱門的5個模型在2個廣泛使用的數(shù)據(jù)集上控制訓(xùn)練策略進(jìn)行實驗對比。

69c664c2-9cd8-11eb-8b86-12bb97331649.png

方法

本文使用上表中的5個模型對比了如下的訓(xùn)練參數(shù)設(shè)置,篇幅有限不做過多介紹。

69d7a3f4-9cd8-11eb-8b86-12bb97331649.png

實驗結(jié)果

69f38768-9cd8-11eb-8b86-12bb97331649.png

結(jié)果表明通過好的訓(xùn)練策略,熱門模型都比他們論文剛發(fā)表時發(fā)布的性能有所提升,甚至有些模型可以超過后來提出的模型,如RESCAL;同時,文中也對比了重新實現(xiàn)的模型與更新的模型性能,發(fā)現(xiàn)最新的模型并沒有比之前的模型在訓(xùn)練策略調(diào)優(yōu)后的效果上有明顯提升。

6a22c6e0-9cd8-11eb-8b86-12bb97331649.png

同時,每個模型在不同訓(xùn)練策略下的方差都比較大,并沒有完全特別好的模型。

6a36ff5c-9cd8-11eb-8b86-12bb97331649.png

此外,文章還對比了不同參數(shù)的作用,以及訓(xùn)練的過程。

6a4ea314-9cd8-11eb-8b86-12bb97331649.png

6a6d271c-9cd8-11eb-8b86-12bb97331649.png

2

6a8323b4-9cd8-11eb-8b86-12bb97331649.png

論文動機

知識圖譜嵌入研究忽略了概率標(biāo)定問題。

流行的知識圖譜嵌入模型沒有校準(zhǔn)。

知識圖譜嵌入得到分?jǐn)?shù)的概率都是不可靠的。

因此,本文提出了一種知識圖嵌入模型的標(biāo)定方法,使用Platt標(biāo)度和等滲回歸,對概率進(jìn)行了校準(zhǔn)。

6a99db18-9cd8-11eb-8b86-12bb97331649.png

方法

論文主要的研究對象是基于知識圖譜嵌入的評分,使用Platt標(biāo)度和等滲回歸,對評分概率進(jìn)行了校準(zhǔn)。

6ad23cf6-9cd8-11eb-8b86-12bb97331649.png

實驗結(jié)果

6aeca172-9cd8-11eb-8b86-12bb97331649.png

6b0c182c-9cd8-11eb-8b86-12bb97331649.png

6b206d4a-9cd8-11eb-8b86-12bb97331649.png

6b4b2008-9cd8-11eb-8b86-12bb97331649.png

6b9b7ac6-9cd8-11eb-8b86-12bb97331649.png

實驗結(jié)果表明,Platt標(biāo)度和等滲回歸的校準(zhǔn)效果良好。

3

6bcbf76e-9cd8-11eb-8b86-12bb97331649.png

論文動機

在知識圖譜的鏈接預(yù)測(link prediction)中,存在多步推理的情況,以及有的時候推理并不是一一對應(yīng),而是存在同樣滿足條件的多個實體集合的情況。當(dāng)前的研究主要關(guān)注于單步的點推理,也沒有考慮推理中集合的操作。因此,本文提出將盒嵌入模型用于回答知識圖譜的推理問題,從而解決推理中多步集合推理的問題。

6be6fd02-9cd8-11eb-8b86-12bb97331649.png

方法

文中定義了盒嵌入向量的構(gòu)造和投影合取的操作,以及距離的計算方式。

6c85eaca-9cd8-11eb-8b86-12bb97331649.png

此外,文中還證明了任何一個命題都可以轉(zhuǎn)化為標(biāo)準(zhǔn)形式。

6fc455f0-9cd8-11eb-8b86-12bb97331649.png

實驗結(jié)果

6fe1678a-9cd8-11eb-8b86-12bb97331649.png

7001be90-9cd8-11eb-8b86-12bb97331649.png

703906ac-9cd8-11eb-8b86-12bb97331649.png

實驗結(jié)果表明盒嵌入模型相比于點嵌入模型擁有更好的推理效果。

總結(jié)

此次 Fudan DISC 解讀的三篇論文圍繞知識圖譜嵌入模型展開,訓(xùn)練策略對于嵌入模型的訓(xùn)練影響很大,由知識圖譜嵌入模型得到的打分可以通過概率校準(zhǔn)的手段使其變成概率,盒嵌入模型的引入解決了復(fù)雜集合推斷的問題。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3065

    瀏覽量

    48578
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1199

    瀏覽量

    24593
  • 知識圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    7675

原文標(biāo)題:知識圖譜嵌入的一點小事 - ICLR2021

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    榮耀與智譜攜手共建AI大模型聯(lián)合實驗室

    近日,榮耀終端有限公司與北京智譜華章科技有限公司正式攜手,共同宣布成立AI大模型技術(shù)聯(lián)合實驗室,并簽署了戰(zhàn)略合作協(xié)議。此次合作標(biāo)志著雙方在人工智能領(lǐng)域的深度合作邁入新階段,共同致力于為用戶帶來前所未有的智能體驗。
    的頭像 發(fā)表于 09-03 18:15 ?749次閱讀

    星電子收購英國知識圖譜技術(shù)初創(chuàng)企業(yè)

    在人工智能技術(shù)日新月異的今天,星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術(shù)創(chuàng)新實力。近日,星正式宣布完成了對英國領(lǐng)先的人工智能(AI)與知識圖譜技術(shù)初創(chuàng)企業(yè)Oxford Semantic Technologies的收購,此舉
    的頭像 發(fā)表于 07-18 14:46 ?464次閱讀

    知識圖譜與大模型之間的關(guān)系

    在人工智能的廣闊領(lǐng)域中,知識圖譜與大模型是兩個至關(guān)重要的概念,它們各自擁有獨特的優(yōu)勢和應(yīng)用場景,同時又相互補充,共同推動著人工智能技術(shù)的發(fā)展。本文將從定義、特點、應(yīng)用及相互關(guān)系等方面深入探討知識圖譜與大
    的頭像 發(fā)表于 07-10 11:39 ?757次閱讀

    DEKRA德凱為Hisense海信實驗室授予CTF實驗室資質(zhì)

    近日,全球領(lǐng)先的檢驗檢測認(rèn)證機構(gòu)DEKRA德凱為海信家電集團洗護技術(shù)測試研究中心(以下簡稱:Hisense海信)實驗室授予CTF實驗室資質(zhì)。
    的頭像 發(fā)表于 04-10 14:52 ?451次閱讀

    星成立半導(dǎo)體AGI計算實驗室

    星電子近日迎來重要戰(zhàn)略部署,其半導(dǎo)體業(yè)務(wù)CEO慶桂顯正式宣布,公司將在美國和韓國設(shè)立全新的半導(dǎo)體AGI計算實驗室,并已啟動相關(guān)招聘工作。此次實驗室的成立,標(biāo)志著星在人工智能領(lǐng)域邁出
    的頭像 發(fā)表于 03-22 11:10 ?585次閱讀

    要讓量子計算走出實驗室

    /4GqWiPmsN9I今年1月6日,我國第代自主超導(dǎo)量子計算機“本源悟空”上線運行并向全球公眾限時免費開放,這標(biāo)志著我國超導(dǎo)量子計算機產(chǎn)業(yè)鏈基本成鏈。中國科學(xué)院量子信息重點實驗室
    的頭像 發(fā)表于 03-06 08:21 ?273次閱讀
    要讓量子計算走出<b class='flag-5'>實驗室</b>

    利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1030次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index技術(shù)構(gòu)建大<b class='flag-5'>模型</b>驅(qū)動的RAG系統(tǒng)(下)

    上海AI實驗室發(fā)布新一代書生·視覺大模型

    近日,上海人工智能實驗室(上海AI實驗室)聯(lián)手多所知名高校及科技公司共同研發(fā)出新一代書生·視覺大模型(InternVL)。
    的頭像 發(fā)表于 02-04 11:25 ?994次閱讀

    星在硅谷建立3D DRAM研發(fā)實驗室

    星電子,全球領(lǐng)先的存儲芯片制造商,近日宣布在美國設(shè)立新的研究實驗室,專注于開發(fā)新一代3D DRAM技術(shù)。這個實驗室隸屬于總部位于美國硅谷的Device Solutions Amer
    的頭像 發(fā)表于 01-30 10:48 ?644次閱讀

    星計劃在硅谷開設(shè)實驗室

    星電子近日宣布,在美國硅谷設(shè)立了一個新的研究實驗室,隸屬于Device Solutions America (DSA),旨在開發(fā)新一代3D DRAM。
    的頭像 發(fā)表于 01-29 16:53 ?707次閱讀

    實驗室設(shè)備定位管理系統(tǒng)

    實驗室設(shè)備定位管理系統(tǒng)是一種用于實驗室設(shè)備管理和定位的系統(tǒng)。它利用物聯(lián)網(wǎng)技術(shù)和定位技術(shù),幫助實驗室管理人員實時了解實驗室內(nèi)設(shè)備的位置和狀態(tài),提高設(shè)備的利用率和管理效率。 該系統(tǒng)使用傳感
    的頭像 發(fā)表于 01-10 16:13 ?758次閱讀

    知識圖譜基礎(chǔ)知識應(yīng)用和學(xué)術(shù)前沿趨勢

    知識圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其關(guān)系。是融合了認(rèn)知計算、知識表示與推理、信息檢索與抽取、自然語言處理、Web技術(shù)、機器學(xué)習(xí)與大數(shù)據(jù)挖掘等等方向的交叉學(xué)科。人工智能是以傳統(tǒng)符號派與目前流行的深度神經(jīng)網(wǎng)路為主,如下圖所示,
    的頭像 發(fā)表于 01-08 10:57 ?810次閱讀
    <b class='flag-5'>知識圖譜</b>基礎(chǔ)<b class='flag-5'>知識</b>應(yīng)用和學(xué)術(shù)前沿趨勢

    維天地助力計量實驗室全方位資源管理

    企業(yè)內(nèi)部的計量實驗室肩負(fù)著為企業(yè)內(nèi)部儀器設(shè)備提供周期性校準(zhǔn)或委外檢定校準(zhǔn)的任務(wù),但如何確保按時、及時地進(jìn)行這些校準(zhǔn)任務(wù),一直是困擾企業(yè)內(nèi)計量實驗室的挑戰(zhàn)。 北京維天地科技股份有限公司長期以來專注于
    的頭像 發(fā)表于 12-20 22:43 ?253次閱讀
    <b class='flag-5'>三</b>維天地助力計量<b class='flag-5'>實驗室</b>全方位資源管理

    淺析RFID技術(shù)在學(xué)校實驗室管理中的應(yīng)用

    一直以來,多數(shù)高校實驗室設(shè)備管理采取傳統(tǒng)手工方式,無法滿足當(dāng)前高校的發(fā)展需求。同時,對于實驗室設(shè)備的資產(chǎn)進(jìn)行清查時也多是通過掃描手寫編碼或是條形碼標(biāo)簽的方式進(jìn)行核實,這樣的盤查效率極低,且極易出現(xiàn)錯誤,很難實現(xiàn)實驗室設(shè)備的賬物核
    的頭像 發(fā)表于 12-13 16:48 ?418次閱讀
    淺析RFID技術(shù)在學(xué)校<b class='flag-5'>實驗室</b>管理中的應(yīng)用

    知識圖譜與大模型結(jié)合方法概述

    本文作者 |? 黃巍 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》總結(jié)了大語言模型知識圖譜融合的種路線:1
    的頭像 發(fā)表于 10-29 15:50 ?881次閱讀
    <b class='flag-5'>知識圖譜</b>與大<b class='flag-5'>模型</b>結(jié)合方法概述