0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于本體的金融知識圖譜自動化構(gòu)建技術(shù)

深度學(xué)習(xí)自然語言處理 ? 來源:CSDN ? 作者:AI算法小喵 ? 2022-11-24 14:54 ? 次閱讀

寫在前面

文本是參加2020CCKS評測 基于本體的金融知識圖譜自動化構(gòu)建技術(shù)之后的一篇總結(jié)博客,筆者查閱了大量文獻(xiàn),并做了大量采用深度學(xué)習(xí)模型的實(shí)驗(yàn),但最終提交時效果最好的方法還是規(guī)則匹配。

文本中總結(jié)了筆者在最終提交時所使用的方案,以及在參加評測過程中所嘗試的各種實(shí)驗(yàn),另外還有評測結(jié)束后還沒有來得及實(shí)現(xiàn)的一些想法。

1. 評測任務(wù)介紹

1.1 介紹

e3df4cb2-6ba6-11ed-8abf-dac502259ad0.png

金融研報是各類金融研究結(jié)構(gòu)對宏觀經(jīng)濟(jì)、金融、行業(yè)、產(chǎn)業(yè)鏈以及公司的研究報告。報告通常是由專業(yè)人員撰寫,對宏觀、行業(yè)和公司的數(shù)據(jù)信息搜集全面、研究深入,質(zhì)量高,內(nèi)容可靠。報告內(nèi)容往往包含產(chǎn)業(yè)、經(jīng)濟(jì)、金融、政策、社會等多領(lǐng)域的數(shù)據(jù)與知識,是構(gòu)建行業(yè)知識圖譜非常關(guān)鍵的數(shù)據(jù)來源

另一方面,由于研報本身所容納的數(shù)據(jù)與知識涉及面廣泛,專業(yè)知識眾多,不同的研究結(jié)構(gòu)和專業(yè)認(rèn)識對相同的內(nèi)容的表達(dá)方式也會略有差異。這些特點(diǎn)導(dǎo)致了從研報自動化構(gòu)建知識圖譜困難重重,解決這些問題則能夠極大促進(jìn)自動化構(gòu)建知識圖譜方面的技術(shù)進(jìn)步。

本評測任務(wù)參考TAC KBP中的Cold Start評測任務(wù)的方案,圍繞金融研報知識圖譜的自動化圖譜構(gòu)建所展開。評測從預(yù)定義圖譜模式(Schema)和少量的種子知識圖譜開始,從非結(jié)構(gòu)化的文本數(shù)據(jù)中構(gòu)建知識圖譜。

其中圖譜模式包括 10 種實(shí)體類型,如機(jī)構(gòu)、產(chǎn)品、業(yè)務(wù)、風(fēng)險等;19 個實(shí)體間的關(guān)系,如(機(jī)構(gòu),生產(chǎn)銷售,產(chǎn)品)、(機(jī)構(gòu),投資,機(jī)構(gòu))等;以及若干實(shí)體類型帶有屬性,如(機(jī)構(gòu),英文名)、(研報,評級)等。在給定圖譜模式和種子知識圖譜的條件下,評測內(nèi)容為自動地從研報文本中抽取出符合圖譜模式的實(shí)體、關(guān)系和屬性值,實(shí)現(xiàn)金融知識圖譜的自動化構(gòu)建。

e423dfda-6ba6-11ed-8abf-dac502259ad0.png

1.2 其他相關(guān)信息

筆者GitHub代碼[1],最終排名為第五名 :e45a8684-6ba6-11ed-8abf-dac502259ad0.png

2.目前方案

由于評測包含的子任務(wù)比較多,有實(shí)體識別、關(guān)系抽取屬性抽取;可使用的技術(shù)也非常多,有監(jiān)督,無監(jiān)督,半監(jiān)督等等;所以筆者在做評測的過程中嘗試了很多方法,但是大部分的模型都不如規(guī)則,所以筆者最終提交的方案中使用了大量規(guī)則匹配方法。

2.1 方案整體流程圖

e480a1e8-6ba6-11ed-8abf-dac502259ad0.png整體方案流程圖

整體結(jié)構(gòu)可以分為實(shí)體識別和關(guān)系、屬性抽取兩部分;流程可以分為6步,其中2、3和4步會重復(fù)執(zhí)行多次。

  • 第1步:通過Hanlp規(guī)則匹配的方式抽取部分實(shí)體;
  • 第2步:采用遠(yuǎn)程監(jiān)督方法,用種子知識圖譜對齊無標(biāo)數(shù)據(jù)得到標(biāo)出了實(shí)體的數(shù)據(jù);
  • 第3步:用上一步得到的標(biāo)出了實(shí)體的數(shù)據(jù)訓(xùn)練模型;
  • 第4步:用上一步訓(xùn)練的實(shí)體識別模型抽取無標(biāo)數(shù)據(jù)中的實(shí)體,并將抽取出的實(shí)體加入到種子知識圖譜中,增加種子知識圖譜的規(guī)模,重復(fù)2,3,4步多次不斷使種子知識圖譜規(guī)則不斷擴(kuò)大;
  • 第5步:通過重復(fù)2,3,4步多次后得到擴(kuò)展了大量實(shí)體的知識圖譜,用種子知識圖譜對齊無標(biāo)數(shù)據(jù),將無標(biāo)數(shù)據(jù)中的實(shí)體都找出來;
  • 第6步:通過上一步得到無標(biāo)數(shù)據(jù)中的實(shí)體后,使用規(guī)則的方法判斷實(shí)體間的關(guān)系和屬性。

2.2 實(shí)體抽取部分

1)外部工具

通過Hanlp實(shí)體識別工具,抽取“人物”和“機(jī)構(gòu)”兩種類型的實(shí)體。Hanlp工具的實(shí)體識別模型是其他有標(biāo)語料上訓(xùn)練的,這里使用外部工具本質(zhì)上是使用了遷移學(xué)習(xí)方法。

2)規(guī)則

通過規(guī)則,抽取“研報“,“文章“,“風(fēng)險“,“ 機(jī)構(gòu)“四種類型的實(shí)體。

3)深度學(xué)習(xí)(遠(yuǎn)程監(jiān)督實(shí)體識別)

除了規(guī)則匹配外,還可以采用遠(yuǎn)程監(jiān)督的方法,主要用于抽取研報中的實(shí)體,具體流程如下圖所示:

e4b0fc3a-6ba6-11ed-8abf-dac502259ad0.png遠(yuǎn)程監(jiān)督實(shí)體識別
  1. 使用規(guī)則和外部工具抽取一部分實(shí)體;
  2. 將原始數(shù)據(jù)平均分成兩半,一半用于訓(xùn)練,一半用于測試,對用于訓(xùn)練的一半數(shù)據(jù)使用遠(yuǎn)程監(jiān)督進(jìn)行標(biāo)注;
  3. 采用將遠(yuǎn)程監(jiān)督方法標(biāo)注的數(shù)據(jù)按4:1劃分,分別作為訓(xùn)練和驗(yàn)證集,訓(xùn)練模型;
  4. 使用上一步訓(xùn)練出的模型在測試集上進(jìn)行預(yù)測,抽取出一部分實(shí)體;
  5. 通過規(guī)則匹配的方法篩選掉一些實(shí)體,剩下的實(shí)體加入種子知識圖譜,然后從第2步開始,重復(fù)上一次訓(xùn)練,迭代進(jìn)行實(shí)體抽取。

2.3 關(guān)系抽取、屬性抽取部分

關(guān)系抽取和屬性抽取方法非常相似,可以使用同樣的方案來解決。

在做評測的過程中,考慮到?jīng)]有給出有標(biāo)注的關(guān)系抽取數(shù)據(jù)集,所以最初我計劃采用遠(yuǎn)程監(jiān)督關(guān)系抽取的相關(guān)方法,首先使用經(jīng)典的模型PCNN做了相關(guān)實(shí)驗(yàn),在實(shí)驗(yàn)過程中發(fā)現(xiàn)語料中有大量的關(guān)系需要通過跨句的抽取方法才能識別,所以又查看了文檔級關(guān)系抽取的相關(guān)方法。但是,目前文檔級關(guān)系抽取方法幾乎都使用有監(jiān)督訓(xùn)練,所以筆者最后對數(shù)據(jù)做了一些處理后,還是使用了PCNN+ATT模型。在進(jìn)行了相關(guān)實(shí)驗(yàn)后并與使用規(guī)則的方法做比較之后,筆者發(fā)現(xiàn)深度學(xué)習(xí)模型在對關(guān)系的準(zhǔn)確率上還是差的比較遠(yuǎn),所以在評測的最后階段還是采用的規(guī)則匹配方法。

3.相關(guān)實(shí)驗(yàn)

下面是在參加評測的過程中,筆者做的采用深度學(xué)習(xí)方法的一些實(shí)驗(yàn),筆者比較了各種方法的優(yōu)劣,選了幾種在評測給定的場景下較優(yōu)的方法,但是在最終的效果都不如采用規(guī)則匹配的方法。這里筆者把在評測中做的一些實(shí)驗(yàn),采用的一些模型做一個總結(jié)。

3.1 實(shí)體抽取部分

3.1.1 BERT-MRC模型

該評測的實(shí)體識別模型就采用的該方法,BERT-MRC模型是目前實(shí)體識別領(lǐng)域的SOTA模型(2020年),在數(shù)據(jù)量較小的情況下效果較其他模型要更好,原因是因?yàn)?strong>BERT-MRC模型可以通過問題加入一些先驗(yàn)知識,減小由于數(shù)據(jù)量太小帶來的問題。在實(shí)際實(shí)驗(yàn)中,在數(shù)據(jù)量比較小的情況下,BERT-MRC模型的效果確實(shí)要較其他模型要更好些。BERT-MRC模型很適合用在本評測這種缺乏標(biāo)注數(shù)據(jù)的場景下。

(1)方法概述

  • 任務(wù)定義:給定一個文本序列,它的長度為,要抽取出其中的每個實(shí)體,其中實(shí)體都屬于一種實(shí)體類型。

  • 模型思想:假設(shè)該數(shù)據(jù)集的所有實(shí)體標(biāo)簽集合為,那么對其中的每個實(shí)體標(biāo)簽,比如地點(diǎn)“國家”,都有一個關(guān)于它的問題。這個問題可以是一個詞,也可以是一句話等等。使用上述MRC中片段抽取的思想,輸入文本序列和問題,是需要抽取的實(shí)體,BERT_MRC通過建模來實(shí)現(xiàn)實(shí)體抽取。

  • 提示信息(問題構(gòu)造):對于問題的構(gòu)造是建模的重要環(huán)節(jié)。BERT_MRC使用“標(biāo)注說明”作為每個標(biāo)簽的問題。所謂“標(biāo)注說明”,是在構(gòu)造某個數(shù)據(jù)集的時候提供給標(biāo)注者的簡短的標(biāo)注說明。比如標(biāo)注者要去標(biāo)注標(biāo)簽為“國家”的所有實(shí)體,那么對應(yīng)“國家”的標(biāo)注說明就是 “指擁有共同的語言、文化、種族、血統(tǒng)、領(lǐng)土、政府或者歷史的社會群體。

(2)模型輸入與模型損失

問題和語料中的句子合并成一句話作為輸入,問題和語料句之間用BERT句子級特殊符號“[SEP]”隔開,下圖中紅色框線框出的為問題:

e4cb20d8-6ba6-11ed-8abf-dac502259ad0.png輸入示例

在用BERT編碼得到詞向量之后,訓(xùn)練三個分類器,得到開始結(jié)束位置標(biāo)簽以及一個概率矩陣。上述兩個標(biāo)簽一個矩陣共可以求三個loss,模型的總loss是上述三個loss之和 :

e4e08342-6ba6-11ed-8abf-dac502259ad0.png損失函數(shù)

3.1.2 BERT-CRF、LSTM-CRF模型

將實(shí)體識別看做一個序列標(biāo)注問題,設(shè)計BIO和實(shí)體類型的聯(lián)合標(biāo)簽每個字符對應(yīng)一個標(biāo)簽。在訓(xùn)練時,采用標(biāo)注了標(biāo)簽的字符序列作為語料訓(xùn)練模型,預(yù)測階段使用模型預(yù)測字符對應(yīng)的標(biāo)簽,然后通過標(biāo)簽得到實(shí)體的片段的具體位置以及實(shí)體片段的類型。

命名實(shí)體識別經(jīng)典的baselineLSTM-CRF采用的就是這種方法,18年之后BERT代替了LSTM,b變成了一個重要的實(shí)體識別baseline。采用CRF的原因是CRF能對標(biāo)簽的轉(zhuǎn)移狀態(tài)建模,減小一些錯誤的標(biāo)簽序列出現(xiàn)的概率,增加模型的準(zhǔn)確率。

e506180a-6ba6-11ed-8abf-dac502259ad0.png樣本示例

3.1.3 Simple-Lexicon模型

LatticeLSTM為代表的詞匯增強(qiáng)模型,其主要目的是解決中文分詞的問題。實(shí)體識別任務(wù)經(jīng)常被轉(zhuǎn)換為一個序列標(biāo)注問題,序列標(biāo)注問題以字為單位,預(yù)測每個字對應(yīng)的標(biāo)簽,模型的輸入是以字序列作為輸入,而以字序列的形式進(jìn)行編碼和解碼,會忽略中文中重要的分詞信息。如何分詞在中文NLP任務(wù)中是非常重要的,會很大地影響模型的性能。

詞匯增強(qiáng)模型的目的就是為了解決以如何讓以字作為輸入的模型使用詞匯信息,在該評測中筆者只簡單的做了一些和Simple-Lexicon模型相關(guān)的實(shí)驗(yàn)。筆者發(fā)現(xiàn)Simple-Lexicon模型并沒有比BERT-CRF模型的效果好很多,分析原因是由于任務(wù)的特殊性,影響遠(yuǎn)程監(jiān)督實(shí)體識別模型性能的比較重要的因素還是在于遠(yuǎn)程監(jiān)督和迭代增強(qiáng)帶來的錯誤傳遞和召回率低等問題,采用什么樣的實(shí)體識別模型對能否解決以上兩個問題其實(shí)影響并不大。

e5740298-6ba6-11ed-8abf-dac502259ad0.png

3.2 關(guān)系抽取、屬性抽取部分

3.2.1 遠(yuǎn)程監(jiān)督關(guān)系抽取與多示例學(xué)習(xí)

遠(yuǎn)程監(jiān)督假設(shè)是指,假如兩個實(shí)體之間存在某種關(guān)系,那么所有這兩個實(shí)體共現(xiàn)的句子都有可能表達(dá)這種關(guān)系。這一假設(shè)過強(qiáng),有些兩個實(shí)體共現(xiàn)的句子并不能表達(dá)實(shí)體間的這種關(guān)系,例如下圖中的兩個句子,以及關(guān)系三元組 (“比爾蓋茨,創(chuàng)建者 , 微軟”)。

e5b55f04-6ba6-11ed-8abf-dac502259ad0.png遠(yuǎn)程監(jiān)督與噪聲數(shù)據(jù)

上圖中的兩個句子有一個可以體現(xiàn)三元組表達(dá)的關(guān)系,另一個不能表達(dá)這種關(guān)系。這些不能表達(dá)兩個實(shí)體間關(guān)系信息的句子根據(jù)遠(yuǎn)程監(jiān)督假設(shè)也會被進(jìn)行標(biāo)注然后當(dāng)做訓(xùn)練語料,這些句子就是噪聲數(shù)據(jù),噪聲數(shù)據(jù)嚴(yán)重影響了遠(yuǎn)程監(jiān)督關(guān)系抽取模型的性能

目前能夠有效地在使用遠(yuǎn)程監(jiān)督方式標(biāo)注的數(shù)據(jù)集上進(jìn)行關(guān)系抽取的模型,基本都采用了多示例學(xué)習(xí)的方法(小喵以前也在小組內(nèi)分享過這個方法)。多示例學(xué)習(xí)的具體做法是,將訓(xùn)練集劃分成多個具有分類標(biāo)簽的多實(shí)例包(bag),每個包含有若干個實(shí)例(instance)。多示例學(xué)習(xí)通過對包中實(shí)例的學(xué)習(xí),訓(xùn)練出一個能夠?qū)ΠM(jìn)行分類的分類器,并將該分類器應(yīng)用于對未知標(biāo)簽的多示例包的預(yù)測。

上圖就是一個多示例包,這個包的標(biāo)簽是“創(chuàng)建者”類型,包中有兩個實(shí)例。其中第一個實(shí)例可以表達(dá)“創(chuàng)建者”這種關(guān)系,而第二個實(shí)例則無法體現(xiàn)這種關(guān)系,使用多示例學(xué)習(xí)方式訓(xùn)練的分類器想要達(dá)到一定的性能,需要能夠很好地分辨出哪些實(shí)例是正實(shí)例(能夠體現(xiàn)包的標(biāo)簽的含義),哪些實(shí)例是負(fù)實(shí)例(不能體現(xiàn)包的標(biāo)簽的含義)。

3.2.2 PCNN-One模型、PCNN-ATT模型

在多示例學(xué)習(xí)的訓(xùn)練過程中,關(guān)于如何從包中選擇出正實(shí)例用于關(guān)系分類,主要有三種思想:

  • 一種是基于“至少一個”假設(shè),即假設(shè)包中至少有一個句子實(shí)例可以代表實(shí)體對之間的關(guān)系,這時任務(wù)目標(biāo)就是訓(xùn)練一個分類器,將包中最有可能代表實(shí)體間關(guān)系的句子作為輸入,對關(guān)系進(jìn)行分類。這種思想就是PCNN-One模型采用的方法。

  • 另一種方法基于注意力機(jī)制,使用一個能代表實(shí)體間關(guān)系的向量和包中的句子實(shí)例求相似度,得到一個權(quán)重參數(shù),對不同的實(shí)例分配以不同的權(quán)重再求和,通過注意力的方式減小噪聲數(shù)據(jù)的影響。這種思想是PCNN-ATT模型采用的方法。

  • 還有一種是使用強(qiáng)化學(xué)習(xí)的方式,篩選出正實(shí)例進(jìn)行關(guān)系分類。由筆者沒有接觸過強(qiáng)化學(xué)習(xí),所以沒有做采用強(qiáng)化學(xué)習(xí)方法去噪的相關(guān)實(shí)驗(yàn)。

在實(shí)驗(yàn)過程中遠(yuǎn)程監(jiān)督關(guān)系模型在其他的一些語料上表現(xiàn)還可以,但是在評測的數(shù)據(jù)集上效果很不理想,主要是因?yàn)樵u測語料數(shù)據(jù)是以金融研報文章為單位,和標(biāo)準(zhǔn)的遠(yuǎn)程監(jiān)督關(guān)系抽取語料(以句子為單位,需要分類的兩個實(shí)體都會在句子中出現(xiàn))差別較大,所以筆者在最終提交時還是使用的規(guī)則匹配的方法,沒有使用PCNN-One模型和PCNN-ATT模型。

4.相關(guān)問題

4.1 實(shí)體抽取部分

4.1.1 使用Snowball方法在迭代過程中產(chǎn)生錯誤傳遞

使用迭代訓(xùn)練的方法,在一次訓(xùn)練過程中模型抽取出了錯誤的實(shí)體片段,這個錯誤的片段加入到種子知識圖譜去標(biāo)注語料會造成錯誤傳遞,為了提高Snowball方法的抽取效果,需要設(shè)計過濾方法,將模型抽取出的實(shí)體經(jīng)過篩選后再加入進(jìn)種子知識圖譜中。

在做評測的過程中,筆者使用了規(guī)則的方法,觀察模型抽取的結(jié)果,然后設(shè)計規(guī)則,過濾錯誤片段。這種方法不是很有效,因?yàn)槟P妥鲆恍┱{(diào)整后,抽取的結(jié)果就不同了,規(guī)則也需要做相應(yīng)的修改。而且錯誤片段的種類非常多,規(guī)則的方法很難全部覆蓋到。

4.1.2 遠(yuǎn)程監(jiān)督訓(xùn)練召回率低

如下圖所示,種子知識圖譜中有比爾蓋茨和微軟兩個實(shí)體,通過實(shí)體對齊之后,無標(biāo)數(shù)據(jù)中的比爾蓋茨和微軟兩個實(shí)體被標(biāo)注出來,但是,由于知識圖譜的規(guī)模限制,實(shí)體 保羅·艾倫 不在知識圖譜中,通過遠(yuǎn)程監(jiān)督的方式不能將該實(shí)體標(biāo)注出來。

e5d6b3e8-6ba6-11ed-8abf-dac502259ad0.png

采用知識圖譜對齊的方式會出現(xiàn)大量的目標(biāo)實(shí)體未被標(biāo)注的情況,所以使用遠(yuǎn)程監(jiān)督標(biāo)注的數(shù)據(jù)集訓(xùn)練的模型召回率比較低。

Snowball方法理論上是解遠(yuǎn)程監(jiān)督實(shí)體識別召回率低的一個比較好的方案,但是實(shí)際實(shí)驗(yàn)結(jié)果卻不是非常好。筆者打算在未來的改進(jìn)方案中結(jié)合少量人工標(biāo)注的數(shù)據(jù),解決由于遠(yuǎn)程監(jiān)督造成的召回率低的問題。

4.2 關(guān)系抽取、屬性抽取部分

由于語料的問題,必須從句子級的關(guān)系抽取擴(kuò)展到文檔級別的關(guān)系抽取。

5.改進(jìn)方案

這部分內(nèi)容筆者正在嘗試突破的方向,也是筆者研究生畢設(shè)的內(nèi)容,現(xiàn)在已經(jīng)有一些想法但還不好直接寫出來,如果之后有一定的成果我再來完善。

5.1 實(shí)體抽取部分

在現(xiàn)有的方案上主要做兩點(diǎn)改進(jìn):

1)加入使用深度學(xué)習(xí)方法訓(xùn)練的實(shí)體判別器

2)使用遷移學(xué)習(xí)的方法,在訓(xùn)練過程中加入相關(guān)領(lǐng)域的人工標(biāo)注數(shù)據(jù)集,以及自己標(biāo)注的部分?jǐn)?shù)據(jù),解決遠(yuǎn)程監(jiān)督訓(xùn)練召回率低的問題

5.2 關(guān)系抽取/屬性抽取部分

在現(xiàn)有的方案上主要做兩點(diǎn)改進(jìn):

1)增加關(guān)系分類器,解決遠(yuǎn)程監(jiān)督關(guān)系抽取的噪聲問題

主要是參考AAAI2020年的一篇論文NeuralSnowball,增加一個像RSN關(guān)系分類器的模塊,增強(qiáng)模型對噪聲數(shù)據(jù)的區(qū)分,同時用人工標(biāo)注一部分?jǐn)?shù)據(jù),使用其他領(lǐng)域大規(guī)模有標(biāo)數(shù)據(jù),少量人工標(biāo)注的任務(wù)數(shù)據(jù)和大量無標(biāo)注的任務(wù)數(shù)據(jù)做遷移學(xué)習(xí)。

e5fde2ce-6ba6-11ed-8abf-dac502259ad0.png

2)使用文檔級關(guān)系抽取模型

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    28

    文章

    5436

    瀏覽量

    78903
  • 知識圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    7675

原文標(biāo)題:5.改進(jìn)方案

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    三星電子將收購英國知識圖譜技術(shù)初創(chuàng)企業(yè)

    在人工智能技術(shù)日新月異的今天,三星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術(shù)創(chuàng)新實(shí)力。近日,三星正式宣布完成了對英國領(lǐng)先的人工智能(AI)與知識圖譜技術(shù)初創(chuàng)企業(yè)Oxford Seman
    的頭像 發(fā)表于 07-18 14:46 ?464次閱讀

    知識圖譜與大模型之間的關(guān)系

    在人工智能的廣闊領(lǐng)域中,知識圖譜與大模型是兩個至關(guān)重要的概念,它們各自擁有獨(dú)特的優(yōu)勢和應(yīng)用場景,同時又相互補(bǔ)充,共同推動著人工智能技術(shù)的發(fā)展。本文將從定義、特點(diǎn)、應(yīng)用及相互關(guān)系等方面深入探討知識圖譜與大模型之間的關(guān)系。
    的頭像 發(fā)表于 07-10 11:39 ?757次閱讀

    機(jī)械自動化和電氣自動化區(qū)別是什么

    機(jī)械自動化和電氣自動化是現(xiàn)代工業(yè)生產(chǎn)中兩個重要的領(lǐng)域,它們在許多方面有著密切的聯(lián)系,但也存在一些明顯的區(qū)別。 一、基本概念 機(jī)械自動化 機(jī)械自動化是指利用機(jī)械設(shè)備、傳感器、控制系統(tǒng)等
    的頭像 發(fā)表于 07-01 09:33 ?3206次閱讀

    機(jī)械自動化自動化的一種嗎

    引言 自動化技術(shù)是指利用控制裝置對生產(chǎn)過程進(jìn)行控制,以實(shí)現(xiàn)生產(chǎn)過程的自動化。機(jī)械自動化自動化技術(shù)
    的頭像 發(fā)表于 07-01 09:32 ?1343次閱讀

    工業(yè)自動化包含哪些技術(shù)領(lǐng)域

    工業(yè)自動化是指在工業(yè)生產(chǎn)過程中,通過使用自動化設(shè)備和系統(tǒng),實(shí)現(xiàn)生產(chǎn)過程的自動化控制和管理。工業(yè)自動化技術(shù)領(lǐng)域廣泛,涉及多個學(xué)科和
    的頭像 發(fā)表于 06-11 11:26 ?749次閱讀

    機(jī)械制造與自動化自動化類嗎

    機(jī)械制造與自動化自動化領(lǐng)域的一個重要分支,它涉及到機(jī)械設(shè)計、制造、檢測、控制等多個方面,是現(xiàn)代制造業(yè)的核心組成部分。 機(jī)械制造與自動化是指利用計算機(jī)、機(jī)器人、傳感器等自動化設(shè)備和
    的頭像 發(fā)表于 06-11 11:18 ?1307次閱讀

    工業(yè)自動化自動化區(qū)別是什么

    工業(yè)自動化自動化是兩個密切相關(guān)但又有所區(qū)別的概念。在這篇文章中,我們將詳細(xì)探討它們之間的區(qū)別,以及它們在現(xiàn)代工業(yè)生產(chǎn)中的應(yīng)用。 一、自動化的定義 自動化是指通過使用機(jī)器、計算機(jī)和其他
    的頭像 發(fā)表于 06-11 11:13 ?1397次閱讀

    工業(yè)自動化包含哪些技術(shù)

    工業(yè)自動化是現(xiàn)代制造業(yè)中不可或缺的一部分,它通過使用各種技術(shù)和設(shè)備來提高生產(chǎn)效率、降低成本、提高產(chǎn)品質(zhì)量和安全性。 一、工業(yè)自動化概述 工業(yè)自動化是指在生產(chǎn)過程中,通過使用計算機(jī)、傳感
    的頭像 發(fā)表于 06-11 11:11 ?733次閱讀

    機(jī)器視覺檢測技術(shù)在工業(yè)自動化中的應(yīng)用

    隨著科技的飛速發(fā)展,工業(yè)自動化已成為現(xiàn)代工業(yè)生產(chǎn)的核心動力。在這個背景下,機(jī)器視覺檢測技術(shù)作為工業(yè)自動化中的關(guān)鍵技術(shù)之一,以其高精度、高效率、高可靠性的優(yōu)勢,在工業(yè)
    的頭像 發(fā)表于 06-07 12:06 ?717次閱讀

    利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準(zhǔn)確、多樣、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1030次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index<b class='flag-5'>技術(shù)</b><b class='flag-5'>構(gòu)建</b>大模型驅(qū)動的RAG系統(tǒng)(下)

    自動化構(gòu)建環(huán)境在FPGA設(shè)計中的應(yīng)用

    為了加快實(shí)現(xiàn) FPGA 構(gòu)建環(huán)境的自動化(如用于持續(xù)集成 (CI)),并確保在開發(fā)與生命周期后期階段完整重現(xiàn)設(shè)計結(jié)果,Missing Link Electronics 團(tuán)隊已整合出一套腳本。
    發(fā)表于 02-20 11:05 ?321次閱讀
    <b class='flag-5'>自動化</b><b class='flag-5'>構(gòu)建</b>環(huán)境在FPGA設(shè)計中的應(yīng)用

    知識圖譜基礎(chǔ)知識應(yīng)用和學(xué)術(shù)前沿趨勢

    知識圖譜(Knowledge Graph)以結(jié)構(gòu)的形式描述客觀世界中概念、實(shí)體及其關(guān)系。是融合了認(rèn)知計算、知識表示與推理、信息檢索與抽取、自然語言處理、Web技術(shù)、機(jī)器學(xué)習(xí)與大數(shù)據(jù)挖
    的頭像 發(fā)表于 01-08 10:57 ?810次閱讀
    <b class='flag-5'>知識圖譜</b>基礎(chǔ)<b class='flag-5'>知識</b>應(yīng)用和學(xué)術(shù)前沿趨勢

    LabVIEW與Tektronix示波器實(shí)現(xiàn)電源測試自動化

    LabVIEW與Tektronix示波器實(shí)現(xiàn)電源測試自動化 在現(xiàn)代電子測試與測量領(lǐng)域,自動化測試系統(tǒng)的構(gòu)建是提高效率和精確度的關(guān)鍵。本案例介紹了如何利用LabVIEW軟件結(jié)合Tektronix
    發(fā)表于 12-09 20:37

    自動化控制系統(tǒng)的基本知識

    工業(yè)自動化是機(jī)器設(shè)備或生產(chǎn)過程在不需要人工直接干預(yù)的情況下,按預(yù)期的目標(biāo)實(shí)現(xiàn)生產(chǎn)和過程控制的統(tǒng)稱。實(shí)現(xiàn)生產(chǎn)和過程控制自動化的裝置稱為自動化控制系統(tǒng)。自動化控制系統(tǒng)作為高端智能裝備的重要
    的頭像 發(fā)表于 11-09 16:45 ?4766次閱讀
    <b class='flag-5'>自動化</b>控制系統(tǒng)的基本<b class='flag-5'>知識</b>

    知識圖譜與大模型結(jié)合方法概述

    本文作者 |? 黃巍 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》總結(jié)了大語言模型和知識圖譜融合的三種路線:1
    的頭像 發(fā)表于 10-29 15:50 ?881次閱讀
    <b class='flag-5'>知識圖譜</b>與大模型結(jié)合方法概述