0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深蘭科技在新冠百科知識圖譜類型推斷等三個任務中奪得第一

ss ? 來源:粵訊 ? 作者:粵訊 ? 2020-11-17 15:08 ? 次閱讀

11月12~15日,國內(nèi)知識圖譜和語義計算等領域的核心學術會議CCKS2020,在江西南昌成功舉行,深蘭科技DeepBlueAI團隊首次參加即斬獲三冠一亞,成為本屆會議唯一獲得多個冠軍的隊伍。團隊分別在“新冠百科知識圖譜類型推斷”、“面向金融領域的篇章級事件主體抽取”、“基于標題的大規(guī)模商品實體檢索”這三個(子)任務中奪得第一,在“面向中文短文本的實體鏈指”任務中僅以0.00002分之差屈居第二。此外,本屆組委會還特別評選出每一任務至多一項的“創(chuàng)新技術獎”,專門用于鼓勵創(chuàng)新性技術的使用,深蘭科技在“基于標題的大規(guī)模商品實體檢索”的任務中再次脫穎而出。

第十四屆全國知識圖譜與語義計算大會(CCKS:China Conference on Knowledge Graph and Semantic Computing)由中國中文信息學會語言與知識計算專業(yè)委員會主辦,主題是“知識圖譜與認知智能”,共設立8個相關主題的技術評測任務,旨在為研究人員提供測試知識圖譜與語義計算技術、算法及系統(tǒng)的平臺和資源,促進國內(nèi)知識圖譜領域的技術發(fā)展,此次吸引了包括華為、百度、騰訊、小米、北京大學、上海交通大學、浙江大學等知名企業(yè)和學府的團隊同臺競技。

隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,人們逐漸從信息時代進入智能時代。知識圖譜作為承載底層海量知識并支持上層智能應用的重要載體,在智能時代中扮演了極其重要的角色。尤其多模態(tài)知識圖譜的構(gòu)建,能夠讓基于知識圖譜的智能服務更好地理解真實世界的數(shù)據(jù)場景,進而更好地支撐各項上游任務和行業(yè)應用,如推薦系統(tǒng)、語義搜索、智能問答等。深蘭科技奪冠的三個任務方案,分別可在電商、金融、輿情監(jiān)控等領域的應用上發(fā)揮重要作用。

“新冠百科知識圖譜類型推斷”任務,要求從實體百科(包括百度百科、互動百科、維基百科、醫(yī)學百科)頁面出發(fā),從給定的數(shù)據(jù)中推斷相關實體的類型。然而,大量類型信息以非結(jié)構(gòu)化文本形式呈現(xiàn)于網(wǎng)絡頁面中,文本處理難度大,抽取結(jié)果同時保證高準確度和覆蓋率仍然是個極大的挑戰(zhàn)。針對數(shù)據(jù)集的特點,DeepBlueAI團隊構(gòu)建了數(shù)個基于BERT模型的文本分類器,并引入了多個外部數(shù)據(jù)集,最后將這些分類器進行融合得到最終判斷結(jié)果。實體類型是知識圖譜的重要組成,正確的實體類型是構(gòu)建一個高質(zhì)量知識圖譜的前提。

“事件”在金融領域是投資分析、資產(chǎn)管理的重要決策參考,也是知識圖譜的重要組成部分,而“事件抽取”是進行圖譜推理、事件分析的必要過程。在金融領域,“事件抽取”是一項十分重要的任務,也是自然語言處理領域一項比較復雜的任務,它的挑戰(zhàn)相當部分體現(xiàn)在文本復雜上:輸入的文本可能是句子、段落或者篇章,不定長度的文本使得限制文本長度的模型無法使用?!懊嫦蚪鹑陬I域的篇章級事件主體抽取”任務中,團隊使用了多標簽事件分類加實體識別Pipeline模型,在標準的多標簽分類模型中加入了特征提取模塊,實體識別模型采用BERT-LSTM-CRF與閱讀理解投票融合的方式,最終以較大優(yōu)勢獲得第一。

“基于標題的大規(guī)模商品實體檢索”是典型的語義識別類任務,在網(wǎng)購已經(jīng)成為一種生活方式的前提下,具有非常實用的價值。商品標題一般較短,上下文語境不豐富;用戶搜索時,文本口語化嚴重;商品標題中存在很多變異指代,沒有給定的指代映射表;這都需要對上下文語境進行精準理解,具有很大的挑戰(zhàn)。團隊針對商品檢索任務采用召回-粗排-精排的總體方案,在召回階段放棄了bm25、dssm等主流召回技術,創(chuàng)新性地使用Triplet BERT模型進行召回,在排序階段采用基于BERT的二分類排序方式,檢索準確率達到0.88489。最終不但排名第一,還收獲了創(chuàng)新技術獎。

從包括CCKS2020在內(nèi)的國內(nèi)外頂會的賽題任務設置中不難發(fā)現(xiàn),其共同點在于更注重了落地應用性。隨著社會的發(fā)展,人工智能已逐漸滲透到各個行業(yè)并轉(zhuǎn)化為實際應用,而深蘭科技早在成立之初就提出了“基礎研究與落地應用”齊頭并進的理念,并取得了有目共睹的成效。會議競賽的成績是對過往的檢驗,更是對今后不斷進取的鞭策,“人工智能服務民生”將是深蘭科技矢志不渝的目標。

責任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算
    +關注

    關注

    2

    文章

    439

    瀏覽量

    38672
  • 語義
    +關注

    關注

    0

    文章

    21

    瀏覽量

    8653
  • 知識圖譜
    +關注

    關注

    2

    文章

    132

    瀏覽量

    7677
收藏 人收藏

    評論

    相關推薦

    星電子將收購英國知識圖譜技術初創(chuàng)企業(yè)

    人工智能技術日新月異的今天,星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術創(chuàng)新實力。近日,星正式宣布完成了對英國領先的人工智能(AI)與知識圖譜技術初創(chuàng)企業(yè)Oxford Seman
    的頭像 發(fā)表于 07-18 14:46 ?465次閱讀

    不同類型神經(jīng)網(wǎng)絡回歸任務的應用

    神經(jīng)網(wǎng)絡是種強大的機器學習模型,可以用于各種任務,包括回歸。本文中,我們將討論不同類型的神經(jīng)網(wǎng)絡,以及它們回歸
    的頭像 發(fā)表于 07-11 10:27 ?811次閱讀

    知識圖譜與大模型之間的關系

    人工智能的廣闊領域中,知識圖譜與大模型是兩至關重要的概念,它們各自擁有獨特的優(yōu)勢和應用場景,同時又相互補充,共同推動著人工智能技術的發(fā)展。本文將從定義、特點、應用及相互關系等方面深入探討
    的頭像 發(fā)表于 07-10 11:39 ?765次閱讀

    微波測量的三個基本參量是什么

    微波測量是電子工程領域中的重要分支,它涉及到對微波信號的頻率、幅度、相位參數(shù)的測量。微波測量,有
    的頭像 發(fā)表于 05-28 14:46 ?874次閱讀

    CUBE FREERTOS三個三個任務之上的運行不起來是為什么?

    ,NULL,3,NULL); //xTaskCreate(CurrentWDEntry,\"Current_Task\",512,NULL,3,NULL); 只能最大運行兩任務,第三個
    發(fā)表于 05-11 08:04

    深蘭科技再次入圍《2024胡潤全球獨角獸榜》

    4月9日,胡潤研究院于廣州發(fā)布了《2024全球獨角獸榜》,榜單列出了全球成立于2000年之后,企業(yè)估值價值10億美元以上的非上市公司。深蘭科技繼2023年之后,再次入圍該榜單。
    的頭像 發(fā)表于 04-11 09:17 ?510次閱讀
    <b class='flag-5'>深蘭科</b>技再次入圍《2024胡潤全球獨角獸榜》

    百科技宣布與SK On簽訂《合作備忘錄》

    本周,容百科技宣布與SK On簽訂《合作備忘錄》,雙方將圍繞元和磷酸錳鐵鋰正極開展深度合作。
    的頭像 發(fā)表于 03-29 09:56 ?384次閱讀

    利用知識圖譜與Llama-Index技術構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準確、多樣化、有趣、邏輯和致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1036次閱讀
    利用<b class='flag-5'>知識圖譜</b>與Llama-Index技術構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)

    知識圖譜基礎知識應用和學術前沿趨勢

    知識圖譜(Knowledge Graph)以結(jié)構(gòu)化的形式描述客觀世界概念、實體及其關系。是融合了認知計算、知識表示與推理、信息檢索與抽取、自然語言處理、Web技術、機器學習與大數(shù)據(jù)挖掘等等方向的交叉學科。人工智能是以傳統(tǒng)符號派
    的頭像 發(fā)表于 01-08 10:57 ?811次閱讀
    <b class='flag-5'>知識圖譜</b>基礎<b class='flag-5'>知識</b>應用和學術前沿趨勢

    深蘭科技入選“2023數(shù)字經(jīng)濟獨角獸排行榜”

    12月19日-20日,“2023數(shù)字經(jīng)濟獨角獸大會”北京大興經(jīng)濟開發(fā)區(qū)隆重舉行。會上,還正式發(fā)布了“2023數(shù)字經(jīng)濟獨角獸排行榜”,深蘭科技成功入選。
    的頭像 發(fā)表于 12-22 10:36 ?465次閱讀

    深蘭科技入選財聯(lián)社“2023創(chuàng)好公司”榜單

    12月13日,“2023創(chuàng)好公司”評選榜單正式公布,深蘭科技成功入選,獲得該榜單“新能源汽車及自動駕駛”賽道的“創(chuàng)好公司”稱號。 “
    的頭像 發(fā)表于 12-15 19:09 ?951次閱讀
    <b class='flag-5'>深蘭科</b>技入選財聯(lián)社“2023<b class='flag-5'>科</b>創(chuàng)好公司”榜單

    深蘭科技連續(xù)第4年通過SGS的4體系審核

    直非常詳細嚴苛,而深蘭科技所設計的信息安全管理體系,貫穿了公司層、部門層、員工層,實現(xiàn)了對整個企業(yè)的無死角全覆蓋,如在公司層面,安排了企業(yè)信息安全培訓、漏掃滲透測試、業(yè)務連續(xù)性演練工作,并定期做考核;
    的頭像 發(fā)表于 12-14 09:28 ?705次閱讀

    電子學百科書-二極管的誕生計

    電子學百科書-二極管的誕生計
    的頭像 發(fā)表于 11-23 09:09 ?341次閱讀
    電子學<b class='flag-5'>中</b>的<b class='flag-5'>百科</b>書-二極管的誕生計

    深蘭科技再次通過ISO9001質(zhì)量管理體系ISO體系認證

    近日,國際權威第方認證機構(gòu)SGS對深蘭科技展開了年度ISO體系認證。經(jīng)過SGS派遣的4位外審員為期3天的嚴格審核,深蘭科技通過了今年的ISO
    的頭像 發(fā)表于 11-08 10:00 ?601次閱讀
    <b class='flag-5'>深蘭科</b>技再次通過ISO9001質(zhì)量管理體系<b class='flag-5'>等</b>ISO<b class='flag-5'>三</b>體系認證

    知識圖譜與大模型結(jié)合方法概述

    )LLM+KG協(xié)同使用,主要用于知識表示和推理兩方面。該文綜述了以上三個路線的代表性研究,探討了未來可能的研究方向。 知識圖譜(KG)和大語言模型(LLM)都是
    的頭像 發(fā)表于 10-29 15:50 ?881次閱讀
    <b class='flag-5'>知識圖譜</b>與大模型結(jié)合方法概述