0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對話系統(tǒng)最原始的實(shí)現(xiàn)方式 檢索式對話

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-09-25 17:08 ? 次閱讀

對話系統(tǒng)可以說是NLP領(lǐng)域目前已知最扎實(shí)的落地場景了,整個流程都脫離不了NLP的核心作用,而且整個流程涉及NLP的大量任務(wù),因此大量的研究都圍繞著對話系統(tǒng)來開展,也因此產(chǎn)生了很多很有意義的新方法。而檢索式對話作為對話系統(tǒng)最原始的實(shí)現(xiàn)方式,又蘊(yùn)涵著什么有意思的東西,我們來看看。

什么是對話系統(tǒng)

對話從來就不是一個簡單的任務(wù),這是一個涉及理解、生成、交互等多個方向技術(shù)的綜合實(shí)體。

理解:需要理解對方輸出的內(nèi)容,只有這樣才能給與正確的回應(yīng)。

生成:基于理解的內(nèi)容,給出合適的結(jié)果。

交互:在多輪對話上,需要記錄跟蹤整個對話過程中涉及的內(nèi)容。

要同時(shí)完成這么多任務(wù),相必是非常復(fù)雜的,同時(shí)場景上的復(fù)雜性,客服、語音助手、閑聊等,也造就了對話系統(tǒng)的復(fù)雜性,最終成為了NLP里面一個重要的研究抓手和目標(biāo)。

檢索式對話

檢索式對話按照個人理解應(yīng)該是最為經(jīng)典的解決方案,把一個對話問題抽象為一個搜索問題,大量早期的對話系統(tǒng)都是用這種解決方案來實(shí)現(xiàn)的,甚至在現(xiàn)在,一些簡單的對話任務(wù),都可以用它來簡單實(shí)現(xiàn),可以說是工業(yè)界最喜歡的一種實(shí)現(xiàn)方式了。簡單地說,整個檢索式對話的流程可以用這個流程來表示:

query理解->檢索召回->相似度排序

沒錯,看著就是搜索的流程,對句子進(jìn)行理解,理解后到數(shù)據(jù)庫里面進(jìn)行召回,召回以后再進(jìn)行相似度排序找到最佳答案。既然流程被拆解,那我們來看看每一步里面都會做什么東西。

query理解

簡單的說,其實(shí)就是去理解用戶輸入的內(nèi)容說的是啥,一般的自然語言理解主要關(guān)心的是這么幾個技術(shù)細(xì)節(jié):

意圖和話題。即用戶談?wù)摰氖悄膫€領(lǐng)域的事情,從而剖析用戶期待對話系統(tǒng)返回的是什么。這個問題常被當(dāng)成分類問題來處理,用分類規(guī)則或者是方法來進(jìn)行意圖識別。一旦抽象成分類問題大家就應(yīng)該大概理解了,就是fastext、textcnn之類的玩意了。

槽位和實(shí)體。我們需要知道用戶需要什么,需要抽取用戶的具體實(shí)體,這個經(jīng)常被抽象為序列標(biāo)注問題,此時(shí)CRF、BILSTM-CRF之類的方法就是基操了。

當(dāng)然,也有一些工程上會把它抽象化,只是轉(zhuǎn)化為向量或者矩陣,下游用矩陣進(jìn)行搜索。

總之,query理解這塊,主要是為了解析用戶說的內(nèi)容,去理解他的語義,這樣我們才能為用戶找到合適的答案。

檢索召回

召回這塊,按照搜索的操作,就是拿著我們提取的槽位和實(shí)體,甚至是我們解析的向量和矩陣,根據(jù)意圖和話題放到搜索引擎里面去檢索,搜索引擎中有倒排索引,直接拿著關(guān)鍵詞就能找到對應(yīng)的內(nèi)容。

然而,問題其實(shí)不在怎么檢索召回,而是在于召回的內(nèi)容怎么來。相比搜索引擎,對話系統(tǒng)的內(nèi)容可能更加不結(jié)構(gòu)化,同時(shí)可得性由于特定需求其實(shí)并不好得,例如淘寶的客服,每家店的商品性質(zhì)各不相同,很難需要召回的結(jié)果,有正確答案的就更難了,所以,常用的方式有這幾種:

對高頻問題進(jìn)行編輯,然后統(tǒng)一維護(hù)管理。數(shù)白了就是人編。

基于一些模板進(jìn)行組裝生成。

利用文本生成的方式進(jìn)行處理。

相似度排序

一般地,根據(jù)用戶最簡單的query,往往能召回很多可能比較好的答案,此時(shí)我們要選擇最優(yōu)的給用戶。衡量最優(yōu)的標(biāo)準(zhǔn)之一就是相似度,語義相似度就是最為經(jīng)典或者說基本的相似度衡量方式,當(dāng)然搜索領(lǐng)域的ctr(不是點(diǎn)擊率)、cqr、BM25等,這些非?;镜脑?。

對經(jīng)典的語義相似度,就要說2013年的DSSM了,這個模型可謂是開了語義相似度雙塔結(jié)構(gòu)的先河。

優(yōu)缺點(diǎn)和應(yīng)用場景

說完了具體的流程,然后再說說檢索式對話的優(yōu)點(diǎn)和應(yīng)用場景。

先談?wù)剝?yōu)點(diǎn)吧。

應(yīng)該是這么多種對話實(shí)現(xiàn)方式中對樣本依賴最低的。

實(shí)現(xiàn)成本低,初版本實(shí)現(xiàn)速度快,后續(xù)拓展

三段處理,可控性強(qiáng)。

因?yàn)檫@些優(yōu)點(diǎn),檢索式對話在工程上被廣泛應(yīng)用。

客服機(jī)器人。尤其是淘寶的場景,這里有非常專業(yè)的內(nèi)容,例如用戶會問浴缸的長寬高,會問電腦的配置等等,這些用檢索式非常方便。

問答類對話。例如小猿搜題之類的,還有一些百科類的問答,雖然不知道具體公司的操作,但是用檢索式的確會非常方便。

對話系統(tǒng)初版本。即使是很多開放域,第一版本的構(gòu)造都會嘗試檢索式對話的架構(gòu)。

當(dāng)然了,檢索式對話這套實(shí)現(xiàn)方案還是有很大的局限性,因此才會有很多項(xiàng)目嘗試做一些別的做法,先聊聊缺點(diǎn):

答案相對固定,靈活性不足,在一些閑聊場景,會非常困難。如,用戶問一句,你好,后面有很多答案都是合理的。

任務(wù)型的對話,在各種語音助手,小度、siri之類的很常見,一些引導(dǎo)用戶完成任務(wù)的工作,對話機(jī)器人是需要做一個主動帶節(jié)奏的角色,檢索式基本辦不到。

多輪對話。在檢索式對話基礎(chǔ)上,單輪對話升級為多輪對話其實(shí)是存在明顯的天花板,成本也比較高,雖然已經(jīng)有一些相關(guān)的操作,如Multi-view、SMN之類的,但是實(shí)現(xiàn)的難度還是會有些高。

小結(jié)

小結(jié)一下,檢索式對話作為對話系統(tǒng)一個經(jīng)典的技術(shù),非常有必要學(xué)習(xí)和探究,今天大概講了一些流程和概述,也希望大家有所收獲。

責(zé)任編輯:xj

原文標(biāo)題:【對話】對話系統(tǒng)經(jīng)典:檢索式對話

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    482

    瀏覽量

    21971
  • 對話系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    2177

原文標(biāo)題:【對話】對話系統(tǒng)經(jīng)典:檢索式對話

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    商湯日日新·商量-擬人大模型帶你對話未來,感受真實(shí)

    對此,專注于“擬人對話”領(lǐng)域的商量-擬人大模型(SenseChat-Character)應(yīng)運(yùn)而生,通過實(shí)現(xiàn)精準(zhǔn)人設(shè)展現(xiàn)以及具有沉浸感的交互,讓智能體更像栩栩如生的人。
    的頭像 發(fā)表于 09-18 15:57 ?353次閱讀

    軟件系統(tǒng)的數(shù)據(jù)檢索設(shè)計(jì)

    軟件系統(tǒng)的數(shù)據(jù)檢索設(shè)計(jì) 隨著業(yè)務(wù)量加大,數(shù)據(jù)檢索量也會日益增多,為了減輕數(shù)據(jù)庫壓力,本系統(tǒng)采用ElasticSearch來實(shí)現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 08-22 14:08 ?193次閱讀
    軟件<b class='flag-5'>系統(tǒng)</b>的數(shù)據(jù)<b class='flag-5'>檢索</b>設(shè)計(jì)

    定時(shí)關(guān)閉對話

    發(fā)一個項(xiàng)目上用的定時(shí)對話
    發(fā)表于 06-07 10:07

    潤和軟件與新財(cái)富聯(lián)合發(fā)布金融AI對話搜索引擎“金融搜一搜”產(chǎn)品

    3月29日,新財(cái)富投顧嘉年華活動中,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)與深圳市新財(cái)富數(shù)字科技有限責(zé)任公司(以下簡稱“新財(cái)富”)聯(lián)合發(fā)布了金融AI對話搜索引擎——“金融搜一搜”產(chǎn)品,助力金融投資場景智能化升級。
    的頭像 發(fā)表于 04-02 10:15 ?382次閱讀
    潤和軟件與新財(cái)富聯(lián)合發(fā)布金融AI<b class='flag-5'>對話</b><b class='flag-5'>式</b>搜索引擎“金融搜一搜”產(chǎn)品

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對話

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對話
    的頭像 發(fā)表于 03-21 09:44 ?345次閱讀
    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次<b class='flag-5'>對話</b>

    育碧發(fā)布全新生成AI原型:NPC以自發(fā)行為展開對話

    近日,育碧巴黎工作室推出了一款名為 NEON NPC 的全新 AI 原型項(xiàng)目。借助 NVIDIA 的 Audio2Face 及 InWorld 的 LLM 大語言模型技術(shù),NPC可以根據(jù)角色設(shè)定自發(fā)生成對話。
    的頭像 發(fā)表于 03-20 10:17 ?365次閱讀

    用于對話AI的高性能MEMS麥克風(fēng),助力改進(jìn)用戶體驗(yàn)

    對話人工智能(AI)是一個快速發(fā)展的機(jī)器學(xué)習(xí)(ML)領(lǐng)域,旨在使人機(jī)交互更加自然直觀。
    的頭像 發(fā)表于 03-12 09:44 ?730次閱讀
    用于<b class='flag-5'>對話</b><b class='flag-5'>式</b>AI的高性能MEMS麥克風(fēng),助力改進(jìn)用戶體驗(yàn)

    鴻蒙開發(fā)實(shí)戰(zhàn)-手寫文心一言AI對話APP

    本文我們學(xué)習(xí)使用了基本組件的使用,網(wǎng)絡(luò)請求以及狀態(tài)管理,使用了ForEach循環(huán)渲染來構(gòu)建對話界面。并且在HarmonyOS設(shè)備上成功運(yùn)行
    的頭像 發(fā)表于 01-24 18:02 ?946次閱讀
    鴻蒙開發(fā)實(shí)戰(zhàn)-手寫文心一言AI<b class='flag-5'>對話</b>APP

    西門子博途中啟用類型版本對話

    對話框中,版本號在最后一個位置自動遞增。這樣可以識別字段中的更改。
    的頭像 發(fā)表于 01-18 10:49 ?660次閱讀
    西門子博途中啟用類型版本<b class='flag-5'>對話</b>框

    GUI高級組件對話框代碼

    簡單輸入對話框 simpledialog(簡單對話框)包含如下常用函數(shù): 實(shí)操代碼 """簡單對話框""" from tkinter.simpledialog import *root = Tk
    的頭像 發(fā)表于 11-26 17:05 ?836次閱讀
    GUI高級組件<b class='flag-5'>對話</b>框代碼

    GUI圖形界面編程文件對話

    文件對話框 文件對話框幫助我們實(shí)現(xiàn)可視化的操作目錄、操作文件. 將文件、目錄的信息傳入到程序中 文件對話框包含如下一些常用函數(shù) 命名參數(shù) options 的常見值如下: 實(shí)操代碼——文
    的頭像 發(fā)表于 11-26 16:58 ?786次閱讀
    GUI圖形界面編程文件<b class='flag-5'>對話</b>框

    自然對話語音開啟人機(jī)交互的未來之窗

    隨著人工智能的快速發(fā)展,自然對話語音技術(shù)成為了人機(jī)交互的重要領(lǐng)域。這項(xiàng)技術(shù)讓計(jì)算機(jī)能夠理解、生成和回應(yīng)人類的語言,使得交流變得更加便捷和自然。在過去幾年里,自然對話語音技術(shù)取得了令人矚目的進(jìn)展,不僅
    的頭像 發(fā)表于 11-09 15:52 ?370次閱讀

    自然對話語音數(shù)據(jù):人機(jī)交互的新紀(jì)元與挑戰(zhàn)

    自然對話語音數(shù)據(jù)是指以自然語言進(jìn)行交流的語音數(shù)據(jù),它代表著人機(jī)交互技術(shù)的巨大進(jìn)步。隨著人工智能和語音識別技術(shù)的飛速發(fā)展,我們正逐漸邁入一個可以通過聲音與計(jì)算機(jī)進(jìn)行自然對話的新時(shí)代。本文將深入探討自然對話語音數(shù)據(jù)的重要性,技術(shù)原理
    的頭像 發(fā)表于 11-08 17:01 ?388次閱讀

    蘋果Vision Pro頭顯新專利:可在虛擬會議展開私人對話

    蘋果公司希望將Vision Pro頭顯應(yīng)用于計(jì)算機(jī)生成的現(xiàn)實(shí)環(huán)境中,實(shí)現(xiàn)私人對話功能。在計(jì)算機(jī)生成的現(xiàn)實(shí)環(huán)境中,為每個用戶映射虛擬數(shù)字化的形象。
    的頭像 發(fā)表于 11-08 16:51 ?1405次閱讀

    全網(wǎng)尋找“何同學(xué),對話“極客”CEO

    點(diǎn)擊藍(lán)字?關(guān)注我們 還記得那個對話蘋果CEO的何同學(xué)么? 自信自如的談吐,收獲全網(wǎng)點(diǎn)贊!? 其實(shí),給您一個機(jī)會, 您一樣也可以是下一個“何同學(xué)”! 機(jī)會來啦,您來么? 2023年11月, 安森美
    的頭像 發(fā)表于 10-27 09:35 ?467次閱讀
    全網(wǎng)尋找“何同學(xué),<b class='flag-5'>對話</b>“極客”CEO