0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于k近鄰與高斯噪聲的虛擬困難樣本增強(qiáng)方法

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:YeungNLP ? 作者:荷風(fēng)微擺 ? 2022-05-12 11:31 ? 次閱讀

在本文中,我們將介紹亞馬遜團(tuán)隊(duì)在ACL2022中的一篇論文VaSCL,該論文在SimCSE的基礎(chǔ)上,提出了一種基于k近鄰與高斯噪聲的虛擬困難樣本增強(qiáng)方法。作者在無(wú)監(jiān)督訓(xùn)練中,進(jìn)行困難樣本增強(qiáng),從而提高了模型的性能,并且超過(guò)了SimCSE。

6338e638-d19e-11ec-bce3-dac502259ad0.png

論文標(biāo)題:

Virtual Augmentation Supported Contrastive Learning of Sentence Representations

論文鏈接:

https://arxiv.org/abs/2110.08552

01

引言

在ACL2021中,陳丹琦團(tuán)隊(duì)提出了使用Dropout進(jìn)行正樣本增強(qiáng)的對(duì)比學(xué)習(xí)方法SimCSE,該方法操作簡(jiǎn)單卻十分有效,在無(wú)監(jiān)督對(duì)比學(xué)習(xí)中取得了非常好的效果。在有監(jiān)督SimCSE中,作者對(duì)困難負(fù)樣本的作用進(jìn)行了探究實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明,引入困難負(fù)樣本后,有監(jiān)督SimCSE的指標(biāo)從84.9提升至86.2。這說(shuō)明,在對(duì)比學(xué)習(xí)中,引入困難樣本是能夠提升模型效果的。

然而在無(wú)監(jiān)督SimCSE中,作者僅使用dropout的方式進(jìn)行了正樣本增強(qiáng),沒(méi)有額外引入困難樣本,這在一定程度上限制了模型的能力?;谶@個(gè)動(dòng)機(jī),亞馬遜提出了一種基于k近鄰與高斯噪聲的虛擬困難樣本增強(qiáng)的無(wú)監(jiān)督對(duì)比學(xué)習(xí)方法VaSCL。

02

論文解讀

基于Dropout的對(duì)比損失

在介紹VaSCL模型之前,我們先簡(jiǎn)單回顧一下無(wú)監(jiān)督SimCSE。假設(shè)訓(xùn)練時(shí)的batch size為N,將一個(gè)batch的數(shù)據(jù)記作,將同一個(gè)樣本分別輸入模型中兩次,使用不同的dropout mask編碼得到兩個(gè)向量和。則在規(guī)模為N的batch中,與的InfoNCE損失為:

基于k近鄰的虛擬增強(qiáng)對(duì)比損失

在無(wú)監(jiān)督SimCSE的損失函數(shù)的基礎(chǔ)上,作者還設(shè)計(jì)了一種基于k近鄰的虛擬困難樣本增強(qiáng)的損失函數(shù)。

將通過(guò)模型編碼之后得到向量序列。

作者通過(guò)以下方式獲得第i個(gè)句向量的虛擬困難樣本:

正樣本增強(qiáng):對(duì)添加高斯噪聲,得到,其中就是經(jīng)過(guò)高斯增強(qiáng)后的正樣本。

獲得k近鄰:獲得在中距離最近的k個(gè)負(fù)樣本,在本文中我們稱之為k近鄰,記作。

對(duì)于來(lái)說(shuō),是正樣本,是負(fù)樣本集合。則對(duì)于,k近鄰虛擬增強(qiáng)的對(duì)比損失如下。分子表示拉近與的距離,分母表示拉遠(yuǎn)與負(fù)樣本之間的距離。

在CV中,我們會(huì)為輸入的圖片添加高斯噪聲以增加模型的泛化性。添加了高斯噪聲的圖片,肉眼能看出微小的區(qū)別,但不會(huì)影響整張圖片的語(yǔ)義信息。所以為句向量添加合適的高斯噪聲,理論上也不會(huì)對(duì)句向量的語(yǔ)義信息產(chǎn)生很大的改變。

在的k近鄰中,存放的是距離最近的k個(gè)負(fù)樣本,也就是與最相似的k個(gè)負(fù)樣本。只要batch size足夠大,我們可以近似認(rèn)為,就是的困難負(fù)樣本集合,同樣也是的困難負(fù)樣本集合。

如何獲得上述的高斯噪聲呢?最容易想到的做法便是隨機(jī)生成一個(gè)高斯噪聲,直接添加到句向量中。但是為了提高模型的訓(xùn)練難度,生成更高質(zhì)量的高斯噪聲,作者生成若干個(gè)候選高斯噪聲,然后選出一個(gè)使得最大化的高斯噪聲。

從上述操作可以看出,對(duì)于最優(yōu)的高斯噪聲,作者希望它增強(qiáng)后的正樣本與的距離盡可能遠(yuǎn),與負(fù)樣本的距離盡可能近,作者希望這個(gè)高斯噪聲能夠?qū)δP彤a(chǎn)生盡可能大的迷惑性。通過(guò)這個(gè)高斯噪聲,我們就可以得到困難正樣本,并且從某種意義來(lái)說(shuō),也使得與的距離盡可能拉近,達(dá)到了增強(qiáng)負(fù)樣本難度的目的,做法確實(shí)挺巧妙。

VaSCL對(duì)比損失

63676d46-d19e-11ec-bce3-dac502259ad0.png

將上述兩種對(duì)比損失進(jìn)行組合,得到最終的VaSCL損失函數(shù):

這個(gè)損失函數(shù)的含義如下:

對(duì)于每個(gè)句子,拉近同一個(gè)句子經(jīng)過(guò)dropout之后的兩個(gè)句向量之間的距離,拉遠(yuǎn)它們與其他句子的距離。

對(duì)于每個(gè)句子,拉近原句向量與高斯噪聲增強(qiáng)之后的句向量的距離,拉遠(yuǎn)它們與k近鄰負(fù)樣本之間的距離。

03

實(shí)驗(yàn)結(jié)果

作者分別在STS任務(wù)、短文本聚類、意圖識(shí)別等任務(wù)中進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如下表所示??梢钥吹?,在三種任務(wù)中,絕大部分?jǐn)?shù)據(jù)集上,VaSCL的表現(xiàn)都要優(yōu)于SimCSE,這表明了基于k近鄰與高斯噪聲的困難樣本增強(qiáng)的有效性。

6385a8ce-d19e-11ec-bce3-dac502259ad0.png

63c1165c-d19e-11ec-bce3-dac502259ad0.png

63d37914-d19e-11ec-bce3-dac502259ad0.png

04

總結(jié)

SimCSE通過(guò)dropout mask這種簡(jiǎn)單的方法,避免了人工進(jìn)行正樣本增強(qiáng)所帶來(lái)的語(yǔ)義改變的問(wèn)題,并且在無(wú)監(jiān)督訓(xùn)練中取得了不錯(cuò)的效果。而VaSCL論文延續(xù)了SimCSE這種思想,引入了高斯噪聲進(jìn)行正樣本增強(qiáng),有著異曲同工之妙。

VaSCL在SimCSE的基礎(chǔ)上,也進(jìn)行了困難樣本的增強(qiáng)。在進(jìn)行高斯噪聲增強(qiáng)時(shí),使得增強(qiáng)的樣本與原始樣本盡可能不相似,與負(fù)樣本盡可能相似,已達(dá)到【混淆視聽(tīng)】的效果。通過(guò)這種方式,VaSCL在絕大多數(shù)據(jù)集上的表現(xiàn),也超過(guò)了SimCSE。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 噪聲
    +關(guān)注

    關(guān)注

    13

    文章

    1113

    瀏覽量

    47330
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4263

    瀏覽量

    62243
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3073

    瀏覽量

    48586

原文標(biāo)題:ACL'22 | VaSCL:基于k近鄰與高斯噪聲的困難樣本增強(qiáng)的對(duì)比學(xué)習(xí)方法,超越SimCSE

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    高斯濾波和均值濾波的區(qū)別

    高斯濾波和均值濾波在圖像處理中都是常用的平滑濾波方法,但它們之間存在一些關(guān)鍵的區(qū)別。以下是兩者之間的主要區(qū)別: 1. 濾波原理 高斯濾波 : 是一種線性平滑濾波,它使用高斯函數(shù)來(lái)計(jì)算卷
    的頭像 發(fā)表于 09-29 09:40 ?272次閱讀

    高斯濾波和雙邊濾波的區(qū)別

    高斯濾波和雙邊濾波在圖像處理中都是常用的平滑濾波技術(shù),但它們之間存在一些顯著的區(qū)別。以下是兩者之間的主要區(qū)別: 一、基本原理 高斯濾波 : 是一種線性平滑濾波,適用于消除高斯噪聲。 其
    的頭像 發(fā)表于 09-29 09:37 ?151次閱讀

    高斯濾波的特點(diǎn)有哪些

    、背景)則相對(duì)保留。這種平滑處理有助于去除圖像中的噪聲,改善圖像質(zhì)量。 邊緣保留 : 與其他平滑濾波方法相比,高斯濾波在平滑圖像的同時(shí)能夠較好地保留圖像的邊緣信息。這是因?yàn)?b class='flag-5'>高斯濾波的權(quán)
    的頭像 發(fā)表于 09-29 09:36 ?115次閱讀

    高斯卷積核函數(shù)在圖像采樣中的意義

    。這種平滑處理通過(guò)減小圖像中像素之間的差異來(lái)模糊圖像,有助于去除圖像中的高頻噪聲和細(xì)節(jié)紋理,使圖像看起來(lái)更加平滑。 去噪效果 :在圖像的采集或傳輸過(guò)程中,往往會(huì)受到各種噪聲的干擾。高斯卷積核函數(shù)能夠通過(guò)平滑處理有效地抑
    的頭像 發(fā)表于 09-29 09:33 ?235次閱讀

    高斯濾波的基本原理有哪些

    高斯濾波的基本原理可以從以下幾個(gè)方面進(jìn)行闡述: 一、定義與性質(zhì) 定義 :高斯濾波(Gaussian Filter)是一種常見(jiàn)的圖像處理技術(shù),實(shí)質(zhì)上是一種信號(hào)的濾波器,用于平滑和降噪圖像。它采用高斯
    的頭像 發(fā)表于 09-29 09:27 ?233次閱讀

    增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)的聯(lián)系和區(qū)別

    增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)是兩種不同的技術(shù),它們?cè)谠S多方面都有聯(lián)系和區(qū)別。 一、增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)的定義 增強(qiáng)現(xiàn)實(shí)(
    的頭像 發(fā)表于 07-08 11:00 ?1709次閱讀

    增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)和虛擬現(xiàn)實(shí)技術(shù)(VR)的區(qū)別?

    增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)和虛擬現(xiàn)實(shí)技術(shù)(VR)是兩種不同的技術(shù),它們?cè)谠S多方面都有明顯的區(qū)別。以下是對(duì)這兩種技術(shù)的介紹和比較。 定義 增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)是一種將虛擬信息疊加到現(xiàn)實(shí)世界中的
    的頭像 發(fā)表于 07-04 11:40 ?813次閱讀

    labview能不能對(duì)采集的聲音信號(hào)進(jìn)行高斯噪聲信號(hào)分析

    請(qǐng)問(wèn)對(duì)采集到的聲音信號(hào)進(jìn)行高斯加噪分析,能不能對(duì)聲音信號(hào)直接加上高斯噪聲信號(hào)?
    發(fā)表于 05-27 15:18

    什么是高斯光束

    圖1:高斯光束和平頂光束在相同的光功率下,顯示高斯光束的峰值強(qiáng)度是平頂光束的兩倍 大多數(shù)激光束都是高斯光束,盡管在某些情況下,具有非高斯輻照度分布是有益的。隨著離激光束橫截面中心的距離
    的頭像 發(fā)表于 04-11 06:32 ?904次閱讀
    什么是<b class='flag-5'>高斯</b>光束

    噪聲的測(cè)量方法

    有效的方法,本期介紹噪聲的測(cè)量方法。 常見(jiàn)觀測(cè)噪聲的設(shè)備為示波器,而示波器在正確操作使用下測(cè)量精度為3%,且本身存在底噪。搭配不同的探頭使用,觀測(cè)到的
    的頭像 發(fā)表于 04-10 15:16 ?912次閱讀
    <b class='flag-5'>噪聲</b>的測(cè)量<b class='flag-5'>方法</b>

    基于FIR濾波器的帶限白噪聲的設(shè)計(jì)方案實(shí)現(xiàn)

    高斯噪聲:是一種隨機(jī)噪聲,其時(shí)域內(nèi)的信號(hào)幅度的統(tǒng)計(jì)規(guī)律服從高斯分布。
    的頭像 發(fā)表于 04-09 09:08 ?991次閱讀
    基于FIR濾波器的帶限白<b class='flag-5'>噪聲</b>的設(shè)計(jì)方案實(shí)現(xiàn)

    什么是相位噪聲 產(chǎn)生相位噪聲的原因 相位噪聲的表示方法及影響

    什么是相位噪聲 產(chǎn)生相位噪聲的原因 相位噪聲的表示方法 相位噪聲的影響 測(cè)量相位噪聲的常用
    的頭像 發(fā)表于 01-31 09:28 ?2988次閱讀

    同軸線測(cè)電源噪聲的測(cè)試方法

    在電子設(shè)備測(cè)試中,電源噪聲測(cè)試是一項(xiàng)非常重要的工作。而同軸線測(cè)電源噪聲測(cè)試方法是一種常用且有效的測(cè)試手段。本文將對(duì)同軸線測(cè)電源噪聲測(cè)試方法進(jìn)
    的頭像 發(fā)表于 01-11 10:53 ?693次閱讀
    同軸線測(cè)電源<b class='flag-5'>噪聲</b>的測(cè)試<b class='flag-5'>方法</b>

    虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)含義是什么

    虛擬現(xiàn)實(shí)(Virtual Reality,簡(jiǎn)稱VR)和增強(qiáng)現(xiàn)實(shí)(Augmented Reality,簡(jiǎn)稱AR)是近年來(lái)科技領(lǐng)域的熱門(mén)話題,它們?yōu)槿藗儙?lái)了全新的交互體驗(yàn)和生活方式。本文將對(duì)虛擬
    的頭像 發(fā)表于 12-30 10:37 ?8605次閱讀

    什么是折合到輸入端噪聲?如何提高ADC分辨率并降低噪聲?

    ——沒(méi)有作用!無(wú)論對(duì)多少樣本進(jìn) 行平均,答案始終相同。但只要將足夠大的噪聲增加到輸入信號(hào)中,使得直方圖中有一個(gè) 以上的代碼,那么均值方法又會(huì)發(fā)揮效用。因此,少量噪聲可能是好事情(至少對(duì)
    發(fā)表于 12-18 08:21