0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自然語言處理之情感分析

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-05-21 10:27 ? 次閱讀

情感分析是指根據(jù)文本數(shù)據(jù)(例如書面評(píng)論和社交媒體帖子)自動(dòng)解釋和分類情感(通常是積極、消極或中立)的分析過程。

什么是情感分析?

情感分析是一個(gè)自然語言處理 (NLP) 的分支,它使用機(jī)器學(xué)習(xí)來分析和分類文本數(shù)據(jù)的情感基調(diào)?;灸P椭饕獙W⒂诜e極、消極和中立的分類,但也可能包含發(fā)言者的潛在情感(愉悅、生氣、侮辱等)以及購(gòu)買意圖。

上下文會(huì)增加情感分析的復(fù)雜性。例如,感嘆句“沒什么!” 取決于發(fā)言者對(duì)產(chǎn)品是否喜歡所做出的評(píng)價(jià),其含義可能截然不同。為了理解“我喜歡它”這個(gè)短語,機(jī)器必須能夠理清上下文,并理解“它”指的是什么。諷刺和挖苦也具有挑戰(zhàn)性,因?yàn)榘l(fā)言者可能會(huì)說一些積極的內(nèi)容,但其表達(dá)的是相反的意思。

情感分析有多種類型?;趯用娴那楦蟹治鰧⑸钊胍粋€(gè)層次,以確定哪些特定特征或?qū)用嬲诋a(chǎn)生積極、中立或消極的情感。企業(yè)可以使用這種見解來找出產(chǎn)品中的缺點(diǎn),或反之,找出產(chǎn)品中產(chǎn)生意外熱情的特征。情感分析是一種變體,可試圖確定演講者圍繞主題的情感強(qiáng)度。意圖分析決定采取行動(dòng)的可能性。

為什么要使用情感分析?

企業(yè)可以使用來自情感分析的見解來改進(jìn)其產(chǎn)品、調(diào)優(yōu)營(yíng)銷消息、糾正誤解并確定積極的影響因素。

社交媒體革新了人們對(duì)于產(chǎn)品和服務(wù)的決策方式。在旅游、酒店和消費(fèi)電子產(chǎn)品等市場(chǎng)中,現(xiàn)在人們通常認(rèn)為客戶評(píng)價(jià)至少與專業(yè)評(píng)論家的評(píng)估同樣重要。TripAdvisor、Google 和 Yelp 上的 Amazon 評(píng)分和評(píng)價(jià)等來源可以切實(shí)決定產(chǎn)品的成敗。博客、Twitter、Facebook 和 Instagram 等低結(jié)構(gòu)性的渠道還可提供有關(guān)客戶情感的有用見解,以及激發(fā)贊譽(yù)或譴責(zé)的產(chǎn)品特征和服務(wù)的反饋。

手動(dòng)分析客戶或潛在客戶所生成的大量文本非常耗時(shí)。社交媒體、電子郵件、支持票證、聊天、產(chǎn)品評(píng)價(jià)和推薦的情感分析已成為幾乎所有垂直行業(yè)中的重要資源。它非常有助于幫助企業(yè)獲取見解、了解客戶、預(yù)測(cè)和增強(qiáng)客戶體驗(yàn)、定制營(yíng)銷活動(dòng),以及幫助決策制定。

情感分析用例

情感分析的示例用例包括以下內(nèi)容:

產(chǎn)品設(shè)計(jì)師可使用情感分析,來確定哪些特征會(huì)與客戶產(chǎn)生共鳴,因此這些功能值得額外投資和關(guān)注。反之,他們也可以了解產(chǎn)品或特征何時(shí)下降,并對(duì)其進(jìn)行調(diào)整以防止庫(kù)存進(jìn)入折扣店。

營(yíng)銷組織在很大程度上依靠情感分析來調(diào)優(yōu)消息、發(fā)現(xiàn)在線影響因素,以及構(gòu)建積極的口碑。

零售組織挖掘情感以確定可能銷售良好的產(chǎn)品,并相應(yīng)地調(diào)整其庫(kù)存和促銷活動(dòng)。

投資者可以識(shí)別在線對(duì)話中出現(xiàn)的新趨勢(shì),這些趨勢(shì)可能預(yù)示著市場(chǎng)機(jī)遇。

政客可使用它對(duì)選民就重要問題的態(tài)度進(jìn)行抽樣。

情感分析的工作原理

機(jī)器學(xué)習(xí)特征工程

特征工程是將原始數(shù)據(jù)轉(zhuǎn)換為機(jī)器學(xué)習(xí)算法輸入的過程。為了在機(jī)器學(xué)習(xí)算法中應(yīng)用該過程,必須將特征輸入到特征向量中,而特征向量是代表每個(gè)特征值的數(shù)字向量。情感分析需要將文本數(shù)據(jù)輸入到詞向量中,這些詞向量是代表每個(gè)單詞值的數(shù)字向量。可以使用計(jì)數(shù)技術(shù)(如 Bag of Words (BoW)、bag-of-ngrams 或 Term Frequency/Inverse Document Frequency (TF-IDF))將輸入文本編碼為詞向量。

使用監(jiān)督式機(jī)器學(xué)習(xí)進(jìn)行情感分類。

將輸入文本轉(zhuǎn)換為詞向量后,分類機(jī)器學(xué)習(xí)算法可用于情感分類。分類是一系列監(jiān)督式機(jī)器學(xué)習(xí)算法,基于已標(biāo)記的數(shù)據(jù)(例如標(biāo)記為積極或消極的文本)來識(shí)別物品所屬的類別(例如文本是消極還是積極)。

以下分類機(jī)器學(xué)習(xí)算法可用于情感分析:

Na?ve Bayes 是一系列概率算法,用于確定輸入數(shù)據(jù)類別的條件概率。

支持向量機(jī)在 N 維空間(N 為特征數(shù))中查找對(duì)數(shù)據(jù)點(diǎn)進(jìn)行明顯分類的超平面。

邏輯回歸使用邏輯函數(shù)對(duì)特定類別的概率進(jìn)行建模。

使用深度學(xué)習(xí)進(jìn)行情感分析

深度學(xué)習(xí) (DL) 是機(jī)器學(xué)習(xí) (ML) 的一個(gè)分支,其使用多層人工神經(jīng)網(wǎng)絡(luò)精準(zhǔn)完成 NLP 和其他任務(wù)。DL 詞嵌入技術(shù)(例如 Word2Vec)通過學(xué)習(xí)詞關(guān)聯(lián)、含義、語義和語法,以有意義地對(duì)詞進(jìn)行編碼。DL 算法還支持 NLP 模型的端到端訓(xùn)練,而無需手動(dòng)從原始輸入數(shù)據(jù)中設(shè)計(jì)特征。

深度學(xué)習(xí)算法有許多不同的變體。時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)是解析語言模式和序列數(shù)據(jù)的數(shù)學(xué)工具。這些自然語言處理大腦,可為 Amazon Alexa 提供聽力和語音,也可用于語言翻譯、股票預(yù)測(cè)和算法交易。Transformer 深度學(xué)習(xí)模型,如 BERT (Bidirectional Encoder Representations from Transformers),是時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)的一個(gè)替代方案,它應(yīng)用了一種注意力技術(shù) – 通過將注意力集中在前后最相關(guān)的詞上來解析一個(gè)句子。BERT 通過在意圖識(shí)別、情感分析等基準(zhǔn)上提供與人類基準(zhǔn)相媲美的準(zhǔn)確性,徹底改變了 NLP 的進(jìn)展。它具有深度雙向的優(yōu)勢(shì),相比于其他文本編碼機(jī)制,它能夠更好地理解和保留上下文。訓(xùn)練語言模型時(shí),遭遇的一個(gè)關(guān)鍵挑戰(zhàn)是缺少標(biāo)記數(shù)據(jù)。BERT 在無監(jiān)督任務(wù)上接受訓(xùn)練,通常使用書籍語料庫(kù)、英語維基百科等的非結(jié)構(gòu)化數(shù)據(jù)集。

GPU:加速 NLP 和情感分析

自然語言處理中近年來不斷取得的進(jìn)步和突破是驅(qū)動(dòng) NLP 增長(zhǎng)的一個(gè)因素,其中重要的是部署 GPU 來處理日漸龐大且高度復(fù)雜的語言模型。

一個(gè)由數(shù)百個(gè)核心組成的 GPU,可以并行處理數(shù)千個(gè)線程。GPU 已成為訓(xùn)練 ML 和 DL 模型及執(zhí)行推理的首選平臺(tái),因?yàn)樗鼈兊男阅鼙燃?CPU 平臺(tái)高 10 倍。

先進(jìn)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可能有數(shù)百萬乃至十億以上的參數(shù)需要通過反向傳播進(jìn)行調(diào)整。此外,它們需要大量的訓(xùn)練數(shù)據(jù)才能實(shí)現(xiàn)較高的準(zhǔn)確度,這意味著成千上萬乃至數(shù)百萬的輸入樣本必須同時(shí)進(jìn)行向前和向后傳輸。由于神經(jīng)網(wǎng)絡(luò)由大量相同的神經(jīng)元構(gòu)建而成,因此本質(zhì)上具有高度并行性。這種并行性會(huì)自然映射到 GPU,因此相比僅依賴 CPU 的訓(xùn)練,計(jì)算速度會(huì)大幅提高。因此,GPU 已成為訓(xùn)練基于神經(jīng)網(wǎng)絡(luò)的大型復(fù)雜系統(tǒng)的首選平臺(tái),推理運(yùn)算的并行性質(zhì)也有助于在 GPU 上執(zhí)行。此外,像 BERT 這樣基于 Transformer 的深度學(xué)習(xí)模型不需要按順序處理連續(xù)數(shù)據(jù),與 RNN 相比,可以在 GPU 上實(shí)現(xiàn)更多的并行化,并減少訓(xùn)練時(shí)間。

NVIDIA GPU 加速 AI 庫(kù)

借助 NVIDIA GPU 和 CUDA-X AI 庫(kù),可快速訓(xùn)練和優(yōu)化大量的先進(jìn)語言模型,從而在幾毫秒或幾千分之一秒內(nèi)運(yùn)行推理。這是一項(xiàng)重大進(jìn)步,可以結(jié)束快速 AI 模型與大型復(fù)雜 AI 模型之間的權(quán)衡。在與復(fù)雜語言模型協(xié)作時(shí),NVIDIA GPU 的并行處理能力和 Tensor Core 架構(gòu)可實(shí)現(xiàn)更高的吞吐量和可擴(kuò)展性,從而為 BERT 的訓(xùn)練和推理提供優(yōu)異的性能。

NVIDIA GPU 加速的端到端數(shù)據(jù)科學(xué)

基于 CUDA-X AI 構(gòu)建的 NVIDIA RAPIDS 軟件庫(kù)套件使您能夠自由地在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析流程。此套件依靠 NVIDIA CUDA 基元進(jìn)行低級(jí)別計(jì)算優(yōu)化,但通過用戶友好型 Python 接口能夠?qū)崿F(xiàn) GPU 并行化和高帶寬顯存速度。

NVIDIA GPU 加速的深度學(xué)習(xí)框架

GPU 加速 DL 框架為設(shè)計(jì)和訓(xùn)練自定義深度神經(jīng)網(wǎng)絡(luò)帶來靈活性,并為 Python 和 C/C++ 等常用編程語言提供編程接口。MXNet、PyTorch、TensorFlow 等廣泛使用的深度學(xué)習(xí)框架依賴于 NVIDIA GPU 加速庫(kù),能夠提供高性能的多 GPU 加速訓(xùn)練。

后續(xù)步驟

NVIDIA 提供經(jīng)過優(yōu)化的軟件堆棧,可加速深度學(xué)習(xí)工作流程的訓(xùn)練和推理階段。如需詳細(xì)了解相關(guān)信息,請(qǐng)?jiān)L問 NVIDIA 深度學(xué)習(xí)主頁(yè)。

開發(fā)者、研究人員和數(shù)據(jù)科學(xué)家可以通過深度學(xué)習(xí)示例輕松訪問 NVIDIA 優(yōu)化深度學(xué)習(xí)框架容器化,這些示例針對(duì) NVIDIA GPU 進(jìn)行了性能調(diào)整和測(cè)試。這能夠消除對(duì)軟件包和依賴項(xiàng)的管理需要,或根據(jù)源頭構(gòu)建深度學(xué)習(xí)框架的需要。請(qǐng)?jiān)L問 NVIDIA NGC 了解詳情并開始使用。

NVIDIA Volta 和 Turing GPU 上的 Tensor Core 專門為深度學(xué)習(xí)而設(shè)計(jì),能夠顯著提高訓(xùn)練和推理性能。了解有關(guān)獲取參考實(shí)現(xiàn)的更多內(nèi)容。

NVIDIA 深度學(xué)習(xí)培訓(xùn)中心 (DLI) 能夠?yàn)殚_發(fā)者、數(shù)據(jù)科學(xué)家和研究人員提供有關(guān) AI 和加速計(jì)算的實(shí)戰(zhàn)培訓(xùn)。

原文標(biāo)題:NVIDIA 大講堂 “520” 特別篇 | 什么是情感分析?(互動(dòng)有獎(jiǎng))

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4818

    瀏覽量

    102644
  • 情感分析
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    5231
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    588

    瀏覽量

    13466

原文標(biāo)題:NVIDIA 大講堂 “520” 特別篇 | 什么是情感分析?(互動(dòng)有獎(jiǎng))

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    圖像識(shí)別技術(shù)包括自然語言處理

    計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行處理、分析和理解,從而實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景、行為等信息的識(shí)別和理解。圖像識(shí)別技術(shù)包括圖像預(yù)處理、特征提取、分類器設(shè)計(jì)、模型訓(xùn)練等多個(gè)環(huán)節(jié)。 1.2 自然語言
    的頭像 發(fā)表于 07-16 10:54 ?513次閱讀

    自然語言處理前饋網(wǎng)絡(luò)綜述

    自然語言處理(NLP)前饋網(wǎng)絡(luò)是人工智能和語言學(xué)領(lǐng)域的一個(gè)重要交叉學(xué)科,旨在通過計(jì)算機(jī)模型理解和處理人類語言。前饋神經(jīng)網(wǎng)絡(luò)(Feedforw
    的頭像 發(fā)表于 07-12 10:10 ?230次閱讀

    Transformer架構(gòu)在自然語言處理中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領(lǐng)域取得了顯著的進(jìn)步。其中,Transformer架構(gòu)的提出,為NLP領(lǐng)域帶來了革命性的變革。本文將深入探討Transformer架構(gòu)的核心思想、組成部分以及在自然語言
    的頭像 發(fā)表于 07-09 11:42 ?612次閱讀

    nlp自然語言處理基本概念及關(guān)鍵技術(shù)

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語言。NLP技術(shù)在機(jī)器翻譯、情感
    的頭像 發(fā)表于 07-09 10:32 ?371次閱讀

    nlp自然語言處理的主要任務(wù)及技術(shù)方法

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能和語言學(xué)領(lǐng)域的一個(gè)分支,它研究如何讓計(jì)算機(jī)能夠理解、生成和處理人類
    的頭像 發(fā)表于 07-09 10:26 ?606次閱讀

    自然語言處理技術(shù)有哪些

    ,以下是一些主要的自然語言處理技術(shù): 詞法分析(Lexical Analysis):詞法分析自然語言
    的頭像 發(fā)表于 07-03 14:30 ?780次閱讀

    自然語言處理模式的優(yōu)點(diǎn)

    得到了廣泛的應(yīng)用,如搜索引擎、語音助手、機(jī)器翻譯、情感分析等。 1. 提高信息獲取效率 自然語言處理技術(shù)能夠快速地從大量文本數(shù)據(jù)中提取關(guān)鍵信息,幫助用戶節(jié)省查找和篩選信息的時(shí)間。例如,
    的頭像 發(fā)表于 07-03 14:24 ?546次閱讀

    自然語言處理技術(shù)的核心是什么

    ,廣泛應(yīng)用于機(jī)器翻譯、情感分析、語音識(shí)別、智能問答、文本摘要等眾多領(lǐng)域。 自然語言處理技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代。1950年,圖靈提出了著名的圖靈測(cè)試,標(biāo)志著
    的頭像 發(fā)表于 07-03 14:20 ?416次閱讀

    自然語言處理是什么技術(shù)的一種應(yīng)用

    廣泛,包括機(jī)器翻譯、語音識(shí)別、情感分析、信息檢索、問答系統(tǒng)、文本摘要、聊天機(jī)器人等。 一、自然語言處理的基本概念 自然語言
    的頭像 發(fā)表于 07-03 14:18 ?462次閱讀

    自然語言處理包括哪些內(nèi)容

    ,從而實(shí)現(xiàn)人機(jī)之間的自然交流。本文將詳細(xì)介紹NLP的主要內(nèi)容,包括基本概念、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域等。 一、自然語言處理的基本概念 自然語言自然語言
    的頭像 發(fā)表于 07-03 14:15 ?610次閱讀

    自然語言列舉法描述法各自的特點(diǎn)

    自然語言文本。在自然語言處理中,列舉法和描述法是兩種常見的方法。 列舉法 列舉法是一種基于規(guī)則的方法,它通過列舉所有可能的情況來解決問題。在自然語言
    的頭像 發(fā)表于 07-03 14:13 ?845次閱讀

    自然語言處理屬于人工智能的哪個(gè)領(lǐng)域

    自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能(Artificial Intelligence,簡(jiǎn)稱AI)領(lǐng)域的一個(gè)重要分支。它涉及到計(jì)算機(jī)與人類語言
    的頭像 發(fā)表于 07-03 14:09 ?913次閱讀

    什么是自然語言處理 (NLP)

    自然語言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它專注于構(gòu)建能夠理解和生成人類語言的計(jì)算機(jī)系統(tǒng)。NLP的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣
    的頭像 發(fā)表于 07-02 18:16 ?708次閱讀

    自然語言處理技術(shù)的原理的應(yīng)用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠理解和處理人類自然語言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)
    的頭像 發(fā)表于 07-02 12:50 ?332次閱讀

    神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用

    自然語言處理(NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它研究的是如何使計(jì)算機(jī)能夠理解和生成人類自然語言。隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在自然語言
    的頭像 發(fā)表于 07-01 14:09 ?362次閱讀