2023年3月17日,OpenAI官網(wǎng)發(fā)布了最新的研究論文《大語言模型對勞動力市場影響潛力的早期研究》,其研究顯示,持有學士、碩士和專業(yè)學位的人比沒有正式教育證書的人更容易受到GPT的影響。元戰(zhàn)略觀察員對本篇文章核心內(nèi)容進行了編譯,將GPT類大模型對勞動力市場以及不同職業(yè)和行業(yè)產(chǎn)生的深刻的潛在影響呈現(xiàn)給讀者。
摘要:本文研究了大語言模型(LLM),例如生成預訓練轉(zhuǎn)換器(GPT),對美國勞動力市場的潛在影響。研究人員采用了一種創(chuàng)新性評級方法,用來評估GPT模型在不同行業(yè)工作任務中的匹配度。研究發(fā)現(xiàn),約80%的美國勞動力可能會因為GPT的應用而受到影響,而約19%的工作崗位中至少一半的工作任務可能會受到影響。
研究方法與數(shù)據(jù)
1按職業(yè)劃分的活動和任務數(shù)據(jù)
研究人員使用美國勞工部的O*NET 27.2數(shù)據(jù)庫,其中包含了1016個職業(yè)的信息,包括各自的詳細工作活動(Detailed Work Activities, DWAs)。同時,本文制定了共19265項任務用于評估GPT-4對工作的輔助效果,這些任務大多數(shù)與DWAs相關。
表1 計算機工程師/設計師、緊急救護、賭場服務、電商、幼兒園教師、小學教師等職業(yè)的工作活動內(nèi)容和任務描述
我們使用的兩個數(shù)據(jù)集包括:
?19,265個任務,每個任務具有一個“任務描述”和相應的職業(yè),大多數(shù)任務與一個或多個DWA相關聯(lián);
?2,087個DWA,大多數(shù)DWA與一個或多個任務相關聯(lián),任務可能與一個或多個DWA相關聯(lián),盡管有些任務缺乏相關的DWA。
2工資、就業(yè)和人口統(tǒng)計數(shù)據(jù)
本文使用美國勞工統(tǒng)計局(Bureau of Labor Statistics, BLS)提供的2020-2021年職業(yè)就業(yè)系列數(shù)據(jù),包括職業(yè)名稱、每個職業(yè)的就業(yè)人數(shù)及工資、2031年這些職業(yè)的前景預測、職業(yè)準入的教育水平以及獲得職業(yè)能力所需的在職培訓情況等信息。BLS數(shù)據(jù)庫可以與O*NET數(shù)據(jù)庫相關聯(lián),通過當前人口調(diào)查(Current Population Survey, CPS),將O*NET中的任務和工作活動數(shù)據(jù)集與BLS勞動力人口統(tǒng)計數(shù)據(jù)進行對應,截取相關數(shù)據(jù)。
3GPT對完成任務的有用程度(暴露度)
研究采用暴露度(Exposure)作為GPT對工作任務影響的評估標準。本次研究將暴露度定義為一個衡量標準:是否能夠通過利用GPT將完成特定工作任務的時間減少至少50%。具體而言,本文主要采用了三種評估標準:
1.無暴露度(E0):應用模型不能減少50%的任務耗時,或者降低了任務的完成質(zhì)量。
2.直接暴露度(E1):在保障任務質(zhì)量的前提下,完成任務耗時減少50%。
3.LLM+暴露度(E2):雖然無法直接節(jié)省50%的任務耗時,但在LLM的基礎上開發(fā)其他額外功能以節(jié)省50%以上的耗時。
值得注意的是,本文所采用的暴露度評估標準旨在評估GPT對于特定任務的輔助效果,而非評估其完全替代人類完成任務的能力。
評估方法
研究人員使用了兩種評估方法來評估GPT系統(tǒng)的整體暴露度,分別為人工評分和GPT-4評分。
表2 GPT-4評分和人工評分的一致性以及皮爾遜相關分數(shù)的比較。一致性得分是通過觀察兩組分數(shù)的一致程度來確定的
通過這種分析方法,我們可以更好地了解GPT對不同職業(yè)的潛在影響。通過將各種任務和職業(yè)與GPT的暴露程度聯(lián)系起來,能夠預測哪些工作可能受到更大的影響。這有助于政策制定者和利益相關者了解GPT對勞動力市場的潛在影響,從而制定相應的政策和措施。
研究結(jié)果
1數(shù)據(jù)匯總
表3 人類和GPT-4暴露數(shù)據(jù)的匯總統(tǒng)計
匯總統(tǒng)計數(shù)據(jù)如表3所示。人類和GPT-4評分都表明,平均職業(yè)水平的α(即E1)值在0.14和0.15之間,這表明對于普通職業(yè)來說,大約15%的任務會對GPT直接暴露(即耗時縮短一半以上)。這個數(shù)字對于β(即E1+0.5*E2)增加到超過30%,對于ζ(即E1+E2)超過50%。巧合的是,人類和GPT-4評分均將整個數(shù)據(jù)集中14%-15%的任務評為直接暴露。根據(jù)β值,80%的員工至少有一項任務暴露于GPT,而19%的員工有一半以上的任務被記錄為暴露于GPT。
2工資與就業(yè)
表4 左邊顯示為受影響職業(yè)的百分比,右邊顯示為受影響工人的百分比
上圖展示了整個經(jīng)濟體相對于GPT的暴露強度,左圖顯示受影響職業(yè)的百分比,右圖顯示受影響人數(shù)的百分比。暴露強度的分布在職業(yè)和個人之間是相似的,這表明某職業(yè)的從業(yè)人數(shù)與職業(yè)相對于GPT的暴露度沒有很高的相關性,它可能與為特定領域開發(fā)GPT驅(qū)動軟件的投資密切相關。
3技能重要性
為探究職業(yè)技能的重要性和暴露度的關系,本文使用了O*NET數(shù)據(jù)集提供的基本技能,并對每個職業(yè)的技能重要性進行量化,對暴露度進行了回歸分析,以探究技能重要性與暴露程度之間的關聯(lián)。
研究結(jié)果表明,科學和批判性思維技能的重要性與暴露度呈現(xiàn)出強烈的負相關性,這意味著需要這些技能的職業(yè)不太可能受到當前GPT的影響。相反,編程和寫作技能與暴露呈現(xiàn)出強烈的正相關關系,這意味著涉及這些技能的職業(yè)更容易受到當前GPT的影響。
4研究方法
本研究還將職業(yè)準入門檻作為標準來觀察不同工作類型的暴露差異,通過研究“準入所需的典型教育”和“達到職業(yè)能力要求所需的在職培訓”兩個因素,揭示GPT對勞動力具有潛在影響的趨勢。
上表結(jié)果表明,持有學士、碩士和專業(yè)學位的人比沒有正式教育證書的人更容易接觸到GPT,部分完成大學課程但沒有學位的人也具有高水平的GPT暴露度。
研究結(jié)果顯示:
1.持有學士、碩士和專業(yè)學位的人比沒有正式教育證書的人更容易受到GPT的影響,部分完成大學課程但沒有學位的人也具有高水平的GPT暴露度。
2.暴露最少的工作需要最長時間的培訓,起薪水平也不高。相反,不需要在職培訓或僅需要實習的工作有更高的收入,但更容易受到GPT的影響。
5暴露度最高的職業(yè)
在人工評估下,暴露度最高的十大行業(yè)領域分別為:證券、大宗商品合同及其他金融投資服務、保險公司、數(shù)據(jù)加工托管及相關服務、其他信息服務、出版業(yè)(除了互聯(lián)網(wǎng))、借貸信用中介、出租非金融無形資產(chǎn)(版權(quán)作品除外)、基金、信托及其他金融工具、央行及貨幣當局、電子批發(fā)市場及中介機構(gòu)。
在GPT-4評估下,暴露度最高的十大行業(yè)分別為:數(shù)據(jù)處理托管及相關服務、其他信息服務、出版業(yè)(互聯(lián)網(wǎng)除外)、保險公司、借貸信用中介、證券、大宗商品合約及其他金融投資服務、科學及技術(shù)專業(yè)服務、非金融無形資產(chǎn)出租(版權(quán)作品除外)、廣播電視(互聯(lián)網(wǎng)除外),央行及貨幣當局。
結(jié) 論
研究發(fā)現(xiàn),對于LLM,大多數(shù)職業(yè)都有一定程度的暴露度,薪資較高的職業(yè)通常有更多高暴露度的任務。分析表明,根據(jù)當前LLM的技術(shù)水平,約19%的工作崗位至少有50%的任務暴露于GPT。
研究結(jié)果顯示,LLM(如GPT)的廣泛應用對美國經(jīng)濟發(fā)展和勞動力市場產(chǎn)生了重要影響。雖然LLM技術(shù)對于提高人類勞動效率和能力的作用是顯而易見的,但是社會、經(jīng)濟、監(jiān)管和其他因素將綜合影響實際的勞動生產(chǎn)結(jié)果。隨著技術(shù)能力的不斷發(fā)展,LLM對經(jīng)濟的影響力可能會持續(xù)提高,政策制定者需要關注它們可能帶來的倫理和安全風險,并采取措施來減輕其可能帶來的負面影響。
審核編輯 :李倩
-
轉(zhuǎn)換器
+關注
關注
27文章
8578瀏覽量
146562 -
語言模型
+關注
關注
0文章
491瀏覽量
10229 -
GPT
+關注
關注
0文章
348瀏覽量
15248
原文標題:OpenAI發(fā)布!大語言模型對勞動力市場的影響
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論