0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI越來越推廣普及,我們需注意機器模型中不斷涌現(xiàn)的人類偏見

如意 ? 來源:360機房 ? 作者:Harris ? 2020-09-24 14:35 ? 次閱讀

隨著人工智能在企業(yè)和社會的應用變得越來越普遍,企業(yè)需要注意機器模型中不斷涌現(xiàn)的人類偏見。企業(yè)可以利用人類的智慧來獲取訓練算法所需的各種數(shù)據(jù)和輸入。

有一些方法可以避免數(shù)據(jù)集中的偏差。

在訓練人工智能(AI)算法時,取決于數(shù)據(jù)的輸入。在業(yè)務環(huán)境中尤其如此,在這種情況下,人工智能的目的可能是與客戶互動,管理自動化系統(tǒng)或模仿人工決策。成果與目標相符至關重要。但是,至關重要的是,企業(yè)必須能夠解決任何可能歪曲人工智能對指令或請求的響應方式的偏見。

任何新產(chǎn)品的設計和開發(fā)階段都是至關重要的,因為它使企業(yè)可以運行測試、識別并消除任何缺陷。如果由于某種原因而忽略了設計缺陷或產(chǎn)品出現(xiàn)故障,則可以快速解決??梢哉倩赜泄收系脑O備,同時可以發(fā)布更新和補丁來修復任何軟件問題。對于典型的軟件版本而言,這一切都很好,但是處理人工智能算法并不是那么簡單。

人工智能算法是高度復雜的系統(tǒng),旨在基于機器學習(ML)執(zhí)行非常具體的任務。試圖消除人工智能投入運行后所產(chǎn)生的任何數(shù)量的偏差可能既昂貴又費時;對于“學習”的技術而言,這也違反直覺。在設計和開發(fā)階段采用適當?shù)牧鞒虂?a target="_blank">檢測并消除偏差會更加有效。

偏見對企業(yè)不利

人工智能的基本目的和功能被引入其基礎算法中。如果人工智能要發(fā)展出固有的偏差,它將對算法產(chǎn)生不利影響。這可能會嚴重影響人工智能預期提供的精度和效率,從而限制人工智能滿足其商業(yè)需求的能力,所有這些都對業(yè)務不利。

盡管有開發(fā)人員的最佳意圖,偏見總能找到一種滲透人工智能算法的方法。與任何學習過程一樣,學生也會受到其老師的影響。認可機構的教育范圍取決于其課程設置。毫不奇怪,課程越多樣化,學生越開明。同樣,更大、更多樣化的數(shù)據(jù)集有助于產(chǎn)生更精確、更高效的人工智能算法,從而能夠做出更明智的決策。

培訓數(shù)據(jù)和測試結果

每個成功的人工智能算法都建立在訓練數(shù)據(jù)的基礎上。但是,采購滿足業(yè)務要求的數(shù)據(jù)可能會給物流和間接費用帶來巨大挑戰(zhàn),尤其是如果這些要求包括滿足大眾市場的需求時。

內部開發(fā)人員團隊,軟件工程師和質量保證專家通常來自相同的年齡范圍,性別和背景。偏差經(jīng)常發(fā)生在數(shù)據(jù)收集和數(shù)據(jù)標記過程中。因此,在構建人工智能算法時,最好不要依賴某一個人或一個小組來提供將用于訓練算法的數(shù)據(jù)。為了正確地訓練算法,需要不同類型的數(shù)據(jù)和輸入。

使用為人工智能算法提供與最終服務的客戶更接近的人員和體驗的暴露能力的模型,將會更有效率。企業(yè)可以使用這一模型來訓練他們的算法,以響應現(xiàn)實情況,檢測出偏差發(fā)生的地方并減少其潛在影響。

社區(qū)構建的算法

培訓數(shù)據(jù)的成功獲取和實施取決于數(shù)據(jù)本身的數(shù)量、質量和多樣性。企業(yè)獲取和處理此數(shù)據(jù)的唯一方法是利用多樣化的參與者。企業(yè)需要能夠從向其提供特定人口統(tǒng)計信息的社區(qū)中進行選擇,包括性別、種族、母語、位置、技能、地理位置以及其他適用的過濾條件。

實際上,開發(fā)有效的算法需要大量數(shù)據(jù)。大多數(shù)企業(yè)沒有能力大規(guī)模地獲取數(shù)據(jù)。他們需要專用資源的支持才能交付新的軟件和服務。最近的一個培訓用于媒體和廣播服務的智能語音助手的項目需要超過10萬種不同的語音。這些話語最終由972個人提供,這些人被遠程組裝以訓練算法。令人難以置信的壯舉是,盡管可以在實驗室中對語音進行某種程度的模擬,但人工智能仍然需要暴露于各種真實的聲音和口音中。

言語訓練只是教學大綱的一方面。眾包解決方案還可以幫助企業(yè)訓練人工智能算法以讀取手寫文檔。最近的另一個項目需要數(shù)千個手寫樣本。數(shù)量再次成為關鍵因素,因為該算法需要盡可能廣泛的唯一樣本。遠程聚集了1,000多名參與者,以提供手寫文檔并滿足對各種內容的需求。

公正的結果

刪除可能會降低人工智能最終結果準確性的意外偏差很重要。它將永遠不會是完美的,但是人工智能會不斷學習,并且最好的機器模型是基于大量多樣數(shù)據(jù)集的模型。最好的策略是從提供數(shù)量、質量和多樣性的池中獲取培訓數(shù)據(jù)。如果訓練數(shù)據(jù)沒有多樣性,該算法將無法識別廣泛的可能性,從而使該算法無效。遠程社區(qū)使企業(yè)可以訪問此數(shù)據(jù),并補充內部開發(fā)和測試功能。眾包測試可用于訓練人工智能算法以研究和識別語音、文本、圖像和生物識別,從而為企業(yè)提供強大的輸出,可滿足不同客戶群的需求。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    29418

    瀏覽量

    267714
  • 模型
    +關注

    關注

    1

    文章

    3067

    瀏覽量

    48580
  • 機器學習
    +關注

    關注

    66

    文章

    8324

    瀏覽量

    132194
收藏 人收藏

    評論

    相關推薦

    AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究的核心技術,包括機器學習、深度學習、神經(jīng)網(wǎng)絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)
    發(fā)表于 10-14 09:16

    AI普及給嵌入式設計人員帶來新挑戰(zhàn)

    。 ? 從監(jiān)控和訪問控制到智能工廠和預測性維護,基于機器學習(ML)模型構建的人工智能(AI)在工業(yè)物聯(lián)網(wǎng)邊緣處理應用已變得無處不在。隨著
    發(fā)表于 08-22 14:20 ?601次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>普及</b>給嵌入式設計人員帶來新挑戰(zhàn)

    我們的城市為什么越來越熱?

    全球氣候在變暖,我們焚燒石油,煤炭等化石燃料,產(chǎn)生了大量二氧化碳等溫室氣體,導致全球氣候變暖,尤其大陸氣溫升高,城市變得越來越熱。圖:上海前灘的夜晚,被太陽曬熱的建筑熱島效應夏天天太熱,在陽光
    的頭像 發(fā)表于 08-03 08:14 ?435次閱讀
    <b class='flag-5'>我們</b>的城市為什么<b class='flag-5'>越來越</b>熱?

    Al大模型機器

    和迭代來不斷改進自身性能。它們可以從用戶交互中學習并根據(jù)反饋進行調整,以提高對話質量和準確性??啥ㄖ菩耘c整合性: AI模型機器人可以根據(jù)特定需求進行定制和整合,以滿足不同場景和應用的
    發(fā)表于 07-05 08:52

    【大語言模型:原理與工程實踐】核心技術綜述

    應用,需要考慮到性能、可擴展性和安全性等因素。 大語言模型正在快速發(fā)展,新技術不斷涌現(xiàn)。未來的研究可能集中在提高模型效率、理解和可解釋性以及確保
    發(fā)表于 05-05 10:56

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    ,生成能力則使其能生成新的、連貫的文本,而涌現(xiàn)性則讓模型能生成未曾出現(xiàn)但邏輯上合理的內容。從早期的統(tǒng)計模型到如今的大語言模型AI領域
    發(fā)表于 05-04 23:55

    基于百度AI模型生態(tài)支持,極汽車機器人迎來一次全新進化

    基于百度AI模型生態(tài)支持,極汽車機器人又迎來了一次全新進化。3月25日,極越在北京舉辦AI DAY 2024。
    的頭像 發(fā)表于 03-28 09:52 ?599次閱讀
    基于百度<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>生態(tài)支持,極<b class='flag-5'>越</b>汽車<b class='flag-5'>機器</b>人迎來一次全新進化

    AMR智能倉儲機器人為什么會越來越受歡迎?

    AMR智能倉儲機器人之所以越來越受歡迎,主要是因為它們具有以下幾個優(yōu)勢: 1.提高工作效率: AMR智能倉儲機器人可以在倉庫環(huán)境自主導航和執(zhí)行任務,無需人工干預。它們可以快速而準確地
    的頭像 發(fā)表于 03-25 16:56 ?453次閱讀

    嵌入式會越來越卷嗎?

    嵌入式會越來越卷嗎? 當談及嵌入式系統(tǒng)時,我們探究的不僅是一種科技,更是一個日益多元與普及的趨勢。嵌入式系統(tǒng),作為一種融入更大系統(tǒng)的計算機硬件和軟件,旨在執(zhí)行特定功能或任務。但這個看
    發(fā)表于 03-18 16:41

    我們該如何應對SOC中越來越龐大和復雜的SDC約束?

    SOC設計變得越來越復雜,成本越來越高,設計和驗證也越來越困難。
    的頭像 發(fā)表于 03-13 14:52 ?1005次閱讀
    <b class='flag-5'>我們</b>該如何應對SOC中<b class='flag-5'>越來越</b>龐大和復雜的SDC約束?

    工業(yè)機器人應用AI邊緣控制器:技術創(chuàng)新與效率提升的雙重驅動

    工業(yè)機器人應用AI邊緣控制器:技術創(chuàng)新與效率提升的雙重驅動 隨著科技的不斷進步,AI邊緣控制器在工業(yè)
    的頭像 發(fā)表于 03-08 10:45 ?628次閱讀

    IC datasheet為什么越來越薄了?

    剛畢業(yè)的時候IC spec動則三四百頁甚至一千頁,這種設置和使用方法很詳盡,但是這幾年IC datasheet為什么越來越薄了,還分成了IC功能介紹、code設置、工廠量產(chǎn)等等規(guī)格書,很多東西都藏著掖著,想了解個IC什么東西都要發(fā)郵件給供應商,大家有知道這事為什么的嗎?
    發(fā)表于 03-06 13:55

    微軟:打造負責任的人工智能 確保技術創(chuàng)新造福全人類

    在全球各界為OpenAI Sora展現(xiàn)出的非凡創(chuàng)造力嘆為觀止的同時,越來越的人也不禁開始思考,隨著五花八門的AIGC內容加速涌現(xiàn),我們該如何保證A
    的頭像 發(fā)表于 03-01 15:18 ?937次閱讀
    微軟:打造負責任<b class='flag-5'>的人</b>工智能 確保技術創(chuàng)新造福全<b class='flag-5'>人類</b>

    機器換人”的趨勢日益明顯 利好政策不斷涌現(xiàn)

    %。 就我國今年的市場表現(xiàn)來看,盡管年初出現(xiàn)了“開局不利”、“增長乏力”的局面,但目前已經(jīng)呈現(xiàn)“逐步回暖、提速發(fā)展”的態(tài)勢。商產(chǎn)業(yè)研究院預測,2023年我國工業(yè)機器人市場規(guī)模有望達到99億美元。 中國人口紅利不斷減小的同時,制
    的頭像 發(fā)表于 12-13 10:19 ?262次閱讀

    FPGA和CPU、GPU有什么區(qū)別?為什么越來越重要?

    CPU 算力逐漸達到瓶頸,越來越無法滿足神經(jīng)網(wǎng)絡指數(shù)級增長的算力需求。在數(shù)據(jù)中心這一人類算力需求最高的設施,算力發(fā)展的方向愈發(fā)轉向專用性,以尋求更高的性能、更低的能耗和成本。我們
    發(fā)表于 11-09 14:09