0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GDPR與機(jī)器學(xué)習(xí)之間三個最常見的問題

Dbwd_Imgtec ? 來源:未知 ? 作者:胡薇 ? 2018-07-09 10:32 ? 次閱讀

一般數(shù)據(jù)保護(hù)條例(GDPR)對數(shù)據(jù)科學(xué)產(chǎn)生了很大的影響?,F(xiàn)在GDPR有99條正文條款和173篇聲明(Recital),長而復(fù)雜,但是隨著時間的推移以及條款的執(zhí)行,它可能會變得更加復(fù)雜。同時,由于GDPR的存在,律師和隱私工程師將成為未來大型數(shù)據(jù)科學(xué)項(xiàng)目的核心組成部分。

1.GDPR是否禁止機(jī)器學(xué)習(xí)?

總的來說,在GDPR生效后,ML不會在歐盟被禁止。

但是,從技術(shù)的角度來看,這個問題的答案是肯定的。GDPR作為法律條文,確實(shí)做出了對使用自動化決策的全面禁止的規(guī)定。當(dāng)GDPR使用“自動化決策”這個術(shù)語時,該法規(guī)指的是任何模型都可以在沒有人直接參與決策的情況下做出決定。這可能包括數(shù)據(jù)主體的自動“概要分析”,例如將其分類為“潛在客戶”或“40-50歲男性”等特定組,以確定貸款申請人是否有資格獲得貸款。

因此,GDPR對ML模型的產(chǎn)生的影響是在沒有人直接參與決策制定的情況下,它們是否可以自動部署。如果可以自動部署,那么在大量的ML模型中這種自動部署的設(shè)置將會被默認(rèn)禁止。盡管有許多律師或數(shù)據(jù)科學(xué)家確實(shí)反對過,但參與起草和解釋GDPR的歐盟官方工作組還是堅(jiān)持該項(xiàng)規(guī)定。

當(dāng)然,GDPR禁止ML也有例外情況。簡單來說,該法規(guī)確定了使用自主決策合法的三個領(lǐng)域:合同處理的必要性,其他法律另行授權(quán)的情況,或數(shù)據(jù)主體明確同意的情況。

但是,讓用戶同意并不容易,用戶可以同意許多不同類型的數(shù)據(jù)處理,并且他們也可以在任何時候撤銷同意,這意味著用戶同意需要細(xì)化和進(jìn)一步的規(guī)范。

那么,GDPR是否真的禁止使用ML模型?當(dāng)然不是,但在許多應(yīng)用ML的例子中,它使得這些模型及其輸入數(shù)據(jù)的部署和管理變得越來越困難。

2. ML有沒有“解釋權(quán)”

作者去年寫了一篇專門討論這個問題的文章。潛在的解釋能力的存在可能會對數(shù)據(jù)科學(xué)產(chǎn)生巨大的影響,因?yàn)镸L模型的預(yù)測能力很大程度上很難解釋,即使有可能,也很難解釋。

在GDPR的第13-15條中反復(fù)聲明,數(shù)據(jù)主體有權(quán)獲得“有關(guān)所涉邏輯的有意義的信息”以及自動決策的“重要性和設(shè)想的后果”。然后,在GDPR的第22條中規(guī)定,數(shù)據(jù)主體有權(quán)利不受上述影響類型的影響。最后,作為該條例中包含的一項(xiàng)非約束性評論的一部分,第71條聲明(Recital)表示,數(shù)據(jù)主體除了能夠?qū)@些決定提出質(zhì)疑之外,還有權(quán)對自動決策做出解釋。綜上所述,這三項(xiàng)規(guī)定在數(shù)據(jù)主體和處理數(shù)據(jù)的模型之間創(chuàng)建了許多新的復(fù)雜的義務(wù),這表明了一種相當(dāng)強(qiáng)大的可解釋性權(quán)利。

雖然理論上,歐盟監(jiān)管機(jī)構(gòu)可以以最嚴(yán)格的方式解釋這些條款,但是現(xiàn)實(shí)中要想實(shí)現(xiàn)充分合理解釋似乎是不可能的。歐盟監(jiān)管機(jī)構(gòu)甚至可以將這些條款解讀為,當(dāng)ML被用于在沒有人為干預(yù)的情況下做出決定時,以及當(dāng)這些決定對數(shù)據(jù)主體產(chǎn)生重大影響時,這些人有權(quán)獲得關(guān)于正在發(fā)生的事情的一些基本形式的信息。在GDPR中被稱為“有意義的信息”和“設(shè)想的后果”可能會在此背景下被讀出。歐盟監(jiān)管機(jī)構(gòu)可能會將注意力集中在一個數(shù)據(jù)主體上,該數(shù)據(jù)主體基于有關(guān)模型的信息和其部署的上下文的相關(guān)信息,對數(shù)據(jù)的使用做出明智的決定。

3. 數(shù)據(jù)主體是否有能力要求模型在沒有數(shù)據(jù)的情況下進(jìn)行訓(xùn)練?

作者認(rèn)為在實(shí)踐中答案是否定的。在GDPR下,所有數(shù)據(jù)的使用都需要有法律依據(jù),《條例》第6條規(guī)定了六個相應(yīng)的依據(jù)。最重要的兩個是“合法利益”的基礎(chǔ),以及用戶明確同意使用該數(shù)據(jù)的地方。當(dāng)處理的法律基礎(chǔ)是后者時,數(shù)據(jù)主體將會保留對這些數(shù)據(jù)的極大控制權(quán),也就是說,他們可以在任何時候撤銷,而處理這些數(shù)據(jù)的法律依據(jù)將不再存在。

因此,如果一個組織從一個數(shù)據(jù)主體收集數(shù)據(jù),用戶同意將他們的數(shù)據(jù)用于訓(xùn)練一個特定模型,然后數(shù)據(jù)主體隨后撤回該同意,那么用戶何時可以強(qiáng)制模型重新訓(xùn)練新數(shù)據(jù)呢?

只有當(dāng)該模型繼續(xù)使用該用戶的數(shù)據(jù)時,答案才會出現(xiàn)。正如GDPR的29條規(guī)定的那樣,即使撤銷同意后,撤回之前所發(fā)生的所有處理仍然合法。因此,如果這些數(shù)據(jù)被合法的用于創(chuàng)建模型或預(yù)測,那么這些數(shù)據(jù)所產(chǎn)生的任何東西都可能被保留下來。在實(shí)踐中,一旦用一組訓(xùn)練數(shù)據(jù)創(chuàng)建了一個模型,訓(xùn)練數(shù)據(jù)就可以在不影響模型的情況下被刪除或修改。

然而,從技術(shù)上講,一些研究表明,模型可能會保留關(guān)于訓(xùn)練數(shù)據(jù)的信息,即使在訓(xùn)練數(shù)據(jù)被刪除之后,這些信息仍然可能被發(fā)現(xiàn),正如研究人員Nicolas Papernot等人所寫的那樣。這意味著,在某些情況下,在不重新訓(xùn)練模型的情況下刪除數(shù)據(jù)不能保證訓(xùn)練數(shù)據(jù)不會被重新發(fā)現(xiàn),或者不能保證原始數(shù)據(jù)不會被繼續(xù)使用。

但是訓(xùn)練數(shù)據(jù)通過模型被重新發(fā)現(xiàn)幾乎是不可能的。作者認(rèn)為,這種重新發(fā)現(xiàn)只是在學(xué)術(shù)環(huán)境中進(jìn)行的,與企業(yè)數(shù)據(jù)科學(xué)家的日常相差甚遠(yuǎn)。盡管這在理論上是有可能的,但這似乎是一個邊緣案例,監(jiān)管者和數(shù)據(jù)科學(xué)家只有在這種特定類型的實(shí)例變得更加現(xiàn)實(shí)的情況下才能解決這個問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:GDPR到底是如何影響機(jī)器學(xué)習(xí)的?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    最常見的7805集成穩(wěn)壓電路,2特殊的用法

    7805是串聯(lián)式端穩(wěn)壓器,三個端口分別是電壓輸入端(IN),地線(GND),穩(wěn)壓輸出(OUT)。當(dāng)IN-GND之間的電壓超過 7V 以上,輸出端與 GND 之間的電壓就會穩(wěn)定在 5V
    發(fā)表于 11-23 09:28 ?3699次閱讀
    <b class='flag-5'>最常見</b>的7805集成穩(wěn)壓電路,2<b class='flag-5'>個</b>特殊的用法

    分享一些最常見最實(shí)用的機(jī)器學(xué)習(xí)算法

    在這篇文章中,分享一些最常用的機(jī)器學(xué)習(xí)算法。
    的頭像 發(fā)表于 10-14 14:24 ?9057次閱讀
    分享一些<b class='flag-5'>最常見</b>最實(shí)用的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>算法

    機(jī)器學(xué)習(xí)最常見錯誤解決方案

    近日,軟件架構(gòu)師、數(shù)據(jù)科學(xué)家、Kaggle 大師 Agnis Liukis 撰寫了一篇文章,他在文中談了談在機(jī)器學(xué)習(xí)最常見的一些初學(xué)者錯誤的解決方案,以確保初學(xué)者了解并避免它們。
    的頭像 發(fā)表于 08-08 16:56 ?2421次閱讀

    三個方面解析電磁兼容的常見問題

    面對電磁兼容的問題,我們已經(jīng)不是一次提到過了,這個話題是老問題新角度的觀念。對于電磁兼容的問題一直是電子工程師們所關(guān)注的。我們今天主要從電磁兼容的騷擾源,敏感源,耦合路徑方面進(jìn)行闡述!找到這三個
    發(fā)表于 10-21 10:33

    變頻電源最常見的故障問題有哪些

    大家總結(jié)下變頻電源最常見的故障問題有哪些:1、安裝環(huán)境的問題2、外部的電磁感應(yīng)干擾3、冷卻系統(tǒng)問題 4、主回路故障問題以上就是變頻電源最常見的四大問題,如果你在變頻電源出現(xiàn)問題之后,只要不是人為造...
    發(fā)表于 12-30 08:11

    如何避免三個常見機(jī)器學(xué)習(xí)錯誤?

    基于云的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)一再被誤用。這多半都可以輕松解決,當(dāng)然,基于云的機(jī)器學(xué)已得到了廣泛的使用。但你要用得巧妙,用得恰當(dāng)。
    的頭像 發(fā)表于 07-11 10:46 ?2478次閱讀

    labview有哪些常見問題?labview三個常見問題和解決方法概述

    本文檔的主要內(nèi)容詳細(xì)介紹的是labview有哪些常見問題?labview三個常見問題和解決方法概述三個常見問題是:1.labview在運(yùn)行后
    發(fā)表于 09-18 18:53 ?0次下載

    深度學(xué)習(xí)最常見的10方法盤點(diǎn)

    在過去十年中,人們對機(jī)器學(xué)習(xí)的興趣激增。幾乎每天,我們都可以在各種各樣的計(jì)算機(jī)科學(xué)課程、行業(yè)會議、華爾街日報(bào)等等看到有關(guān)機(jī)器學(xué)習(xí)的討論。在所有關(guān)于機(jī)
    的頭像 發(fā)表于 10-05 08:40 ?4449次閱讀

    對象存儲適合AI和機(jī)器學(xué)習(xí)工作負(fù)載的三個原因

    各種各樣的企業(yè)在加快AI和機(jī)器學(xué)習(xí)項(xiàng)目,但要真正發(fā)揮潛力,需要克服重大的技術(shù)障礙。雖然計(jì)算基礎(chǔ)架構(gòu)常常是關(guān)注的重點(diǎn),但存儲同樣重要。這三個主要的原因表明了為什么對象存儲(而不是文件存儲或塊存儲)特別適合AI和
    的頭像 發(fā)表于 07-06 09:27 ?2738次閱讀

    微軟推出了三個新的學(xué)習(xí)模塊

    第二模塊的功能是在流星雨中清理以空間為主題的數(shù)據(jù)集后,構(gòu)建機(jī)器學(xué)習(xí)預(yù)測模型的方法。第三個模塊的功能是將相機(jī)重新放置在月球車上,并搜索月球表面。
    的頭像 發(fā)表于 11-15 10:11 ?1615次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的關(guān)鍵區(qū)別

    “人工智能”、“機(jī)器學(xué)習(xí)”和“深度學(xué)習(xí)”這三個詞經(jīng)常交替出現(xiàn),但如果你正在考慮從事人工智能的職業(yè),了解它們之間的區(qū)別是很重要的。
    發(fā)表于 03-02 16:57 ?1696次閱讀

    使用霍爾效應(yīng)傳感器進(jìn)行設(shè)計(jì)的三個常見設(shè)計(jì)缺陷以及解決方案

    使用霍爾效應(yīng)傳感器進(jìn)行設(shè)計(jì)的三個常見設(shè)計(jì)缺陷以及解決方案
    發(fā)表于 10-28 12:00 ?1次下載
    使用霍爾效應(yīng)傳感器進(jìn)行設(shè)計(jì)的<b class='flag-5'>三個</b><b class='flag-5'>常見</b>設(shè)計(jì)缺陷以及解決方案

    Qt中的三個exec之間有什么聯(lián)系

    在Qt中,常見三個exec,第一是QApplication::exec(),第二是QEventLoop::exec,第三個是QThre
    的頭像 發(fā)表于 03-06 09:44 ?2236次閱讀

    機(jī)器視覺照明的三個核心

    正確的照明設(shè)計(jì)對于確保機(jī)器視覺項(xiàng)目的成功至關(guān)重要。這句話它看起來非常的常規(guī)和陳詞濫調(diào);但是忽視這一點(diǎn)是機(jī)器視覺項(xiàng)目失敗的最常見原因之一。
    的頭像 發(fā)表于 04-23 10:50 ?521次閱讀
    <b class='flag-5'>機(jī)器</b>視覺照明的<b class='flag-5'>三個</b>核心

    21最常見晶振應(yīng)用疑難問題及解答

    21最常見晶振應(yīng)用疑難問題及解答
    的頭像 發(fā)表于 06-10 16:56 ?1450次閱讀