0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

匿名和去識(shí)別化在數(shù)據(jù)隱私保護(hù)方面的重要性

如意 ? 來(lái)源:讀芯術(shù)微信公眾號(hào) ? 作者:讀芯術(shù)微信公眾號(hào) ? 2020-09-16 15:14 ? 次閱讀

匿名化是為了確保數(shù)據(jù)的隱私性,公司用它來(lái)保護(hù)敏感數(shù)據(jù)。這類(lèi)數(shù)據(jù)包括:

私人數(shù)據(jù)

業(yè)務(wù)信息,如財(cái)務(wù)信息或商業(yè)秘密

機(jī)密信息,如軍事機(jī)密或政府信息

匿名化為遵循個(gè)人數(shù)據(jù)相關(guān)隱私條例提供了范例,個(gè)人數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)的重合之處就是客戶(hù)信息所在。但并非所有的業(yè)務(wù)數(shù)據(jù)都受監(jiān)管,本文將重點(diǎn)討論個(gè)人數(shù)據(jù)的保護(hù)。

匿名和去識(shí)別化在數(shù)據(jù)隱私保護(hù)方面的重要性

敏感數(shù)據(jù)類(lèi)型示例

在歐洲,監(jiān)管機(jī)構(gòu)將任何與某人(如你的名字)有關(guān)的信息定義為“個(gè)人數(shù)據(jù)”。不論形式,任何關(guān)聯(lián)到此人的信息都符合上述定義。從上世紀(jì)起,個(gè)人數(shù)據(jù)收集逐漸民主化,數(shù)據(jù)匿名化問(wèn)題開(kāi)始出現(xiàn)。隨著隱私條例在世界各地開(kāi)始生效,這件事尤顯重要。

什么是數(shù)據(jù)匿名化,為何要關(guān)注它?

我們從經(jīng)典定義開(kāi)始。歐盟的《通用數(shù)據(jù)保護(hù)條例》(GDPR)是這樣定義對(duì)匿名信息的:“與識(shí)別或可識(shí)別自然人無(wú)關(guān)的信息,或以數(shù)據(jù)主體不能或不再可識(shí)別的方式匿名提供的個(gè)人信息?!?/p>

其中,“可識(shí)別”和“不再”至關(guān)重要。這不僅意味著你的名字不應(yīng)再出現(xiàn)在數(shù)據(jù)中,也意味著不能從剩余數(shù)據(jù)中發(fā)現(xiàn)你是誰(shuí),這與再認(rèn)同(有時(shí)也叫去匿名化)過(guò)程有關(guān)。

同樣,GDPR(契約中)陳述了一個(gè)重要事實(shí):“……因此,數(shù)據(jù)保護(hù)不應(yīng)適用于匿名信息”。所以,若你設(shè)法匿名數(shù)據(jù),就不再受GDPR數(shù)據(jù)保護(hù)法的約束。

你可以執(zhí)行任何處理操作,如分析或數(shù)據(jù)貨幣化。這帶來(lái)了大量機(jī)會(huì):

出售數(shù)據(jù)顯然是首選用途。在世界各地,隱私保護(hù)法正在限制個(gè)人數(shù)據(jù)交易,而匿名數(shù)據(jù)為公司提供了另一種選擇。

它帶來(lái)了合作機(jī)會(huì)。許多公司為了創(chuàng)新或研究而共享數(shù)據(jù),匿名數(shù)據(jù)有助于降低風(fēng)險(xiǎn)。

它還為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)創(chuàng)造了機(jī)會(huì)。在保持兼容性的同時(shí)運(yùn)行敏感數(shù)據(jù)的操作正變得越來(lái)越復(fù)雜,匿名數(shù)據(jù)為統(tǒng)計(jì)分析和模型訓(xùn)練提供了安全的原材料,前景一片光明。但實(shí)際上真正的匿名數(shù)據(jù)往往并不如愿。

數(shù)據(jù)隱私保護(hù)機(jī)制的范圍

數(shù)據(jù)的隱私保護(hù)有一個(gè)范圍。多年來(lái),專(zhuān)家們研發(fā)了一系列集方法、機(jī)制和工具為一體的技術(shù)。這些技術(shù)生成了具有不同的匿名級(jí)別和不同再識(shí)別風(fēng)險(xiǎn)等級(jí)的數(shù)據(jù)。可以說(shuō),其范圍涵蓋了個(gè)人可識(shí)別數(shù)據(jù)乃至真正的匿名數(shù)據(jù)。

匿名和去識(shí)別化在數(shù)據(jù)隱私保護(hù)方面的重要性

數(shù)據(jù)隱私的范圍

左端,有包含直接個(gè)人識(shí)別碼的數(shù)據(jù)。通過(guò)這些元素,可以識(shí)別你的姓名、地址或電話號(hào)碼。另一端,則是GDPR引用的匿名數(shù)據(jù)。

如你所見(jiàn),這些數(shù)據(jù)有一個(gè)中間范疇。它處于可識(shí)別數(shù)據(jù)和匿名數(shù)據(jù)之間,即假名數(shù)據(jù)和去識(shí)別數(shù)據(jù)。請(qǐng)注意,其界定仍有爭(zhēng)議。有些報(bào)告認(rèn)為假名化是去識(shí)別化的一部分, 而另一些報(bào)告則將其排除在外。

生成這種“中間數(shù)據(jù)”的技術(shù)本身并無(wú)問(wèn)題。它們能有效地將數(shù)據(jù)最小化。根據(jù)用例需求,它們將彼此關(guān)聯(lián),發(fā)揮用處。但切記,它們無(wú)法生成真正的匿名數(shù)據(jù),它們的機(jī)制無(wú)法保證阻止再識(shí)別,所以將其生成的數(shù)據(jù)稱(chēng)為“匿名數(shù)據(jù)”是一種誤導(dǎo)。

匿名和“匿名”

假名化和去識(shí)別化確實(shí)能在某些方面保護(hù)數(shù)據(jù)隱私。但根據(jù)GDPR的定義,它們無(wú)法生成匿名數(shù)據(jù)。

假名化技術(shù)從數(shù)據(jù)中刪除或替換直接個(gè)人標(biāo)識(shí)碼,例如,從數(shù)據(jù)集中刪除所有名稱(chēng)和電子郵件,你無(wú)法直接從假名數(shù)據(jù)中識(shí)別某人,不過(guò)可以間接識(shí)別。實(shí)際上,剩余數(shù)據(jù)通常會(huì)保留間接識(shí)別碼,組合這些信息后,就能創(chuàng)建直接識(shí)別碼,如出生日期,郵編,性別等。

就此而言,假名化在GDPR框架中有一個(gè)單獨(dú)定義:“……以以下方式處理個(gè)人數(shù)據(jù),即在不使用附加信息的情況下,數(shù)據(jù)不再可以歸因于特定數(shù)據(jù)主體”。與匿名數(shù)據(jù)相反,假名數(shù)據(jù)符合GDPR的要求。

去識(shí)別化技術(shù)從數(shù)據(jù)中去除直接和間接的個(gè)人身份識(shí)別碼。理論上,去識(shí)別化數(shù)據(jù)和匿名化數(shù)據(jù)之間的界限很簡(jiǎn)單。最新消息表明:有技術(shù)可保障永遠(yuǎn)無(wú)法再識(shí)別數(shù)據(jù)。這是一種“疑罪從無(wú)”的情況,去識(shí)別化數(shù)據(jù)在未識(shí)別之前是匿名的。每當(dāng)專(zhuān)家設(shè)法重新識(shí)別那些最初未識(shí)別出的數(shù)據(jù)時(shí),他們都進(jìn)一步推動(dòng)了發(fā)展。

數(shù)據(jù)重新識(shí)別不斷重新定義匿名

上述機(jī)制類(lèi)型對(duì)隱私保護(hù)沒(méi)有同等效力,因此如何處理這些數(shù)據(jù)很重要。公司定期發(fā)布或出售他們聲稱(chēng)“匿名”的數(shù)據(jù),但當(dāng)他們使用的方法不能保證“匿名”時(shí),就會(huì)帶來(lái)隱患。

眾多事件表明,假名化數(shù)據(jù)這種隱私保護(hù)機(jī)制仍有缺陷。數(shù)據(jù)中的間接識(shí)別碼會(huì)帶來(lái)巨大的再識(shí)別風(fēng)險(xiǎn)。隨著可用數(shù)據(jù)量的增長(zhǎng),相互參照數(shù)據(jù)集的機(jī)會(huì)也在增加:

1990年,麻省理工學(xué)院的研究生從去識(shí)別化醫(yī)療數(shù)據(jù)中重新確認(rèn)了馬薩諸塞州州長(zhǎng)的身份,她將這些信息與公用人口普查數(shù)據(jù)相互參照來(lái)確定患者身份。

2006年,作為研究計(jì)劃的一部分,美國(guó)在線公司(AOL)共享了去識(shí)別化搜索數(shù)據(jù),研究人員能夠?qū)⑺阉鞑樵?xún)與背后的個(gè)人聯(lián)系起來(lái)。

2009年,作為比賽的一部分,網(wǎng)飛(Netflix)發(fā)布了一個(gè)匿名電影評(píng)級(jí)數(shù)據(jù)集,德克薩斯州的研究人員成功重新識(shí)別了用戶(hù)。

同是2009年,研究人員僅利用公開(kāi)信息就能預(yù)測(cè)出一個(gè)人的社會(huì)保險(xiǎn)號(hào)。

最近研究表明,去識(shí)別化數(shù)據(jù)實(shí)際上可以被重新識(shí)別。比利時(shí)新魯汶大學(xué)和倫敦帝國(guó)理工學(xué)院的研究人員發(fā)現(xiàn):“使用15個(gè)人口統(tǒng)計(jì)屬性,在任何數(shù)據(jù)集中,99.98%的美國(guó)人都能被正確地重新識(shí)別?!?/p>

另一項(xiàng)針對(duì)匿名手機(jī)數(shù)據(jù)的研究表明:“四個(gè)時(shí)空點(diǎn)就足以唯一識(shí)別95%的個(gè)體用戶(hù)”。

技術(shù)日益進(jìn)步,更多的數(shù)據(jù)正在被創(chuàng)建,研究人員正在努力劃定去識(shí)別化數(shù)據(jù)和匿名數(shù)據(jù)之間的界限。2017年,研究人員發(fā)表論文稱(chēng):“網(wǎng)絡(luò)瀏覽歷史只能通過(guò)公開(kāi)數(shù)據(jù)鏈接到社交媒體上的個(gè)人資料?!?/p>

另一個(gè)令人擔(dān)憂的問(wèn)題是個(gè)人資料的泄露,越來(lái)越多的個(gè)人信息遭到泄露。ForgeRock消費(fèi)者身份泄露報(bào)告預(yù)測(cè),2020年的信息泄露數(shù)量將超過(guò)去年,僅美國(guó),2020年第一季度就有超過(guò)16億的客戶(hù)記錄被泄露。

分開(kāi)處理的數(shù)據(jù)集無(wú)法重新識(shí)別,但與泄露數(shù)據(jù)結(jié)合起來(lái),它會(huì)造成更大的威脅。哈佛大學(xué)的學(xué)生能夠利用泄露的數(shù)據(jù)重新識(shí)別去識(shí)別化數(shù)據(jù)。

總之,那些我們所認(rèn)為的“匿名數(shù)據(jù)”往往并不是真正的匿名數(shù)據(jù)。并非所有的數(shù)據(jù)凈化方法都會(huì)生成真正的匿名數(shù)據(jù)。事事都各有優(yōu)點(diǎn),但沒(méi)有一種能提供與匿名同等級(jí)別的隱私。隨著數(shù)據(jù)量的不斷增長(zhǎng),創(chuàng)建真正的匿名數(shù)據(jù)也越來(lái)越難,公司發(fā)布潛在可重新識(shí)別的個(gè)人數(shù)據(jù)的風(fēng)險(xiǎn)也在增加。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6767

    瀏覽量

    88643
  • 匿名
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    6773
  • 隱私保護(hù)
    +關(guān)注

    關(guān)注

    0

    文章

    297

    瀏覽量

    16428
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    變電所繼電保護(hù)的作用與重要性

    。本文將詳細(xì)探討變電所繼電保護(hù)的功能、常見(jiàn)類(lèi)型。 1. 繼電保護(hù)的作用與重要性 迅速隔離故障:在電力系統(tǒng)中,任何形式的故障如不即時(shí)處理都可能導(dǎo)致設(shè)備的損壞及廣泛的供電中斷。繼電保護(hù)裝置
    的頭像 發(fā)表于 10-04 14:24 ?145次閱讀

    康謀分享 | 數(shù)據(jù)隱私匿名:PIPL與GDPR下,如何確保數(shù)據(jù)合規(guī)?(一)

    自動(dòng)駕駛技術(shù)的快速發(fā)展伴隨著數(shù)據(jù)隱私保護(hù)的嚴(yán)峻挑戰(zhàn)。PIPL和GDPR為自動(dòng)駕駛數(shù)據(jù)合規(guī)設(shè)立了高標(biāo)準(zhǔn)。本篇文章將帶大家深入探討PIPL與GDPR的異同點(diǎn),期望能夠幫助車(chē)企更好地理解并應(yīng)
    的頭像 發(fā)表于 09-29 10:28 ?1269次閱讀
    康謀分享 | <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>隱私</b>和<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:PIPL與GDPR下,如何確保<b class='flag-5'>數(shù)據(jù)</b>合規(guī)?(一)

    云加速服務(wù)在數(shù)據(jù)安全方面的潛在風(fēng)險(xiǎn)

    云加速服務(wù)在數(shù)據(jù)安全方面的優(yōu)勢(shì)主要包括: 1、數(shù)據(jù)保護(hù)能力:云服務(wù)提供商采用多種安全措施來(lái)保護(hù)數(shù)據(jù)
    的頭像 發(fā)表于 09-23 11:54 ?177次閱讀

    動(dòng)態(tài)代理IP的匿名和透明度,為主要考慮關(guān)鍵!

    動(dòng)態(tài)代理IP的匿名和透明度是用戶(hù)選擇代理服務(wù)時(shí)需要考慮的關(guān)鍵因素。根據(jù)用戶(hù)的需求和場(chǎng)景,可以選擇不同匿名級(jí)別和透明度的代理服務(wù)來(lái)平衡隱私保護(hù)
    的頭像 發(fā)表于 09-20 07:36 ?185次閱讀
    動(dòng)態(tài)代理IP的<b class='flag-5'>匿名</b><b class='flag-5'>性</b>和透明度,為主要考慮關(guān)鍵!

    工業(yè)智能網(wǎng)關(guān)在數(shù)據(jù)上云方面的作用、優(yōu)勢(shì)以及實(shí)施策略

    的管理效率、安全和智能水平。本文將詳細(xì)探討工業(yè)智能網(wǎng)關(guān)在數(shù)據(jù)上云方面的作用、優(yōu)勢(shì)以及實(shí)施策略。 工業(yè)智能網(wǎng)關(guān)概述 工業(yè)智能網(wǎng)關(guān)是一種用于工業(yè)環(huán)境中的設(shè)備,能夠連接多種網(wǎng)絡(luò)和設(shè)備,實(shí)
    的頭像 發(fā)表于 09-03 13:15 ?175次閱讀

    工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān)在數(shù)據(jù)融合與邊緣智能方面的作用

    在當(dāng)今數(shù)字轉(zhuǎn)型的浪潮中,工業(yè)物聯(lián)網(wǎng)作為推動(dòng)制造業(yè)智能、自動(dòng)的關(guān)鍵力量,正深刻改變著傳統(tǒng)工業(yè)的生產(chǎn)模式與管理方式。而工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān),作為連接物理世界與數(shù)字世界的橋梁,其重要性日益凸
    的頭像 發(fā)表于 08-09 17:44 ?276次閱讀

    平衡創(chuàng)新與倫理:AI時(shí)代的隱私保護(hù)和算法公平

    。為此,開(kāi)發(fā)者應(yīng)采用多元數(shù)據(jù)源,并定期進(jìn)行算法公平的評(píng)估和調(diào)整。在就業(yè)篩選等敏感領(lǐng)域,透明度和公平的結(jié)合尤為重要,這需要確保篩選過(guò)程
    發(fā)表于 07-16 15:07

    藍(lán)牙模塊的安全隱私保護(hù)

    傳輸過(guò)程中的安全性問(wèn)題,分析隱私保護(hù)方面的挑戰(zhàn)和解決方案,并介紹一些提高藍(lán)牙模塊安全隱私保護(hù)
    的頭像 發(fā)表于 06-14 16:06 ?430次閱讀

    IoT網(wǎng)關(guān)在工業(yè)應(yīng)用中的重要性及應(yīng)用

    。IoT網(wǎng)關(guān)的核心功能在于其數(shù)據(jù)匯集、協(xié)議轉(zhuǎn)換、遠(yuǎn)程管理、安全防護(hù)等方面,是物聯(lián)網(wǎng)設(shè)備與云端服務(wù)平臺(tái)之間溝通的橋梁。 ? 二、IoT網(wǎng)關(guān)在工業(yè)應(yīng)用中的重要性 在工業(yè)領(lǐng)域,IoT網(wǎng)關(guān)的應(yīng)用日益廣泛,其
    的頭像 發(fā)表于 06-12 16:17 ?313次閱讀

    求助,ADC接地的重要性

    ADC接地的重要性
    發(fā)表于 06-04 07:56

    論RISC-V的MCU中UART接口的重要性

    RISC-V的MCU(微控制器單元)中UART(通用異步收發(fā)器)接口的重要性主要體現(xiàn)在以下幾個(gè)方面: 廣泛的適用 : UART接口是一種用于連接兩個(gè)計(jì)算機(jī)設(shè)備的接口,允許一個(gè)設(shè)備向另一個(gè)設(shè)備發(fā)送
    發(fā)表于 05-27 15:52

    集成芯片的重要性和必要

    集成芯片在現(xiàn)代科技和工業(yè)中占據(jù)著至關(guān)重要的地位,其重要性和必要主要體現(xiàn)在以下幾個(gè)方面。
    的頭像 發(fā)表于 03-18 15:17 ?883次閱讀

    PLC網(wǎng)關(guān)的重要性

    的關(guān)鍵組件。 一、PLC網(wǎng)關(guān)簡(jiǎn)介 PLC網(wǎng)關(guān)是一種能夠連接PLC設(shè)備和物聯(lián)網(wǎng)系統(tǒng)的硬件設(shè)備。它一方面提供與PLC設(shè)備的通信接口,另一方面具備聯(lián)網(wǎng)功能,能夠?qū)LC設(shè)備的數(shù)據(jù)上傳到物聯(lián)網(wǎng)云平臺(tái),實(shí)現(xiàn)設(shè)備的遠(yuǎn)程監(jiān)控和管理。 二、PL
    的頭像 發(fā)表于 01-30 15:50 ?504次閱讀
    PLC網(wǎng)關(guān)的<b class='flag-5'>重要性</b>

    一眼看懂鴻蒙OS 應(yīng)用隱私保護(hù)

    隨著移動(dòng)終端及其相關(guān)業(yè)務(wù)(如移動(dòng)支付、終端云等)的普及,用戶(hù)隱私保護(hù)重要性愈發(fā)突出。應(yīng)用開(kāi)發(fā)者在產(chǎn)品設(shè)計(jì)階段就需要考慮保護(hù)的用戶(hù)隱私,提高
    的頭像 發(fā)表于 01-26 17:04 ?765次閱讀
    一眼看懂鴻蒙OS 應(yīng)用<b class='flag-5'>隱私</b><b class='flag-5'>保護(hù)</b>

    完整地平面的重要性

    完整地平面的重要性
    的頭像 發(fā)表于 11-28 16:54 ?834次閱讀
    完整地平<b class='flag-5'>面的</b><b class='flag-5'>重要性</b>