0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)的護城河,湖泊和海洋,去中心化數(shù)據(jù)交換可以有哪些幫助?

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 10:48 ? 次閱讀

只有少數(shù)幾家公司能夠獲得大數(shù)據(jù)、人工智能機器學習的能力,可以將其轉(zhuǎn)化為產(chǎn)品。這造成了數(shù)據(jù)擁有者和數(shù)據(jù)貧乏者之間不平等的鴻溝,以及大數(shù)據(jù)行業(yè)的寡頭壟斷。打破寡頭壟斷的最佳方式就是“用開放數(shù)據(jù)的海洋淹沒數(shù)據(jù)豎井”。

數(shù)據(jù)是現(xiàn)代商業(yè)的燃料,每個公司都需要很多數(shù)據(jù),但很少有人能負擔得起。

只有少數(shù)幾家公司能夠獲得大數(shù)據(jù)、人工智能和機器學習的能力,可以將其轉(zhuǎn)化為產(chǎn)品。這造成了數(shù)據(jù)擁有者和數(shù)據(jù)貧乏者之間不平等的鴻溝,以及大數(shù)據(jù)行業(yè)的寡頭壟斷(包括被稱為FANG的Facebook、Amazon、Netflix和Google)。扎克伯格、蓋茨、貝索斯等人已經(jīng)成為數(shù)據(jù)大亨,無異于石油大亨洛克菲勒。

兩個數(shù)據(jù)大亨的故事

雖然AI是貪婪的數(shù)據(jù)消費者,是依賴于大量的數(shù)據(jù)發(fā)展起來的,但大多數(shù)公司要么擁有大量潛在的數(shù)據(jù)卻沒有能使用這些數(shù)據(jù)的AI,要么有AI算法卻沒有足夠的數(shù)據(jù)。

這是為什么呢?主要是因為尋找擁有AI知識的人才的競爭十分激烈,成本也很昂貴,更別說AI專家。大型科技公司正以高昂的初始工資從大學直接招聘AI畢業(yè)生。成本有多高呢?舉個例子,前谷歌自動駕駛部門工程師Anthony Levandowski在離開谷歌的前一年,拿到了1.2億美元的工資和獎金。

另一方面,很多擁有AI知識的畢業(yè)生正在創(chuàng)辦自己的科技公司,但卻無法獲得開發(fā)產(chǎn)品所需的大量數(shù)據(jù)。

FANG公司已經(jīng)成為數(shù)據(jù)的OPEC(石油輸出國組織)了嗎?

在互聯(lián)網(wǎng)時代的初期,webgraph(一種網(wǎng)頁相互連接的圖)是開放的,拉里·佩奇和謝爾蓋·布林得以學習和創(chuàng)新,創(chuàng)建了谷歌公司。但從那時起,webgraph的重要性就逐漸減弱,取而代之的是社交圖(social graph)。

從60年代開始,social graph曾是一個人具有的人際網(wǎng)絡和人際關系的網(wǎng)絡效應的寫照。

然而,F(xiàn)acebook擁有超過20億用戶,它重新定義了 social graph,成為了最具包容性的一個 social graph,并創(chuàng)建了一個指數(shù)級的將個人以及他們的朋友與企業(yè)、服務、社交活動、喜惡等等聯(lián)系在一起的網(wǎng)絡。而在數(shù)據(jù)經(jīng)濟中,這是企業(yè)所追求的。

盡管仍然很重要,但webgraph的主要價值來源是計算網(wǎng)站的PageRank;擁有用戶在線偏好和傾向的詳細數(shù)據(jù)就是數(shù)字廣告商的圣杯。

Facebook的social graph可以說已經(jīng)成為網(wǎng)絡上最賺錢的生態(tài)系統(tǒng),并且與其他數(shù)據(jù)寡頭(谷歌、亞馬遜、Netflix、微軟)一樣,它具有數(shù)據(jù)網(wǎng)絡效應,這種效應發(fā)生在機器學習驅(qū)動的產(chǎn)品隨著用戶數(shù)據(jù)的增加而變得更智能時。這就在商業(yè)環(huán)境,尤其是數(shù)字廣告領域創(chuàng)造出一個贏家,使得其他人越來越難以參與競爭。

2015年,Google和Facebook在全球數(shù)字廣告支出中的比例達到40%。2016年第三季度,Google和Facebook占了美國數(shù)字廣告收入增長的99%——這是有史以來的最高的比例。2017年,它們占了美國數(shù)字廣告支出總額的63%以上。雖然Amazon和Snapchat的進入使得它們的增長速度放慢,但要打破這種數(shù)字雙寡頭壟斷局面將是非常困難的。

石油輸出國組織(OPEC)是一個由14個石油生產(chǎn)國組成的政府間組織,它們占全球石油產(chǎn)量的44%,占全球探明室友儲量的73%。這使得OPEC能對全球原油價格產(chǎn)生重要影響。

雖然沒有證據(jù)表明數(shù)據(jù)寡頭之間存在這種“卡特爾主義”,但Facebook和Google兩家公司占有如此大的市場份額和無限量的數(shù)據(jù)供應,它們將如何影響全球數(shù)字廣告的價格呢?

數(shù)據(jù)的護城河,湖泊和海洋

“護城河”(moat)是從巴菲特的投資理論中借用的一個術語,描述了公司周圍的經(jīng)濟防御層——無論是知識產(chǎn)權(quán)(IP),品牌還是員工——護城河讓公司能在同行業(yè)中優(yōu)于競爭對手?!皵?shù)據(jù)護城河”(data moats)已成為互相競爭的科技公司之間保護知識產(chǎn)權(quán)的一種形式。

數(shù)據(jù)湖泊(Data lakes)是組織內(nèi)部所有部門輸入的原始數(shù)據(jù)池。這與組織內(nèi)部門間相隔離的數(shù)據(jù)是不同的,這些數(shù)據(jù)不會跨部門共享。因此,一個組織可能擁有大量有關個人客戶的數(shù)據(jù)(他們的社交習慣、購買習慣、溝通習慣等),但這些數(shù)據(jù)是分散的,難以編制成完整的個人檔案。

數(shù)據(jù)湖泊以本地格式保存大量的原始數(shù)據(jù)。與將數(shù)據(jù)存儲在文件或文件夾中的分層數(shù)據(jù)庫不同,數(shù)據(jù)湖使用平面架構(gòu)來存儲數(shù)據(jù)。因此,它在很大程度上是非結(jié)構(gòu)化的,是非關系型的(NoSQL)數(shù)據(jù),直到出現(xiàn)一個特定的問題需要使用數(shù)據(jù)查詢,才將其細化為相關的模式。

數(shù)據(jù)是一門大生意;大數(shù)據(jù)更是一筆巨大的業(yè)務。但是一個行星大小的數(shù)據(jù)庫怎么樣?對于廣告商和AI開發(fā)人員來說,這會成為圣杯嗎?

邁向數(shù)據(jù)海洋

海洋協(xié)議(Ocean Protocol)是一個去中心化的全球數(shù)據(jù)交換協(xié)議,旨在讓企業(yè)和個人可以通過本地海洋令牌購買和銷售數(shù)據(jù),其目的是解鎖大數(shù)據(jù),并向更多人開放AI開發(fā)。該項目背后的理念是,對集中式數(shù)據(jù)庫缺乏信任會阻止競爭者之間共享數(shù)據(jù)。

Ocean Protocol由BigchainDB的聯(lián)合創(chuàng)始人Trent McConaghy創(chuàng)立,Ocean是區(qū)塊鏈項目生態(tài)系統(tǒng)的一部分(見下圖),旨在將數(shù)據(jù)、計算能力和存儲去中心化和民主化,以縮小大型科技企業(yè)之間的差距。

在2016年,世界上已經(jīng)產(chǎn)生16ZB(16zettabytes或16,000,000,000,000,000,000,000字節(jié))的數(shù)據(jù),但實際上被分析的數(shù)據(jù)只有1%,而在這1%的數(shù)據(jù)中,只有少數(shù)公司有辦法優(yōu)化數(shù)據(jù)。

這些項目的最終目標之一是讓人們重新控制和掌握數(shù)據(jù),而不是試圖讓數(shù)據(jù)大亨放棄數(shù)據(jù)。

民主化未來的數(shù)據(jù)經(jīng)濟

去中心化數(shù)據(jù)交換可以有哪些幫助?

醫(yī)療保健是可獲取外部數(shù)據(jù)的一個領域,并且將產(chǎn)生深遠的影響。例如,如果在大型數(shù)據(jù)集上進行測試,醫(yī)療藥物試驗對特定人群或性別的效力的偏差可能遠遠低于單一醫(yī)院或?qū)嶒炇宜塬@得的結(jié)果。

一項利用AI來獲得結(jié)論或為某種疾病研發(fā)有效產(chǎn)品的醫(yī)療項目需要1萬名患者的數(shù)據(jù),才能獲得較低的錯誤率,這對于單一醫(yī)院來說幾乎是不可能的。去中心化的數(shù)據(jù)市場的作用就在這里。

在測試任何軟件或算法時,保持低錯誤率是一個目標,而最簡單和最便宜的方法并不是要改進或編寫更復雜的算法,而是要在舊算法上運行大量數(shù)據(jù),或者如Trent McConaghy所描述的那樣:“ 用CSV文件替換Phds——這在2000年代使得錯誤率大大減少,有更多AI得以部署。“

自動駕駛汽車是另一個出錯率必須接近0的領域,因為我們要有足夠的信任才能把生命真正地交給計算機。據(jù)估計,需要5000億到1萬億英里的行駛距離,才能使AI模型足夠精確,能夠用于自動駕駛汽車的生產(chǎn)部署。

另外,Avdex是一種去中心化的航空數(shù)據(jù)交換。

“像Google和Facebook這樣的公司意識到,如果它們將這些數(shù)據(jù)存儲起來,就會產(chǎn)生數(shù)據(jù)網(wǎng)絡效應,”McConaghy說。 “它們有更多的數(shù)據(jù),這意味著更好的模型,這意味著更高的點擊率,帶來更多的錢。它們自稱AI公司,但其實是數(shù)據(jù)公司——是數(shù)據(jù)豎井。一旦擁有了數(shù)據(jù)豎井,企業(yè)就可以將用戶從他們自己的數(shù)據(jù)中分離出來,從而將他們從數(shù)字生活中隔離開來。AI催生了這些數(shù)據(jù)豎井?!?/p>

今天,在互聯(lián)網(wǎng)時代,大型科技公司的權(quán)力集中度無人能及;相比之下,微軟在90年代憑借IE瀏覽器達到統(tǒng)治地位而引發(fā)的反壟斷擔憂就相形見絀了。

雖然我們并不處于洛克菲勒的壟斷時代,但數(shù)據(jù)市場的集中度介于洛克菲勒壟斷和OPEC模式之間。 正如McConaghy所說,打破寡頭壟斷的最佳方式就是“用開放數(shù)據(jù)的海洋淹沒數(shù)據(jù)豎井”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1789

    文章

    46392

    瀏覽量

    236581
  • 機器學習
    +關注

    關注

    66

    文章

    8325

    瀏覽量

    132194
  • 大數(shù)據(jù)

    關注

    64

    文章

    8838

    瀏覽量

    137141

原文標題:谷歌、Facebook已成數(shù)據(jù)寡頭,去中心化數(shù)據(jù)交換打破壟斷

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    企業(yè)數(shù)據(jù)交換平臺的設計與實現(xiàn)

    ,需要對多個不同體系架構(gòu)的系統(tǒng)開放接口。隨著信息系統(tǒng)的不斷增多,系統(tǒng)之間的耦合交互方式使得系統(tǒng)的穩(wěn)定性,可維護性都受到了前所未有的挑戰(zhàn)。本文以移動行業(yè)的信息系統(tǒng)建設為背景,介紹了建設企業(yè)數(shù)據(jù)交換平臺
    發(fā)表于 04-24 09:21

    如何實現(xiàn)labview跟電腦的數(shù)據(jù)交換

    如何實現(xiàn)labview跟電腦的數(shù)據(jù)交換,不用硬件
    發(fā)表于 11-18 13:35

    PCB設計和制造數(shù)據(jù)交換技術及標準

    設備經(jīng)歷巨大變革的同時,專家稱,在PCB 產(chǎn)品數(shù)據(jù)交換領域的進展已滯后了20 多年,數(shù)據(jù)交換欠缺標準間接導致了設計/ 制造的成本上升?! 「淖働CB
    發(fā)表于 11-22 15:57

    設備與IoT中心之間進行數(shù)據(jù)交換的功能

    本次示例程序?qū)⒄故驹O備與IoT中心之間進行數(shù)據(jù)交換的功能。
    發(fā)表于 03-30 07:35

    SPI的數(shù)據(jù)交換過程是怎樣的

    串行設備接口通信:SPI的數(shù)據(jù)交換過程
    發(fā)表于 02-17 07:36

    web頁面與C代碼的數(shù)據(jù)交換方法是什么

    什么情況可以保證網(wǎng)頁內(nèi)容不被改變呢?web頁面與C代碼的數(shù)據(jù)交換方法是什么?
    發(fā)表于 02-22 08:04

    策略驅(qū)動的數(shù)據(jù)交換模型

    針對數(shù)據(jù)交換應用存在數(shù)據(jù)交換來源多樣、交換需求多變的特點,結(jié)合策略獨立于實現(xiàn)等特點,提出將策略應用到數(shù)據(jù)交換領域的觀點,解決現(xiàn)有數(shù)據(jù)交換系統(tǒng)
    發(fā)表于 04-13 08:53 ?5次下載

    基于FPGA的多通道串行數(shù)據(jù)交換中心的設計

    針對靶場光電測量設備子系統(tǒng)互聯(lián)比較復雜、容易產(chǎn)生時序沖突的缺點,設計了基于FPGA的數(shù)據(jù)交換中心。實踐表明,該系統(tǒng)工作穩(wěn)定、可靠,解決了多系統(tǒng)之間通信的時序沖突問題
    發(fā)表于 07-06 15:35 ?11次下載

    什么是空間數(shù)據(jù)交換中心

    什么是空間數(shù)據(jù)交換中心 空間數(shù)據(jù)交換中心是指對不同范圍、領域的空間信息及其元數(shù)據(jù)進行有效管理、給信息需求 者提供空間
    發(fā)表于 06-17 07:40 ?970次閱讀

    什么是數(shù)據(jù)交換技術

    什么是數(shù)據(jù)交換技術 數(shù)據(jù)交換技術主要是電路交換、分組交換和 ATM (異步傳送)。電路交換是通過交換
    發(fā)表于 06-17 08:11 ?4758次閱讀

    PCB制造數(shù)據(jù)交換技術及標準

    PCB制造數(shù)據(jù)交換技術及標準   摘 要:為了彌補傳統(tǒng)印刷電路板數(shù)據(jù)標準Gerber 不能進行雙向數(shù)據(jù)交換的缺陷,介紹了新PCB 數(shù)據(jù)
    發(fā)表于 11-18 09:02 ?830次閱讀

    動態(tài)數(shù)據(jù)交換(DDE),動態(tài)數(shù)據(jù)交換(DDE)原理是什么?

    動態(tài)數(shù)據(jù)交換(DDE),動態(tài)數(shù)據(jù)交換(DDE)原理是什么? 動態(tài)數(shù)據(jù)交換(DDE)是建立在Windows內(nèi)部消息系統(tǒng)、全局原子和共項全局內(nèi)存基礎上的一種協(xié)議,可
    發(fā)表于 03-18 15:23 ?1w次閱讀

    電子數(shù)據(jù)交換(EDI)是什么意思

    電子數(shù)據(jù)交換(EDI)是什么意思 EDI的基本概念 電子數(shù)據(jù)交換系統(tǒng)(EDI)是指將企業(yè)間交易往來的資料由從前的文書、傳票等
    發(fā)表于 04-03 15:13 ?5233次閱讀

    組態(tài)王與VB數(shù)據(jù)交換方法

      針對目前組態(tài)王與智能儀表通信時存在的問題,基于VB和動態(tài)數(shù)據(jù)交換技術DDE,研究了組態(tài)王與VB數(shù)據(jù)交換的方法,并采用VB可視的編程方法,編寫了上位機與智能
    發(fā)表于 09-25 17:52 ?16次下載
    組態(tài)王與VB<b class='flag-5'>數(shù)據(jù)交換</b>方法

    Profinet直接數(shù)據(jù)交換功能概述

    從固件版本 V2.8 開始,S7-1500 CPU 支持與其它 S7-1500 CPU 進行直接數(shù)據(jù)交換。在直接數(shù)據(jù)交換的情況下,S7-1500 CPU 將 I/O 區(qū)域中的循環(huán)用戶數(shù)據(jù)提供給一個或
    的頭像 發(fā)表于 12-20 09:49 ?2040次閱讀