阿里巴巴近日再爆大事件,阿里巴巴ai模型在閱讀理解領(lǐng)域頂級賽事SQuAD破世界紀(jì)錄引起大家的高度關(guān)注,跟隨小編一起來了解一下是什么情況,看看阿里巴巴人工智能的未來發(fā)展趨勢以及全球人工智能的未來發(fā)展趨勢是什么。
阿里巴巴ai模型破世界紀(jì)錄
日前,由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解領(lǐng)域頂級賽事SQuAD刷新排名,阿里巴巴憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,并且超越了人類82.304的成績。
SQuAD負(fù)責(zé)人Pranav Rajpurkar表示,第一個模型(阿里巴巴iDST團(tuán)隊(duì)提交的SLQA +)在精準(zhǔn)度匹配上超越人類表現(xiàn),下一個挑戰(zhàn):模糊匹配,人類仍然領(lǐng)先2.5分。
據(jù)了解,SQuAD比賽構(gòu)建了一個大規(guī)模的機(jī)器閱讀理解數(shù)據(jù)集(包含10萬個問題),文章來源于500多篇維基百科文章,旨在通過這套試題梳理出線索,看機(jī)器學(xué)習(xí)模型是否能夠在經(jīng)過大量信息處理后給出問題的確切答案。
阿里巴巴研究院自然語言處理首席科學(xué)家司羅在一份公告中說,對于像“天為什么會下雨”這樣的客觀問題,機(jī)器給出的答案準(zhǔn)確率會很高。公告稱,其中的技術(shù)可以逐步應(yīng)用于諸如客服、博物館指南、在線解答患者醫(yī)療問題等廣泛的實(shí)際應(yīng)用領(lǐng)域,從而以一種前所未有的方式減少人力投入的需求。
此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。
據(jù)了解,這項(xiàng)技術(shù)已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如,每年雙11都會有大量的顧客對活動規(guī)則進(jìn)行咨詢。阿里小蜜團(tuán)隊(duì)通過使用司羅團(tuán)隊(duì)的技術(shù),讓機(jī)器直接對規(guī)則進(jìn)行閱讀,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。
再比如,顧客還會針對單個商品詢問大量的基礎(chǔ)問題,而這些問題其實(shí)在商品詳情頁都是有答案的?,F(xiàn)在通過機(jī)器閱讀理解技術(shù),能夠讓機(jī)器對詳情頁中的商品描述文本進(jìn)行更為智能地閱讀和回答,降低服務(wù)成本的同時提高購買轉(zhuǎn)化率。
據(jù)小編了解,由司羅領(lǐng)導(dǎo)的自然語言處理團(tuán)隊(duì)支撐了阿里巴巴整個生態(tài)的技術(shù)需求。由他們研發(fā)的AliNLP自然語言技術(shù)平臺每日調(diào)用1200億+次,Alitranx翻譯系統(tǒng)提供20個語種在線服務(wù)日調(diào)用量超過7億+次。此前曾在2016年ACM CIKM個性化電商搜索、2017年IJCNLP中文語法檢測CGED評測、2017年年美國標(biāo)準(zhǔn)計量局TAC評比英文實(shí)體分類等大賽中取得全球第一的成績。
阿里巴巴的人工智能未來發(fā)展解析
阿里在人工智能的布局主要有兩個方向:一是在電商和商家融合,二是給廠商技術(shù)支持。
阿里巴巴人工智能實(shí)驗(yàn)室于2017年7月5日亮相,主要研究消費(fèi)級 AI產(chǎn)品。第一款產(chǎn)品就是最近大家熟悉的智能語音終端設(shè)備“天貓精靈 X1”。
iDST(數(shù)據(jù)科學(xué)與技術(shù)研究院)被稱為是阿里巴巴最神秘的研究機(jī)構(gòu),分布在杭州、北京、西雅圖、硅谷等地,是阿里巴巴負(fù)責(zé)人工智能技術(shù)研發(fā)的核心團(tuán)隊(duì)、阿里巴巴NASA計劃的人工智能大腦。
小編了解到,阿里除了人工智能實(shí)驗(yàn)室、數(shù)據(jù)科學(xué)與技術(shù)研究院iDST,還擁有阿里研究院、VR實(shí)驗(yàn)室,螞蟻金服也具備自己的人工智能團(tuán)隊(duì)。此外,2017年3月阿里宣布推出“NASA”計劃,面向機(jī)器學(xué)習(xí)、芯片、IoT作系統(tǒng)、生物識別這些核心技術(shù)組建新團(tuán)隊(duì),建立新的機(jī)制和方法。
延伸閱讀:人工智能的發(fā)展趨勢
趨勢一:大公司都將從人工智能獲利
亞馬遜、谷歌、Facebook和IBM,它們將在人工智能領(lǐng)域引領(lǐng)潮流。作為大公司,他們有合適的資源來收集數(shù)據(jù),因此有更多的數(shù)據(jù)可以使用,且看這些巨頭是如何布局的。
亞馬遜:投資人工智能20年以上,抓取了5B以上的網(wǎng)頁數(shù)據(jù),超過50萬張JPEG圖像和相應(yīng)的JSON元數(shù)據(jù),用以供給亞馬遜運(yùn)營中心的產(chǎn)品。每天抓取世界廣播、雜志和網(wǎng)絡(luò)新聞的數(shù)據(jù)已超過2.5億,每天抓取近100M圖像和視頻具有音頻和視覺功能并帶有注釋。亞馬遜Echo系列音箱已經(jīng)占領(lǐng)了超過70%的語音助手市場。
Google:具有全世界最大的數(shù)據(jù)庫,專注于應(yīng)用和產(chǎn)品開發(fā),而不是長期的AI研究。GoogleBrain擁有超過1300名研究人員的團(tuán)隊(duì),在語音助理市場占有23.8%的用戶份額。使用TensorFlow開源平臺進(jìn)行機(jī)器學(xué)習(xí),允許任何人訪問機(jī)器學(xué)習(xí)平臺。Google地球數(shù)據(jù)庫的大小估計為3017TB或大約3PB,GoogleStreetView有大約20PB的街景照片。
谷歌很可能在應(yīng)用程序和產(chǎn)品開發(fā)及服務(wù)的部署方面都處于最前沿,它不僅是第一家開始研究人工智能的公司,而且擁有7萬名員工。此外,谷歌擁有一個深度學(xué)習(xí)人工智能研究項(xiàng)目GoogleBrain,它擁有一個團(tuán)隊(duì),有自己的研究議程,研究領(lǐng)域涵蓋了機(jī)器學(xué)習(xí)、自然語言理解、機(jī)器學(xué)習(xí)算法和技術(shù),以及機(jī)器人。
Facebook:每日處理2.5B的內(nèi)容和500多TB的數(shù)據(jù),F(xiàn)acebookArticialIntelligenceResearchers(FAIR)有大約80位研究人員和工程師,每天產(chǎn)生20億“贊”和3000萬照片,每30分鐘掃描大約105TB的數(shù)據(jù)建有一個62000平方英尺的數(shù)據(jù)中心,可容納500個機(jī)架。每天翻譯超過40種語言的20億用戶帖子,每天有8000萬用戶使用這些翻譯。
IBM:計劃進(jìn)行為期10年、價值2.4億美元的投資來創(chuàng)建MIT-IBM沃森人工智能實(shí)驗(yàn)室。在全球擁有2000多名AI員工,在IBM總部擁有超過600名AI員工,沃森用戶跨越六大洲和超過25個國家,IBM向沃森項(xiàng)目投資10億美元,其中包括1億美元的風(fēng)險投資。通過沃森生態(tài)系統(tǒng)建立了7000多個應(yīng)用。
趨勢二:算法與技術(shù)的整合
所有在人工智能領(lǐng)域投資的二級資本公司,比如英特爾、Salesforce和Twitter,都將追隨擁有這些數(shù)據(jù)的大公司,并使用他們的數(shù)據(jù)算法和人工智能。行業(yè)參與者之間將會發(fā)生數(shù)據(jù)交易,而且很有可能會整合算法和技術(shù)。數(shù)據(jù)的交易以及算法和技術(shù)的整合將使人工智能變得更加重要。
隨著谷歌和Facebook等規(guī)模更大的公司收購小公司,更多的算法將被整合到它們的核心平臺或解決方案中??偛课挥谟鴤惗氐娜斯ぶ悄芄綝eepMind,構(gòu)建了通用學(xué)習(xí)算法,被谷歌收購,以獲得相對于其他科技公司的商業(yè)優(yōu)勢。另一方面,F(xiàn)acebook收購Wit.ai來提升自己的語音識別和語音界面。該公司還收購了人工智能創(chuàng)業(yè)公司Ozlo,以完善其M虛擬助理服務(wù)。
趨勢三:數(shù)據(jù)眾包
所有的人工智能公司都追求巨大的數(shù)據(jù)庫,以實(shí)現(xiàn)他們對人工智能的雄心壯志。這些公司將開始通過眾包方式獲取大量數(shù)據(jù)。企業(yè)已經(jīng)找到了一種方法來評估眾包數(shù)據(jù)的質(zhì)量和真實(shí)性,不僅給企業(yè)提供了便利,還能反饋信息給消費(fèi)者。
OpenDataNow.com的創(chuàng)始人兼編輯JoelGurin表示,“我們生活在一個眾包文化的環(huán)境中,越來越多的人愿意和有興趣通過社交媒體分享他們所知道的東西?!?/p>
谷歌通過眾包的方式,獲得了大量的圖片,并構(gòu)建了成像算法。該公司還利用眾包來幫助改善服務(wù),比如翻譯、轉(zhuǎn)錄、手寫識別和地圖應(yīng)用。而亞馬遜還利用眾包的技術(shù)改善了Alexa的1.5萬項(xiàng)現(xiàn)有技能。
趨勢四:更多的并購將發(fā)生
CBInsights的統(tǒng)計數(shù)據(jù)顯示,AI公司的收購競爭已經(jīng)開始。2018年將是我們能看到的最多的公司收購和被收購的一年,因?yàn)檫@些公司必須爭奪知識資本和人才才不會被淘汰。機(jī)器學(xué)習(xí)/人工智能的所有小公司都將被大公司收購。有兩個原因:
AI在沒有數(shù)據(jù)庫的幫助下沒法工作。因?yàn)榇蠊緭碛写罅康臄?shù)據(jù)庫,他們將對那些小公司造成巨大的壓力。沒有數(shù)據(jù)庫的支持,算法將毫無用處。同樣如果沒有算法,數(shù)據(jù)幾乎也毫無用處。數(shù)據(jù)是算法的核心,大量的數(shù)據(jù)是至關(guān)重要的。哥倫比亞大學(xué)創(chuàng)意機(jī)器人實(shí)驗(yàn)室的機(jī)器人工程師和總監(jiān)HodLipson說,“數(shù)據(jù)是燃料,算法是引擎”。
趨勢五:開放民主化的工具將獲得市場份額
大公司將開始開放他們的算法和其他工具,以獲得市場份額。以市場為基礎(chǔ)的數(shù)據(jù)和算法進(jìn)入壁壘將會減少,人工智能的新應(yīng)用將會增加。通過開放平臺和民主化,那些無法使用人工智能工具的小公司將可以獲得大量的數(shù)據(jù)來研究人工智能算法。
正如谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(SundarPichai)在談到民主化的人工智能時所說的那樣,“我們所能做的最激動人心的事情之一就是讓機(jī)器學(xué)習(xí)和人工智能變得不再那么神秘。讓所有人都能接觸到這一點(diǎn)很重要。”此外,frameworks、SDKsandAPIs將成為所有主要廠商對消費(fèi)者開放使用的標(biāo)準(zhǔn)。所有的公司都將采用SaaS&PaaS商業(yè)模式。
趨勢六:人機(jī)交互將得到改善
Siri和Alexa大概是目前最受歡迎的人機(jī)交互工具,與之類似的更多基于機(jī)器人的解決方案將是人工智能公司進(jìn)入這個行業(yè)的門檻。例如,雖然機(jī)器已經(jīng)被編程用于語音分析和面部識別,但機(jī)器還得做到根據(jù)你的聲音來識別你的情緒,也就是進(jìn)行情緒分析。
制造自動化和非消費(fèi)者焦點(diǎn)解決方案將是第一個要改進(jìn)的解決方案/應(yīng)用程序。制造自動化將主要?dú)w功于人工成本節(jié)約,使用包括自動化、機(jī)器人和先進(jìn)制造技術(shù)。非消費(fèi)者解決方案的改進(jìn),例如在農(nóng)業(yè)和醫(yī)藥領(lǐng)域執(zhí)行任務(wù)的人機(jī)交互,也將在2018年流行起來。
趨勢七:人工智能將漸漸地對所有垂直領(lǐng)域產(chǎn)生影響
制造、客戶服務(wù)、保健、醫(yī)療保健和交通運(yùn)輸?shù)念I(lǐng)域已經(jīng)受到AI的影響,自動駕駛汽車預(yù)計將在2018年上市。明年,會有更多的領(lǐng)域受到人工智能的影響。以下是人工智能對不同行業(yè)影響的例子:
保險——AI將通過自動化改進(jìn)索賠流程。
法律——NLP可以在幾分鐘內(nèi)總結(jié)成千上萬頁的法律文件,從而減少查閱時間和提高效率。
PR&media——AI將幫助快速處理數(shù)據(jù)。
教育——虛擬導(dǎo)師的發(fā)展;人工智能幫助打分?jǐn)?shù);制定適應(yīng)性學(xué)習(xí)計劃,游戲和軟件;以AI為導(dǎo)向的個性化教育計劃將改變學(xué)生和老師的互動。
健康——機(jī)器學(xué)習(xí)可用于創(chuàng)建更復(fù)雜,更準(zhǔn)確的方法來在患者出現(xiàn)癥狀之前預(yù)測疾病
正如工業(yè)革命在100年前幾乎改變了一切一樣,人工智能將在未來幾年改變這個世界。
趨勢八:安全、隱私及倫理道德問題
在人工智能的保護(hù)傘下,諸如機(jī)器學(xué)習(xí)和大數(shù)據(jù)等問題,都很容易觸及到安全及隱私問題。有時基礎(chǔ)設(shè)施扮演著很重要的角色。與隱私問題有關(guān)的安全需求,如將銀行帳戶和健康信息保密,將會對研究的安全性有更大的要求。2018年,有關(guān)安全和隱私的問題將得到解決,這一年,也是人工智能可能出現(xiàn)新的發(fā)展的一年。
人工智能的倫理問題也將成為2018年的主要問題,需要解決的倫理和道德問題包括人工智能對人類有哪些好處和壞處。人們也對機(jī)器人取代人類的可能性感到擔(dān)憂,比如護(hù)士、治療師或警察,另一個需要處理的問題是自主武器。
評論
查看更多