0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌搜索算法究竟是怎么工作的?為什么谷歌不做搜索結(jié)果個(gè)性化?

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-04 09:04 ? 次閱讀

谷歌搜索算法究竟是怎么工作的?谷歌如何調(diào)整和改變其搜索算法,依據(jù)的標(biāo)準(zhǔn)和進(jìn)行的測(cè)試是怎樣的?為什么谷歌不做搜索結(jié)果個(gè)性化?本文告訴你全部答案。

自特朗普總統(tǒng)指責(zé)谷歌操縱搜索結(jié)果以來(lái),谷歌一直否認(rèn)其搜索系統(tǒng)存在任何政治偏見(jiàn)。

Google一下,凈說(shuō)我壞話!

盡管谷歌的個(gè)別員工在政治領(lǐng)域傾向于自由派,但沒(méi)有證據(jù)表明搜索引擎的結(jié)果故意偏向任何特定的意識(shí)形態(tài)。

監(jiān)管機(jī)構(gòu)和Yelp等競(jìng)爭(zhēng)對(duì)手批評(píng)谷歌通過(guò)其他網(wǎng)站的信息增強(qiáng)自己的服務(wù),如地圖,職位發(fā)布,商業(yè)評(píng)論和旅游信息等。去年,歐盟對(duì)谷歌的購(gòu)物搜索結(jié)果開(kāi)出了27億美元的反托拉斯罰單,美國(guó)司法部副部長(zhǎng)Jeff Sessions則公開(kāi)調(diào)查包括谷歌在內(nèi)的科技企業(yè)是否正在扼殺競(jìng)爭(zhēng)。

為了揭開(kāi)它如何運(yùn)行其搜索引擎的神秘面紗,谷歌邀請(qǐng)CNBC參加了一個(gè)內(nèi)部會(huì)議,會(huì)上搜索業(yè)務(wù)的主管們討論是否要進(jìn)行一項(xiàng)變動(dòng):在某些搜索結(jié)果旁邊放上圖片。

提議的更改很小,而且非常具體,谷歌的這項(xiàng)更改決定是數(shù)據(jù)驅(qū)動(dòng)的。會(huì)議表明了谷歌是如何實(shí)現(xiàn)搜索產(chǎn)品的巨大復(fù)雜性和漸進(jìn)式簡(jiǎn)潔的統(tǒng)一。

先來(lái)點(diǎn)基本知識(shí):谷歌搜索的工作原理究竟是怎樣的?

人們有時(shí)會(huì)對(duì)Google搜索進(jìn)行擬人化,認(rèn)為搜索引擎“理解”了他們的查詢(xún)請(qǐng)求,比如用戶輸入“電影 排球島”,Google返回了湯姆·漢克斯的電影《荒島求生》的相關(guān)結(jié)果。

但是,搜索引擎其實(shí)并不知道這些詞是什么意思:而只是在搜索那些詞及其同義詞,甚至是常見(jiàn)的拼寫(xiě)錯(cuò)誤出現(xiàn)的頁(yè)面,以及和這些頁(yè)面相關(guān)度最高的頁(yè)面。

谷歌的程序(稱(chēng)為網(wǎng)絡(luò)抓取工具)會(huì)搜索互聯(lián)網(wǎng),從數(shù)千億個(gè)網(wǎng)頁(yè)中收集信息。然后將這些數(shù)據(jù)存儲(chǔ)在一個(gè)巨大的、不斷變化的索引中,記錄信息的新鮮度和頁(yè)面創(chuàng)建位置等信號(hào)。當(dāng)用戶在搜索欄中輸入內(nèi)容時(shí),會(huì)通過(guò)所謂Google搜索“算法”的一系列規(guī)則和流程提供這些信息和信號(hào)。在此過(guò)程中,將用戶的查詢(xún)請(qǐng)求與索引中的信息進(jìn)行比較,并確定出現(xiàn)在搜索結(jié)果頂部的頁(yè)面,這些過(guò)程都在幾分之一秒內(nèi)完成。

20年前,谷歌剛剛成立時(shí),其中一個(gè)搜索排名指標(biāo)是PageRank,以谷歌聯(lián)合創(chuàng)始人拉里·佩奇的名字命名。PageRank根據(jù)有多少用戶鏈接到某頁(yè)面,判斷該頁(yè)面的與搜索內(nèi)容相關(guān)性。也就是說(shuō),如果網(wǎng)上很多人發(fā)現(xiàn)一個(gè)頁(yè)面足夠有用,與其建立了鏈接,這個(gè)頁(yè)面就可能比大家都忽略的頁(yè)面的相關(guān)性更高。今天,PageRank仍然是Google算法尚在使用的排名因素之一。

谷歌故意沒(méi)有透露排名系統(tǒng)的全部指標(biāo),部分原因是它不希望人們利用這些信息來(lái)玩弄搜索系統(tǒng),因?yàn)槌霈F(xiàn)在搜索頁(yè)面頂部可以帶來(lái)大量的流量和經(jīng)濟(jì)利益。

對(duì)這些指標(biāo)保密,也有助于谷歌領(lǐng)先潛在的競(jìng)爭(zhēng)對(duì)手。

如何提升谷歌搜索排名?關(guān)注頁(yè)面的專(zhuān)業(yè)知識(shí)、權(quán)威性和可靠性

當(dāng)谷歌考慮改變搜索的算法時(shí),會(huì)組建一個(gè)團(tuán)隊(duì)對(duì)一小部分真實(shí)用戶進(jìn)行測(cè)試,了解他們的搜索習(xí)慣,也會(huì)與名為“搜索質(zhì)量評(píng)估者”的承包商團(tuán)隊(duì)一起調(diào)查。

Google在全球范圍內(nèi)約有10000名評(píng)估者,雖然他們無(wú)法直接影響搜索結(jié)果,但他們的意見(jiàn)有助于Google的搜索小組評(píng)估是否應(yīng)該實(shí)施調(diào)整。評(píng)估者通常會(huì)同時(shí)查看新舊搜索結(jié)果,并確定哪個(gè)更好。

“更好”并不是一個(gè)純粹主觀的判斷。而是會(huì)由過(guò)去發(fā)布的搜索質(zhì)量評(píng)估指南文檔來(lái)定義,該文檔描述評(píng)估者應(yīng)如何判斷顯示在其結(jié)果中的頁(yè)面的好壞。文檔內(nèi)容特別關(guān)注頁(yè)面的專(zhuān)業(yè)知識(shí)、權(quán)威性和可信賴(lài)性。

“你可以將評(píng)估指南中的內(nèi)容視為我們希望搜索算法的發(fā)展方向?!盙oogle搜索、智能助理和新聞副總裁Ben Gomes表示?!八麄冸m然沒(méi)有告訴你算法如何對(duì)結(jié)果進(jìn)行排名,但從根本上說(shuō)明了算法應(yīng)該做什么。”

改不改,怎么改?一切由數(shù)據(jù)驅(qū)動(dòng)

谷歌在今年7月份對(duì)該指南進(jìn)行了一些重大更改,其中包括要求評(píng)估者考慮頁(yè)面作者的聲譽(yù)。因此,作者不明的頁(yè)面現(xiàn)在可能被評(píng)為低質(zhì)量頁(yè)面。

2017年,谷歌與其評(píng)估者共同進(jìn)行了31584次實(shí)驗(yàn),并推出了2453次搜索規(guī)則更改。雖然這些更改會(huì)對(duì)任何給定網(wǎng)站的排名產(chǎn)生巨大影響,但普通谷歌搜索用戶通常根本不會(huì)注意到這些更改。

在CNBC本次受邀參加的會(huì)議中,測(cè)試團(tuán)隊(duì)測(cè)試了一種新的移動(dòng)搜索格式,在搜索結(jié)果旁邊顯示網(wǎng)頁(yè)上的照片及鏈接。他們假定這樣做可以幫助用戶更好地確定要點(diǎn)擊哪個(gè)鏈接,找到與搜索內(nèi)容最相關(guān)的頁(yè)面。

最終評(píng)估數(shù)據(jù)顯示,91%的情況下,評(píng)估者發(fā)現(xiàn)展示圖像很有用。在實(shí)時(shí)實(shí)驗(yàn)中,真實(shí)用戶也點(diǎn)擊了圖片。在權(quán)衡了增加圖片導(dǎo)致延遲增加與用戶體驗(yàn)的正反饋之后,Gomes和Nayak批準(zhǔn)了這次調(diào)整。

這次調(diào)整并沒(méi)有激烈的辯論或哲學(xué)上的探索,是數(shù)據(jù)推動(dòng)了這一決定。

“對(duì)此我們有嚴(yán)格的測(cè)試過(guò)程,” Gomes說(shuō)?!拔覀兊母膭?dòng)是數(shù)據(jù)指標(biāo)驅(qū)動(dòng)的,這是我們運(yùn)營(yíng)方式的核心?!?/p>

谷歌為什么不做個(gè)性化搜索?

谷歌會(huì)傾聽(tīng)用戶的反饋意見(jiàn),包括一些由于結(jié)果錯(cuò)誤導(dǎo)致的丑聞事件,比如用戶曾發(fā)現(xiàn)谷歌將白人至上主義網(wǎng)站鏈接為“大屠殺是否發(fā)生?”的第一個(gè)搜索結(jié)果。如果出現(xiàn)明顯問(wèn)題,谷歌不僅要去掉糟糕的搜索結(jié)果。更常見(jiàn)的情況是,谷歌要試圖弄清楚如何更改其算法及其評(píng)估指南,以避免類(lèi)似的錯(cuò)誤。

通過(guò)不對(duì)搜索結(jié)果進(jìn)行個(gè)性化,谷歌擺脫了大部分Facebook和Twitter所遭受的批評(píng)——?jiǎng)?chuàng)建“過(guò)濾圈”(filter bubbles),也即用戶只看到他們?cè)揪蛢A向于相信或喜歡的信息。(谷歌的視頻產(chǎn)品YouTube則無(wú)法躲開(kāi)這種批評(píng),尤其是它對(duì)于相關(guān)視頻的推薦算法。這兩種算法是完全獨(dú)立的,不是由同一個(gè)團(tuán)隊(duì)創(chuàng)建或維護(hù)。)

個(gè)性化也可能導(dǎo)致人們對(duì)谷歌失去信任。雖然谷歌沒(méi)有對(duì)其大部分搜索排名進(jìn)行個(gè)性化,但由于其收集的大量數(shù)據(jù)(Google允許用戶關(guān)于其收集的數(shù)據(jù)管理進(jìn)行隱私設(shè)置,但其方法在過(guò)去一直存在誤導(dǎo)性),其廣告非常個(gè)性化。

對(duì)于所有用戶測(cè)試,谷歌知道錯(cuò)誤不可避免,有時(shí)是因?yàn)橛腥斯室馄茐?,有時(shí)是則是因?yàn)樗惴ù嬖趩?wèn)題,還有的時(shí)候是因?yàn)榻Y(jié)果反映了社會(huì)偏見(jiàn)。

“我們并不認(rèn)為搜索是完美的,”Nayak說(shuō):“但我們絕對(duì)致力于應(yīng)對(duì)我們所面臨的挑戰(zhàn)并繼續(xù)改進(jìn)。這就是人們?cè)谶@里做的事情?!?/p>

其他時(shí)候,算法更改的想法來(lái)自公司內(nèi)部的廣泛意見(jiàn)。 Nahak表示,一些員工長(zhǎng)期以來(lái)一直認(rèn)為谷歌搜索結(jié)果應(yīng)該更加個(gè)性化。目前,谷歌搜索個(gè)性化的內(nèi)容很少,現(xiàn)有的搜索重點(diǎn)是用戶的位置或先前搜索的直接上下文。 (例如,如果你搜索了與棒球有關(guān)的東西,然后是“巨人隊(duì)”,那么結(jié)果就不會(huì)影響到足球隊(duì)。)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6105

    瀏覽量

    104796
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4576

    瀏覽量

    92345

原文標(biāo)題:谷歌搜索歧視特朗普?全面拆解Google搜索算法及優(yōu)化

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    谷歌取消“站點(diǎn)鏈接搜索框”,適應(yīng)新搜索需求

    近日,谷歌發(fā)布了一則通知,決定取消搜索結(jié)果中的“站點(diǎn)鏈接搜索框”。這一功能已經(jīng)陪伴了用戶十多年,它允許用戶在特定網(wǎng)站上進(jìn)行更深入的搜索,為許
    的頭像 發(fā)表于 10-23 11:20 ?186次閱讀

    tas5756m使用GPIO口加內(nèi)部PLL產(chǎn)生MCLK的方法究竟是怎么樣的?

    tas5756m使用GPIO口加內(nèi)部PLL產(chǎn)生MCLK的方法究竟是怎么樣的?
    發(fā)表于 08-19 06:06

    OpenAI將推出在線搜索工具“SearchGPT”

    科技巨頭OpenAI正悄然醞釀一場(chǎng)搜索領(lǐng)域的變革,其最新推出的在線搜索工具“SearchGPT”正悄然挑戰(zhàn)著Alphabet旗下谷歌搜索霸主地位。這款被寄予厚望的新工具,目前正處于緊
    的頭像 發(fā)表于 07-26 16:54 ?606次閱讀

    AI搜索挑戰(zhàn)百度谷歌,重塑信息檢索的市場(chǎng)?

    自然語(yǔ)言處理技術(shù)理解用戶的復(fù)雜查詢(xún),從而提供更為豐富和個(gè)性化搜索結(jié)果。就像搜索引擎在過(guò)去幾十年里徹底改變了我們獲取信息的方式一樣,AI搜索
    的頭像 發(fā)表于 07-04 21:15 ?187次閱讀
    AI<b class='flag-5'>搜索</b>挑戰(zhàn)百度<b class='flag-5'>谷歌</b>,重塑信息檢索的市場(chǎng)?

    揭秘谷歌搜索算法工作原理,與官方聲明存在矛盾

    有著十多年搜索引擎優(yōu)化經(jīng)驗(yàn)的蘭德·菲什金,近日透露他收到一份長(zhǎng)達(dá)2500頁(yè)的文件,據(jù)稱(chēng)這是對(duì)谷歌搜索算法工作原理的真實(shí)揭示,而非谷歌官方所聲
    的頭像 發(fā)表于 05-29 16:00 ?516次閱讀

    谷歌將在AI搜索中加入廣告

    谷歌近日宣布,將在美國(guó)測(cè)試在人工智能生成的答案中嵌入搜索和購(gòu)物廣告。這一創(chuàng)新舉措緊隨其年度I/O大會(huì)上推出的人工智能概覽功能之后。
    的頭像 發(fā)表于 05-23 09:23 ?398次閱讀

    谷歌將為AI搜索結(jié)果中的商品提供購(gòu)物廣告

    比如,顧客通過(guò)谷歌搜索如何去除衣物褶皺,AI 將為他們提供多種解決方案,同時(shí)在頁(yè)面底部推薦商家提供的廣告商品。谷歌表示,廣告商只需提供提示詞即可實(shí)現(xiàn)相關(guān)內(nèi)容展示,無(wú)需進(jìn)行復(fù)雜設(shè)置。
    的頭像 發(fā)表于 05-22 11:51 ?522次閱讀

    OpenAI計(jì)劃下周一宣布對(duì)標(biāo)谷歌搜索的競(jìng)品

    OpenAI即將在下周一揭曉一項(xiàng)重大創(chuàng)新,他們計(jì)劃推出一款全新的AI搜索產(chǎn)品,以挑戰(zhàn)當(dāng)前搜索領(lǐng)域的巨頭谷歌。這一決定無(wú)疑將加劇雙方在搜索市場(chǎng)的競(jìng)爭(zhēng)態(tài)勢(shì)。雖然具體的發(fā)布日期之前并未公開(kāi),
    的頭像 發(fā)表于 05-11 09:22 ?309次閱讀

    STM32擦除后數(shù)據(jù)究竟是0x00還是0xff ?

    STM32擦除后數(shù)據(jù)究竟是0x00還是0xff ,百度查了許多發(fā)現(xiàn)大多數(shù)都是0xff的多,都說(shuō)SD卡(TF)儲(chǔ)存介質(zhì)是Flash 所以擦除后為0xff,但是我遇到了讀出來(lái)的數(shù)據(jù)是0x00的情況,為什么呢
    發(fā)表于 04-18 07:59

    谷歌Vertex AI搜索在醫(yī)療保健領(lǐng)域正式推出

    谷歌公司近日宣布,其Vertex AI搜索功能在醫(yī)療保健領(lǐng)域正式亮相,并已成功與MedLM以及醫(yī)療保健數(shù)據(jù)引擎(HDE)完成集成。這一創(chuàng)新功能專(zhuān)為醫(yī)護(hù)人員設(shè)計(jì),旨在從繁雜的醫(yī)療記錄中快速且精準(zhǔn)地提取出關(guān)鍵的臨床信息。
    的頭像 發(fā)表于 03-22 14:08 ?516次閱讀

    谷歌將打擊AI生成內(nèi)容及內(nèi)容農(nóng)場(chǎng),削減搜索垃圾內(nèi)容40%

    谷歌產(chǎn)品管理總監(jiān)伊麗莎白·塔克特別指出,接下來(lái)的更新主要聚焦于升級(jí)核心排名系統(tǒng),從而更好地衡量網(wǎng)頁(yè)質(zhì)量、用戶體驗(yàn)與真實(shí)性。此外,本次更新還將重點(diǎn)識(shí)別常見(jiàn)的大規(guī)模低價(jià)值內(nèi)容如偽造搜索結(jié)果的垃圾網(wǎng)站
    的頭像 發(fā)表于 03-06 15:53 ?583次閱讀

    蘋(píng)果微軟曾洽購(gòu)必應(yīng),因谷歌搜索質(zhì)量未果

    CNBC及其他媒體引述的美國(guó)司法部反壟斷公訴書(shū)詳細(xì)列舉了谷歌搜索領(lǐng)域所持的壟斷角色。訴狀中透露,盡管微軟多次試圖將必應(yīng)用戶作為Safari瀏覽器的默認(rèn)搜索引擎,但每一次均因搜索
    的頭像 發(fā)表于 02-25 10:39 ?579次閱讀

    谷歌測(cè)試搜索新功能:幫用戶減少等待接通客服時(shí)間

    根據(jù)谷歌的詳細(xì)說(shuō)明,當(dāng)用戶在Google搜索客服電話信息后,會(huì)在結(jié)果頁(yè)面找到“Request a call”圖表,提供了深入通信的意圖和電話號(hào)碼的填寫(xiě)位置。
    的頭像 發(fā)表于 02-19 13:51 ?441次閱讀

    谷歌搜索引擎優(yōu)化的各個(gè)方面和步驟

    谷歌搜索引擎是最受歡迎和廣泛使用的搜索引擎之一,為了使你的網(wǎng)站在谷歌上更好地排名并提高曝光度,你可以采取一些谷歌
    的頭像 發(fā)表于 01-25 10:29 ?781次閱讀

    同步電機(jī)的轉(zhuǎn)數(shù)同步究竟是與什么同步???

    同步電機(jī)的轉(zhuǎn)數(shù)同步究竟是與什么同步啊? 所有的同步電機(jī)的轉(zhuǎn)數(shù)都一樣嗎?還是與電機(jī)的極對(duì)數(shù)有關(guān)系呢?
    發(fā)表于 12-19 06:44