三级片精品免费视频,精品无码久久久久久电影

編者按：Cheng-Tao Chu簡(jiǎn)要概述了統(tǒng)計(jì)假設(shè)測(cè)試、多臂老虎機(jī)（湯普森采樣）方法后，揭示了多臂老虎機(jī)在實(shí)踐中的優(yōu)勢(shì)。

隨著精益創(chuàng)業(yè)和大數(shù)據(jù)的興起，越來越多的公司開始擁抱A/B測(cè)試。盡管業(yè)界開始基于數(shù)據(jù)統(tǒng)計(jì)測(cè)試特性這一點(diǎn)很是振奮人心，但很少有公司意識(shí)到多臂老虎機(jī)這一優(yōu)于傳統(tǒng)統(tǒng)計(jì)假設(shè)測(cè)試的替代方案。本文將概述為何在大多數(shù)應(yīng)用中，多臂老虎機(jī)優(yōu)于假設(shè)測(cè)試。不熟悉為何基于數(shù)據(jù)測(cè)試特性很重要的讀者，可以看看我之前寫的博客文章 Bridging the gap between lean startup in theory and in prac tice。需要社會(huì)認(rèn)同的讀者，Google Analytics用的就是多臂老虎機(jī)方案。

統(tǒng)計(jì)假設(shè)測(cè)試概述

A/B測(cè)試的假設(shè)測(cè)試的目標(biāo)是查明觀測(cè)到的轉(zhuǎn)化率差異是否有運(yùn)氣以外的解釋。標(biāo)準(zhǔn)方法如下：

計(jì)算零假設(shè)（null hypothesis）下的采樣分布

計(jì)算采樣分布下觀測(cè)到的似然，并

將概率與預(yù)先確定的閾值比較

盡管初看起來很直觀，實(shí)際上它需要不少統(tǒng)計(jì)學(xué)知識(shí)來恰當(dāng)?shù)卦O(shè)計(jì)試驗(yàn)及解釋結(jié)果。例如：

如何約束第二類錯(cuò)誤？

如何同時(shí)測(cè)試兩個(gè)以上的實(shí)驗(yàn)組？

需要多少項(xiàng)觀測(cè)？

正確的閾值是多少？

能不能提前查看結(jié)果并及早終止試驗(yàn)？

多臂老虎機(jī)概述

“多臂老虎機(jī)”這一名稱描述了這樣一個(gè)場(chǎng)景：一名賭徒面對(duì)著幾臺(tái)“單臂老虎機(jī)”，每臺(tái)老虎機(jī)的期望返水不同。目標(biāo)是最大化一系列拉桿操作的總回報(bào)。為了達(dá)成這一目標(biāo)，多臂老虎機(jī)動(dòng)態(tài)平衡通過拉動(dòng)不確定的搖桿收集信息的代價(jià)（探索）和拉動(dòng)已知回報(bào)豐厚的拉桿的累計(jì)回報(bào)（利用）。

在A/B測(cè)試的語境下，每臺(tái)老虎機(jī)代表試驗(yàn)中的一個(gè)實(shí)驗(yàn)組，每次拉動(dòng)搖桿代表一個(gè)實(shí)驗(yàn)組的一次曝光，累計(jì)回報(bào)代表累計(jì)轉(zhuǎn)化。多臂老虎機(jī)問題有很多不同的算法，比如UCB、Epsilon-Greedy等，本文將聚焦于一種名為“湯普森采樣”的算法。

湯普森采樣概述

湯普森采樣的思路非常簡(jiǎn)單。該算法維護(hù)每臂的返水率的后驗(yàn)分布，按照在該后驗(yàn)分布下給定臂最優(yōu)的概率，成比例地拉動(dòng)拉桿，接著根據(jù)新觀測(cè)更新后驗(yàn)。例如，對(duì)兩個(gè)觀測(cè)到轉(zhuǎn)化率為10/150和5/100（轉(zhuǎn)化數(shù)/曝光）的實(shí)驗(yàn)組而言，其后驗(yàn)轉(zhuǎn)化率分布為Beta(10, 140)和(5, 95)。根據(jù)轉(zhuǎn)化率，后續(xù)的測(cè)試應(yīng)該在第一個(gè)實(shí)驗(yàn)組上進(jìn)行，因?yàn)樵摻M的轉(zhuǎn)化率較高。但湯普森采樣并不采用這種確定的方法，而是基于當(dāng)前的后驗(yàn)轉(zhuǎn)化率分布隨機(jī)取樣，決定在哪個(gè)實(shí)驗(yàn)組上進(jìn)行，兩者的概率分別為P(第一組是最佳實(shí)驗(yàn)組)和P(第二組是最佳實(shí)驗(yàn)組)。最后，根據(jù)新觀測(cè)數(shù)據(jù)更新后驗(yàn)分布。致不熟悉貝葉斯統(tǒng)計(jì)的讀者，貝塔分布經(jīng)常用作伯努利分布（用來建模轉(zhuǎn)化率）的共軛先驗(yàn)分布。

比較

現(xiàn)在我們已經(jīng)基本了解統(tǒng)計(jì)假設(shè)測(cè)試和多臂老虎機(jī)（湯普森采樣），讓我們比較一下兩者。

湯普森采樣更簡(jiǎn)單。要恰當(dāng)?shù)亟忉尳y(tǒng)計(jì)假設(shè)測(cè)試，從業(yè)者需要對(duì)基本的統(tǒng)計(jì)學(xué)測(cè)試具有良好的理解，例如，提前查看結(jié)果需要了解功效分析、偏差修正，處理多實(shí)驗(yàn)組同樣需要了解偏差修正，等等。另一方面，從業(yè)者只需理解基本的貝葉斯統(tǒng)計(jì)就可以理解湯普森采樣。解釋結(jié)果時(shí)，較簡(jiǎn)單的概念不容易出錯(cuò)。

湯普森采樣直接估計(jì)哪個(gè)臂最優(yōu)的概率。統(tǒng)計(jì)假設(shè)測(cè)試試圖回答“假定所有實(shí)驗(yàn)組轉(zhuǎn)化率相同的極端情形下，觀測(cè)到當(dāng)前狀況的概率”。而湯普森采樣則試圖回答“給定這些觀測(cè)，給定的每個(gè)臂最優(yōu)的概率”。盡管這兩個(gè)問題都是合理的，湯普森采樣要容易理解得多，并自然而然地折衷第一類錯(cuò)誤和第二類錯(cuò)誤。

多臂老虎機(jī)通常更快收斂。由于多臂老虎機(jī)方案是自適應(yīng)的，識(shí)別最佳臂（如果它存在）所需的試驗(yàn)數(shù)通常遠(yuǎn)低于統(tǒng)計(jì)假設(shè)測(cè)試所需的試驗(yàn)數(shù)。然而，它也意味著，當(dāng)所有實(shí)驗(yàn)組一樣的時(shí)候，需要一個(gè)單獨(dú)的停止標(biāo)準(zhǔn)。

多臂老虎機(jī)可以自然地推廣至多實(shí)驗(yàn)組。這是多臂老虎機(jī)真正出彩之處。由于多臂老虎機(jī)是自適應(yīng)的，它可以很快決定哪個(gè)臂不太可能是最優(yōu)的，并以較低的概率拉動(dòng)這些較差的拉桿。另一方面，在統(tǒng)計(jì)假設(shè)測(cè)試中，每個(gè)實(shí)驗(yàn)組分配到的試驗(yàn)數(shù)目是一樣的（由試驗(yàn)之前的功效分析決定）。

總結(jié)一下，在實(shí)踐中，相比傳統(tǒng)統(tǒng)計(jì)假設(shè)測(cè)試，多臂老虎機(jī)有許多優(yōu)勢(shì)。它通常更快收斂，誤解的空間更小，能更好地推廣至多實(shí)驗(yàn)組，需要調(diào)節(jié)的參數(shù)也較少。向認(rèn)真對(duì)待A/B測(cè)試的創(chuàng)業(yè)公司強(qiáng)烈推薦多臂老虎機(jī)方法。

如果你喜歡這篇博客文章，可以在Twitter上關(guān)注我（chengtao_chu）或者訂閱我的博客ML in the Valley。另外，特別感謝 Ian Wong（ihat）和Bob Ren (bobrenjc93) 審閱本文草稿。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4576

瀏覽量
92345
大數(shù)據(jù)

大數(shù)據(jù)

+關(guān)注

關(guān)注
64

文章
8833

瀏覽量
137138

原文標(biāo)題：A/B測(cè)試：對(duì)比統(tǒng)計(jì)假設(shè)測(cè)試與多臂老虎機(jī)

文章出處：【微信號(hào)：jqr_AI，微信公眾號(hào)：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

模擬老虎機(jī)程序分享

自己做了個(gè)模擬老虎機(jī)，還有很多不足，請(qǐng)各位高手點(diǎn)評(píng)

發(fā)表于 01-13 22:29

請(qǐng)問sst89e516rd插在51開發(fā)板上卻不能下載，請(qǐng)問這是為什么？如何才能使用？

前幾天在路上揀到一老虎機(jī)主板，上有sst89e516rd，把它插在51開發(fā)板上卻不能下載，求教大俠告訴我怎么才能使用它

發(fā)表于 07-13 04:16

老虎機(jī)源程序

點(diǎn)擊下載

發(fā)表于 04-29 09:40

CAD建筑制圖入門加老虎窗

`下面具體介紹CAD建筑制圖入門加老虎窗，建筑設(shè)計(jì)有不同窗，有一種老虎窗是經(jīng)常使用到，浩辰CAD軟件里面專門提供了此功能，下面具體介紹一下CAD制圖初學(xué)入門加老虎窗具體操作步驟。CAD

發(fā)表于 03-26 16:53

【社區(qū)之星】王培瑞：電子人的成長(zhǎng)之路——注重在實(shí)踐中學(xué)習(xí)

嘉賓介紹：王培瑞 2013年7月畢業(yè)于西安工程大學(xué)自動(dòng)化專業(yè)！參加工作后一直從事于自動(dòng)化相關(guān)專業(yè)！擁有豐富的軟硬件開發(fā)測(cè)試經(jīng)驗(yàn)，注重在實(shí)踐中學(xué)習(xí)，善于應(yīng)用不同的開發(fā)工具完成不同業(yè)務(wù)需求！曾就職于臺(tái)達(dá)

發(fā)表于 02-16 11:10

【Start_DSC28034PNT湖人開發(fā)板免費(fèi)體驗(yàn)】（開源）控制機(jī)械臂小游戲3

一個(gè)選項(xiàng)。根據(jù)規(guī)則判斷誰是獲勝者或平局。規(guī)則如下：老虎吃雞雞吃蟲蟲拱杠子杠子打老虎玩家和計(jì)算機(jī)做出選擇后，會(huì)自動(dòng)根據(jù)游戲規(guī)則進(jìn)行判斷并輸出相應(yīng)的結(jié)果，不同的結(jié)果機(jī)械臂就會(huì)有不同的動(dòng)作。根據(jù)

發(fā)表于 07-30 14:48

基于單片機(jī)的多機(jī)并行通信設(shè)計(jì)

單片機(jī)的多機(jī)串行通信應(yīng)用十分廣泛，但在串行口被占用又要進(jìn)行多機(jī)通信時(shí)就要采取其它措施。本文介紹了

發(fā)表于 10-27 15:00 ?2152次閱讀

基于單片<b class='flag-5'>機(jī)</b>的<b class='flag-5'>多</b><b class='flag-5'>機(jī)</b>并行通信設(shè)計(jì)

表面電容式觸摸屏讓老虎機(jī)和桌游機(jī)更有趣

在全球范圍內(nèi)，人們已經(jīng)習(xí)慣用觸摸屏來實(shí)現(xiàn)與各種電子設(shè)備之間的互動(dòng)了。雖然觸摸屏技術(shù)從多年前開始就已被應(yīng)用于老虎機(jī)，但隨著游戲行業(yè)對(duì)大型個(gè)性化顯示的需求，觸摸屏技術(shù)在這個(gè)行業(yè)內(nèi)的應(yīng)用得到了更大的發(fā)展

發(fā)表于 09-13 20:03 ?0次下載

蒙特卡洛模擬方法

蒙特卡洛是摩納哥大公國的一座知名賭城，里面遍布輪盤賭、擲骰子和老虎機(jī)等游戲，類似的，蒙特卡洛方法的建模機(jī)制也基于隨機(jī)數(shù)和統(tǒng)計(jì)概率。

發(fā)表于 06-05 11:13 ?9576次閱讀

基于多假設(shè)跟蹤框架的多攝像機(jī)多目標(biāo)跟蹤方法

為提高攝像機(jī)目標(biāo)跟蹤精度，提岀基于多假設(shè)跟蹤（MH）框架的采用軌跡樹層次關(guān)系模型多攝像機(jī)多目標(biāo)跟蹤方法

發(fā)表于 04-12 16:05 ?38次下載

中型C形臂X光機(jī)的應(yīng)用及優(yōu)勢(shì)

C形臂X光機(jī)大家對(duì)于這款放射科設(shè)備，估計(jì)都不太陌生，可是C形臂的種類較多，主要分為：大C、中C和小C等，針對(duì)不同的類型的C形臂，其主要的臨床

發(fā)表于 07-20 09:52 ?2063次閱讀

平板小C臂的優(yōu)勢(shì)特點(diǎn)是怎樣的

小C臂又稱C形臂X光機(jī)、骨科C臂，是指機(jī)架為C型的X線影像設(shè)備，用于手術(shù)中的實(shí)時(shí)動(dòng)態(tài)成像。說起平板小C臂

發(fā)表于 01-20 10:14 ?2630次閱讀

MindSpore 首發(fā)：隱私保護(hù)的 Bandit 算法，實(shí)現(xiàn)電影推薦

老虎機(jī)（Bandit）問題是強(qiáng)化學(xué)習(xí)中一類重要的問題，由于它定義簡(jiǎn)潔且有大量的理論分析，因此被廣泛應(yīng)用于新聞推薦，醫(yī)學(xué)試驗(yàn)等實(shí)際場(chǎng)景...

發(fā)表于 01-25 18:07 ?0次下載

帶渦輪開關(guān)的插槽車控制器電路

電子愛好者和愛好者通常喜歡拼搭和玩玩具車。如果您是其中之一，這里有一個(gè)可以控制老虎機(jī)車的電路?！?b class='flag-5'>老虎機(jī)車”使用軌道上的插槽和汽車下方的銷來幫助引導(dǎo)它們?cè)谫惖郎闲旭?。他們通常有兩輛車。這個(gè)老虎機(jī)汽車

發(fā)表于 07-02 10:43 ?764次閱讀

使用Arduino實(shí)現(xiàn)老虎機(jī)自動(dòng)化

電子發(fā)燒友網(wǎng)站提供《使用Arduino實(shí)現(xiàn)老虎機(jī)自動(dòng)化.zip》資料免費(fèi)下載

發(fā)表于 07-06 11:47 ?0次下載

搜索歷史

統(tǒng)計(jì)假設(shè)測(cè)試、多臂老虎機(jī)方法，揭示了多臂老虎機(jī)在實(shí)踐中的優(yōu)勢(shì)

評(píng)論

模擬老虎機(jī)程序分享

請(qǐng)問sst89e516rd插在51開發(fā)板上卻不能下載，請(qǐng)問這是為什么？如何才能使用？

老虎機(jī)源程序

CAD建筑制圖入門加老虎窗

【社區(qū)之星】王培瑞：電子人的成長(zhǎng)之路——注重在實(shí)踐中學(xué)習(xí)

【Start_DSC28034PNT湖人開發(fā)板免費(fèi)體驗(yàn)】（開源）控制機(jī)械臂小游戲3

基于單片機(jī)的多機(jī)并行通信設(shè)計(jì)

表面電容式觸摸屏讓老虎機(jī)和桌游機(jī)更有趣

蒙特卡洛模擬方法

基于多假設(shè)跟蹤框架的多攝像機(jī)多目標(biāo)跟蹤方法

中型C形臂X光機(jī)的應(yīng)用及優(yōu)勢(shì)

平板小C臂的優(yōu)勢(shì)特點(diǎn)是怎樣的

MindSpore 首發(fā)：隱私保護(hù)的 Bandit 算法，實(shí)現(xiàn)電影推薦

帶渦輪開關(guān)的插槽車控制器電路

使用Arduino實(shí)現(xiàn)老虎機(jī)自動(dòng)化

搜索歷史

統(tǒng)計(jì)假設(shè)測(cè)試、多臂老虎機(jī)方法，揭示了多臂老虎機(jī)在實(shí)踐中的優(yōu)勢(shì)

評(píng)論

統(tǒng)計(jì)假設(shè)測(cè)試、多臂老虎機(jī)方法，揭示了多臂老虎機(jī)在實(shí)踐中的優(yōu)勢(shì)