偵探網(wǎng)提起貝葉斯公式,相信很多同學(xué)都會(huì)無奈地?fù)u搖頭,彎彎繞繞太多了,解題的時(shí)候一不小心就會(huì)出錯(cuò)。
今天,我會(huì)教大家用偵探的思維方式學(xué)習(xí)貝葉斯公式,并在此思維方式的基礎(chǔ)上為大家總結(jié)貝葉斯公式考題的標(biāo)準(zhǔn)解題流程,只要大家掌握了套路,并適當(dāng)練習(xí),以后再也不用擔(dān)心貝葉斯公式了,哦耶!
首先,大家把自己想象成一名思維縝密的偵探,現(xiàn)在有一個(gè)棘手的案子:
破案的關(guān)鍵點(diǎn)是確定30年前的某一天是下雨天的概率,這一天就是案發(fā)時(shí)間,只要當(dāng)天下雨的概率大于等于75%,就能進(jìn)一步縮小排查范圍,甚至鎖定犯罪嫌疑人。
現(xiàn)在的最困擾的問題是,30年前的信息記錄并不像現(xiàn)在這么完善,30年前該地區(qū)的每天的天氣情況現(xiàn)在找不到直接的線索,走訪了氣象局等部門后,能得到的信息只是當(dāng)年降雨的天數(shù)占比為40%,也就是說當(dāng)年任意一天是下雨天的概率是40%,但這個(gè)概率只是泛泛而談,如果沒有更加精準(zhǔn)的分析,調(diào)查就會(huì)被迫中止,難道真的要看兇手逍遙法外么?
就在一籌莫展之際,一位學(xué)校小超市的老板娘提供了一絲線索:在下雨天的情況下該超市雨傘當(dāng)日售罄的概率是80%,在不下雨的情況下該超市雨傘當(dāng)日售罄的概率是10%,這組概率三十年來一直保持穩(wěn)定。
翻開已經(jīng)泛黃但字跡依然清晰可辨的超市30年前的進(jìn)貨記錄登記表,可以發(fā)現(xiàn)上面記錄著案發(fā)當(dāng)天的雨傘是售罄的。偵探目前拿起紙筆,打算根據(jù)這條最新線索,重新評(píng)估一下案發(fā)當(dāng)天是下雨天的概率。
偵探的內(nèi)心OS:
在沒有這位老板娘提供的最新信息的情況下,當(dāng)天是下雨天的概率(先驗(yàn)概率)為40%,現(xiàn)在的新信息告訴我,當(dāng)天雨傘是售罄的,雨傘售罄這件事在下雨天發(fā)生的可能性要比在不是下雨天的時(shí)候發(fā)生的可能性大很多,因此根據(jù)新信息調(diào)整更新后的當(dāng)天是下雨天的概率(后驗(yàn)概率)肯定會(huì)顯著的大于40%,但具體等于多少需要用一下貝葉斯公式。
哈哈,柳暗花明又一村,看到了破案的希望!
為了方便標(biāo)識(shí)和套公式,把該地區(qū)下雨記為事件A, 把該超市的雨傘售罄記為事件B。現(xiàn)在已知的信息為:當(dāng)年該地區(qū)下雨的概率為40%, 即P(A)=40%。下雨的情況下該超市雨傘售罄的概率為80%,即P(B|A)=80%。不下雨的情況下該超市雨傘售罄的概率為10%,即P(B|A^C)=10% (A^C讀作complement of A,表示A事件的反面,即不下雨)。
我們現(xiàn)在要求的是P(A|B),根據(jù)貝葉斯公式:P(A|B)=P(A)×P(B|A)/P(B),貝葉斯公式的本質(zhì)就是根據(jù)新信息對(duì)先驗(yàn)概率進(jìn)行更新調(diào)整。到底怎么調(diào)整,調(diào)整幅度是多少,就看P(B|A)/P(B)這個(gè)調(diào)整因子有多大了。
其中P(B|A)是已知條件,而P(B)需要用全概率法則求出,該超市雨傘售罄可以分為兩種情況,在下雨天售罄和在不是下雨天的時(shí)候售罄,而下雨和不下雨的概率分別為40%和60%,因此:
顯然,84.21%大于進(jìn)一步縮小排查范圍需要的最低概率,75%。也是就是說,偵探利用貝葉斯公式在查案上取得了重大突破!
回顧該案件,在運(yùn)用貝葉斯公式的時(shí)候,之所以根據(jù)新信息更新后的后驗(yàn)概率比先驗(yàn)概率大很多,是因?yàn)檎{(diào)整因子足夠大:P(B|A)/P(B)=80% /38% ≈2.1
貝葉斯公式解題標(biāo)準(zhǔn)操作流程
一般需要使用貝葉斯公式的題目問的問題從形式上看肯定是一個(gè)條件概率,題中的已知信息會(huì)告知一組條件概率,但看著都有點(diǎn)蹩腳,因?yàn)橐阎倪@組條件概率跟問題問的角度是岔開的。遇到需要使用貝葉斯公式解題的題目時(shí),按照以下四步走:
①根據(jù)問的問題定義出A事件和B事件。
由于最終貝葉斯公式計(jì)算出的是B事件發(fā)生的情況下A事件發(fā)生的概率,即P(A|Β),因此要把題目中的新信息(剛發(fā)布的消息/剛剛發(fā)生的事情/剛得到的線索等)定義為B事件,在剛才這個(gè)案件中,就是該超市雨傘售罄。另外,把題目中已經(jīng)告知先驗(yàn)概率、現(xiàn)在需要求后驗(yàn)概率的對(duì)應(yīng)的事件定義為A事件,在剛才這個(gè)案件中,就是該地區(qū)下雨。
②找出A事件發(fā)生的先驗(yàn)概率,并寫下來。
這個(gè)概率是后續(xù)做調(diào)整更新的對(duì)象,把這個(gè)概率找對(duì)非常重要。
③計(jì)算調(diào)整因子P(B|A)/P(B)。
需要注意的是分子P(B|A) 一般題目中會(huì)直接給出,而分母P(B)一般需要使用全概率法則計(jì)算,全概率法則的本質(zhì)是先分類討論然后再按照每種情況發(fā)生的概率加權(quán)平均對(duì)應(yīng)的條件概率。
④套用貝葉斯公式,P(A|B)=P(A)×P(B|A)/P(B),把第②步和第③步得到的結(jié)果相乘就得到了最終的答案。
以上四步就是貝葉斯公式問題的標(biāo)準(zhǔn)解題流程。如果大家計(jì)算完了之后,想再略微核對(duì)一下中間的計(jì)算步驟有沒有出現(xiàn)明顯錯(cuò)誤,一個(gè)可行的辦法是看一下這道貝葉斯公式題目中,新信息B事件是在A事件發(fā)生的時(shí)候發(fā)生的概率更大,還是在A事件不發(fā)生的時(shí)候發(fā)生的概率更大。
如果是前者(新信息B事件在A事件發(fā)生時(shí)發(fā)生的概率更大),那最終得到的后驗(yàn)概率P(A|B)一定會(huì)大于先驗(yàn)概率P(A)。
如果是后者(新信息B事件在A事件不發(fā)生時(shí)發(fā)生的概率更大),那最終得到的后驗(yàn)概率P(A|B)一定會(huì)小于先驗(yàn)概率P(A)。
如果違反了這樣的經(jīng)驗(yàn)法則,那肯定是在某個(gè)步驟中不小心數(shù)字代錯(cuò)了。例如在上述案件中,如果最終算出的P(A|B)等于35%,那肯定是算錯(cuò)了,因?yàn)橄闰?yàn)概率P(A)就有40%,而事件A發(fā)生的前提下B事件發(fā)生的概率要比A沒有發(fā)生時(shí)B事件發(fā)生的概率更大(下雨天該超市雨傘售罄的概率為80%,不下雨的情況下該超市雨傘售罄的概率只有10%),因此P(A|B)不可能小于40%。