德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

2 個月 ago
60 Views
德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸 【Andy Stacks團隊精選文】真正的「詭道」是隨機性,首章論述過《三十六計》不可靠的原因,那《孫子兵法》如何呢?

孫子兵法》確實是本實實在在的用兵戰略總結。
但《孫子兵法》並不神祕,它的思想,比如「知己知彼」、「國之大事」、「多算勝,少算不勝」、「君命有所不受」等,在今天看來都已經是常識性的認知。
孫子兵法》確實也包含了一些樸素的賽局思想,比如「圍師必闕」,就是在〈其身不正,雖令不從〉一文中提過的增加敵人的選項。

之所以說《孫子兵法》樸素,是因為現代賽局理論比它要高級得多。
比如《孫子兵法》中有這樣一段:「兵者,詭道也。故能而示之不能,用而示之不用……」它的意思很簡單,就是不能讓敵人知道你的戰術意圖,你要迷惑對手。

這個道理固然沒錯,但是「迷惑對手」這件事,得像這段敘述中所說的那樣,一直說反話嗎?
德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

詭道的悖論
我上中學的時候喜歡踢足球,是一名守門員。雖然我的技術不怎麼樣,但是我知道一些理論:罰踢點球(在罰球點將球往前踢出)的時候,球到達球門只需要不到○.三秒,守門員不可能在這麼短的時間內反應過來,所以只能事先賭一個方向。

點球,是守門員和球員之間的賽局。我還聽說,守門員可以透過球員的眼神判斷他射門的方向。
有一次踢球,我們隊被判了點球。罰球的那名球員是什麼長相、這顆球最後被踢向了哪裡、有沒有罰進,我都忘了,但我清楚記得他的眼神。他的眼睛不停地瞄我右側的方向。按理說他是想朝右邊踢,可是我突然多想了一步。

我知道守門員應該看眼神來判斷方向,那他是不是也知道?他會不會是故意往右邊看,實際上是想往左邊踢呢?又或者說,他會不會也料我能想到他的詭計,然後將計就計,還是會往右邊踢呢?

我參加了一次真正的賽局。罰踢點球是一個可以欺騙對手的遊戲。這種賽局也是賽局理論的鼻祖,馮紐曼當年研究的東西,不過他研究的是打撲克牌。

德州撲克中,最基本的操作是如果手裡的牌好,就應該加注;如果牌不好,就應該蓋牌退出。但打牌這麼老實可不行。當對手一看你加注,就知道你手裡拿著好牌,他就不會跟了,這樣你怎麼能贏很多錢呢?所以,必須迷惑對手才行。

打牌,一定要善於虛張聲勢。中文大概叫「詐唬」,英文術語叫「Bluff」。有時候你手中的牌明明不好,也要假裝牌好,選擇加注。可能對手被你嚇住,就不跟了,這樣你就贏了。但更重要的是,要讓對手知道你在牌不好的情況下也會加注,他才會不知道你加注是代表牌好還是牌不好,他也才可能在你因為牌好加注的時候跟著加注。所以即使你的牌特別好,有時候也要假裝牌一般,謹慎地加個小注。

想往左邊踢,就故意往右邊看;明明不能,但是讓對手以為你能,這不就是「能而示之不能」的《孫子兵法》嗎?
但是馮紐曼比《孫子兵法》多了一個洞見。馮紐曼說,你既不能有好牌就加注,也不能有壞牌就加注。你既不能往左邊踢就往左邊看,也不能往左邊踢就往右邊看。只說謊話就等於只說實話,對手只要反著聽就行了。
馮紐曼說,想要真的迷惑對手,必須把謊話和實話混合起來。
德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

混合策略
先前提到的各種賽局,好比納許均衡,你最終只能選擇確定的一招,這種情況叫作「純策略」(Pure Strategies)。

但思考一下點球賽局。當球員往守門員的左側踢,守門員也往左側撲,這個局面是納許均衡嗎?顯然不是。在這種情況下,球員會想改變策略而往右側踢。同樣的道理,如果球員往左側踢,守門員往右側撲,球員又會想要改變策略。無論是哪一種組合,攻守雙方總有一個人想要單方面改變自己的策略,所以點球賽局中沒有納許均衡。嚴格地說,是「沒有純策略的納許均衡」。

因為沒有純策略的納許均衡,所以賽局理論不能告訴球員應該怎麼踢才能踢進。但是,如果球員要罰踢很多次點球,賽局理論可以提供他一個指導,讓他用一個系統取勝。這個系統是「混合策略」(Mixed Strategies)。
所謂混合策略,就是不能老往同一個方向踢,應該按照一定的機率,有時候往左踢,有時候往右踢。

你可能會認為,這不是顯然如此嗎?還用得著賽局理論?注意了,這裡面有個大學問——應該以多少機率往左踢,以多少機率往右踢呢?

假設球員向守門員的左側踢,有時候容易踢偏,導致他更喜歡往右踢。那他能不能以一半的機率往右踢,一半的機率往左踢呢?不行。如果他這麼踢,守門員就會堅決撲向右側,因為左邊更值得交給運氣。按照這樣的踢法,雖然球員的每一腳都不可預測,但是他有個非常明顯的統計趨勢可以被對手利用。

正確的策略應該是:球員首先要知道自己向左踢和向右踢進球的機率分別是多少,然後合理搭配向左踢和向右踢的機率,以至於讓守門員不管是撲向左邊還是右邊,進球的機率都一樣。
也就是說,球員的混合機率選擇,應該把對手能得到的最大報償最小化。在這種情況下,因為守門員向左撲或向右撲都一樣,他就沒有什麼確定的好辦法。馮紐曼證明,這是對球員最有利的混合策略。這個結論,叫作「最小最大值定理」(Minimax Theorem)。

這是賽局理論的一個基本定理,它涉及非常複雜的數學,在此就不細說了,但是這個精神是容易理解的。
第一,要按照一定的機率,混合自己的打法。
第二,混合打法的規律,必須是對手無法利用的。

只說實話不行,只說謊話也不行。在90%的情況下說實話,10%的情況下說謊話,也不一定行,因為對手還是可能根據聽實話和聽謊話的實際報償,決定略。必須用最小最大值定理計算出一個實話和謊話的最佳配比才行。
後來約翰.納許進一步證明,所有的賽局,不管有多少參與者,都至少存在一個納許均衡,可能是純策略納許均衡,或者是混合策略納許均衡。不管你玩的是什麼遊戲,賽局理論總能給你幫助。

一個理性的守門員和一個理性的球員玩的點球遊戲,必定是雙方各自使用自己的最佳混合策略。誰不用這個混合策略,誰就會被對手抓住破綻。
《三國演義》的「煮酒論英雄」這一段中,曹操對著劉備說了一番「龍之變化」。
德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

曹操說:「龍能大能小,能升能隱;大則興雲吐霧,小則隱介藏形;升則飛騰於宇宙之間,隱則潛伏於波濤之內……龍之為物,可比世之英雄。」
曹操說的這番話就有點像最小最大值定理,英雄做事,必須完全沒有可以被敵人利用的規律。

真隨機的好處
你可能會覺得這樣要求太高了,難道罰踢點球之前還要做個數學計算?是的,如果你要罰的這些點球都價值千金,計算就是值得的。事實上,有人統計了1995年到2012年間職業足球比賽中的九千零一十七個點球,發現這些真實比賽中的點球結果,和最小最大值定理要求的混合策略納許均衡,高度一致。

我們大概可以說,職業球員有一種很專業的比賽感覺,他們知道怎麼樣才能最大限度地迷惑對手。而且近年來,有很多球隊已經在使用專門的軟體工具分析對手和計算自己的策略。在世界盃期間,我們可能經常聽到這樣的報導:點球決勝的時候,守門員手裡有個紙條,上面寫著對方球員最可能的射門方向。我相信紙條上的建議絕對不是對方球員最擅長的方向,而是一個全面考慮的混合策略。

更了不起的是,同樣的研究還表明,職業球員還執行了相當不錯的隨機性。
人類非常不擅長執行隨機。比如我要求你以左、右分別是40%和60%的機率踢點球,你會怎麼安排呢?先往左踢四個,再往右踢六個嗎?還是按照左右規律地交替,並在中間多安排幾個右呢?從統計的角度看,這些安排都太整齊了,非常容易被人利用。一般人想到隨機性,會強烈地以為應該交替進行。比如球員前兩次罰踢點球都踢向了左側,這一次可能非常想踢右側——如果球員有這個心理,對手就可能會利用這一點,接下來重點防守右邊。

唯一正確的做法,是執行真的隨機性。比如球員可以隨身帶一本書,每次罰踢點球之前隨便翻開一頁,如果頁碼的個位數是○到三就踢左邊,如果是四到九就踢右邊。
有人觀察了都是業餘選手參加的「剪刀、石頭、布」比賽——真有這樣的比賽——發現業餘選手的特點恰恰就是出手不夠隨機。O他們在原則上可以被人用機率論系統性地打敗。
不是真隨機,就會被破解,這個道理和密碼學一樣。科普作家卓克在得到App有個課程叫《密碼學三十講》,其中專門說過這個道理。

隨機性,才是真正的「詭道」。
德州撲克混合策略是不怕被識破的陽謀 說到底大家都是納許均衡的奴隸

這個原理可以應用於多種情況,比如打網球。如果你知道對方的反手比較弱,是不是就應該一直反手回擊呢?不行。因為這麼做,對方就能預測你的打法了。就算你知道他喜歡正手,也得按一定的機率正手回擊,你必須使用混合策略。而職業網球選手真的做到了隨機性的混合策略。他們當然不會隨身攜帶一個亂數產生器,但是他們比業餘選手更隨機。

再比如在足球和籃球比賽中,如果你們隊有個特別能得分的球星,那是不是應該一到前場就把球交給他呢?不行。那樣做的話,你們隊的戰術就是可預測的,對方的防守球員就會重點盯住你們的球星。球星再厲害,你們的隊員也必須以一定的機率將球傳給別的球員。事實上,球星在前場的作用,很大程度是牽制對方的防守兵力。

無論是政府機關檢查產品的品質,或是交通警察查違規停車,一般都是抽查。這個抽查可不能有規律。如果固定在每天下午兩點查停車,別人就會躲過這個點。最好的辦法是隨機抽查。
據說慈禧太后吃飯從來都不是只吃一盤菜,而是面對幾百盤菜隨機地選擇,每樣大概只吃一口,以至於那麼多年,人們依然不知道她愛吃什麼,這樣別人也就不容易在她的飯菜裡下毒了。
還有,在「田忌賽馬」中,想要避免被田忌算計,齊威王的最佳策略也應該是隨機安排出場順序。事實上現在的團體比賽根本不可能讓一方先確定出場名單,讓另一方有安排賽馬的機會。
混合策略不是陰謀,而是陽謀。專門說謊話是搞陰謀,可是陰謀是能夠被識破的。如果使用混合策略,就算把決策方式告訴對手,他也沒辦法破解。陽謀不怕被識破……追根究柢,大家都是納許均衡的奴隸。

Andy他是GG撲克的品牌宣傳大使,如果你喜歡Andy請收藏Andy Stacks官方網站,我們將會持續帶給你更多精彩手牌與Andy的生活。

👉看更多Andy撲克教學
👉前往WPT世界撲克巡迴賽官網
👉前往GG撲克官網
👉前往HKPPA香港撲克牌手協會