Câching In: Pourquoi les joueurs de poker pensent comme des économistes
Ces dernières années, le poker a été révolutionné en appliquant des informations sur la théorie des jeux, un outil standard en économie pour modéliser le comportement des consommateurs et de l'entreprise. Cet article raconte comment et pourquoi la théorie des jeux est entrée dans le monde du poker. Il explique également quelles entreprises, régulateurs et économistes eux-mêmes peuvent apprendre de la révolution de la théorie du jeu du poker.
Comment les régulateurs de la concurrence prédisent-ils comment une fusion entre deux sociétés aura-t-elle un impact sur les prix payés par les consommateurs? Comment les géants et les gouvernements technologiques conçoivent-ils des enchères pour allouer l'espace publicitaire en ligne, le spectre des télécommunications et le permis d'échange de trading d'émissions? Dans chaque cas, une partie de la réponse réside dans la modélisation du comportement de l'entreprise en utilisant la théorie du jeu.
La théorie des jeux est l'étude des situations où le meilleur choix (ou «stratégie») parmi les alternatives dépend des choix faits par d'autres. Toutes les situations ne sont pas comme ça - lorsque vous choisissez quoi prendre pour le petit déjeuner, vous ne vous souciez probablement pas de ce que les autres ont pour le petit déjeuner - mais de tels choix interdépendants sont courants dans les jeux du monde réel (d'où le nom de «théorie du jeu»). Par exemple, dans le football, un tuteur peut choisir de tirer de la gauche, à droite ou directement au milieu du but en fonction de la direction où elle pense que le gardien de but plongera. Les situations économiques ont souvent la même caractéristique - par exemple les entreprises qui choisissent leurs prix de produits peuvent souhaiter sous-estimer légèrement les prix de leurs rivaux.
La théorie du jeu analyse ces situations à l'aide d'un concept appelé un équilibre Nash, du nom du lauréat du prix Nobel John Nash (vous vous souvenez peut-être du film Un bel esprit, avec Russell Crowe comme Nash). Un équilibre de Nash est une situation stable où tous les participants font les meilleurs choix possible, étant donné les choix de leurs rivaux. Par exemple, dans les modèles de fusion utilisés par les régulateurs de la concurrence, un équilibre Nash signifie que toutes les entreprises choisissent les prix qui maximisent leurs bénéfices compte tenu des prix choisis par d'autres entreprises. Aujourd'hui, la théorie des jeux et l'équilibre de Nash sous-tendent comment les économistes pensent des choix interdépendants et sous-tendent ainsi une grande partie de la microéconomie moderne.
Appliquer la théorie du jeu au poker
Le poker semble naturel pour la théorie du jeu, car le choix de quand et de la quantité à pari dépend de vos propres cartes mais aussi des cartes de vos adversaires et de la façon dont ils prévoient de jouer à ces cartes. En effet, l'un des prédécesseurs de Nash, John von Neumann, a essayé d'appliquer la théorie du jeu au poker en 1944.
Pendant les 60 prochaines années, cependant, la théorie des jeux a été principalement ignorée par les joueurs de poker. Ils connaissaient les cotes et les probabilités dans une certaine mesure, mais s'appuyaient généralement sur des règles de base en fonction de l'expérience pratique. Les joueurs forts ont été caractérisés par une bonne «sensation» pour le poker et une maîtrise de la table de table, du langage corporel, de la psychologie et d'autres actifs incorporels. Comme le dit James Bond dans le film de 2006 Casino Royale: «Dans le poker, vous ne jouez jamais votre main, vous jouez l'homme en face de vous."
arlequin casinoLe boom du poker
Pour comprendre comment les choses ont changé, cela vaut la peine de retourner à la naissance du poker moderne en 2003, lorsque le principal nom de Chris Money Money, a remporté le principal événement principal des World Series of Poker (WSOP) à Las Vegas (essentiellement les championnats du monde du poker) et a gagné un frais de 2 $.5m. La victoire improbable de Moneymaker a capturé l'imagination du public (il s'est qualifié via une participation de 39 $ dans un tournoi de poker en ligne, plutôt que de payer les frais d'entrée standard de 10 000 $) et a aidé à vendre du poker en tant que sport spectateur.
Après la victoire de Moneymaker, le public de poker télévisé a augmenté rapidement, aidé par l'introduction de «caméras de cartes à trous», des caméras miniatures positionnées sous des tables de poker spécialement conçues avec des panneaux de verre permettant aux téléspectateurs de voir les cartes transformées face à chaque joueur à chaque joueur. En 2007, le poker est devenu le troisième «sport» le plus regardé à la télévision aux États-Unis. Le nombre de participants WSOP est passé de 839 en 2003 à 8 773 en 2006, ce qui est à peu près le même qu'aujourd'hui (8 569 en 2019).
Internet Poker, lancé à la fin des années 1990, a connu un boom similaire. Les principales marques de paris sportifs en ligne se sont diversifiés en poker avec les sites les plus populaires traduisant un trafic de pointe de dizaines, voire des centaines de milliers de visiteurs. La popularité soudaine du poker (et l'argent à gagner) ont attiré de nouveaux joueurs dans le jeu et signifiait que beaucoup d'entre eux, s'ils étaient assez bons, pouvaient devenir «professionnels» et gagner en vie à plein temps.
Old School vs New School
La montée du poker en ligne a créé un fossé entre les joueurs de la vieille école qui avaient fait leur carrière en jouant au poker en direct dans des casinos et une nouvelle école de joueurs en ligne qui ont appris le jeu sur Internet.
1. Codere | BONUS DE BIENVENUE CODERE CASINO - 100 % DE DÉPÔT JUSQU'À 200 € |
2. Ruby Vegas | De 100% jusqu'à 2000 € plus 200 free spins |
3. Vegas Plus | Bonus de 100 % jusqu'à 250 € sur votre premier dépôt |
4. Arlequin Casino | Bonus de bienvenue : 100 % jusqu'à 300 €/$ + 10 tours gratuits |
5. Cheri Casino | Bonus d'inscription 100 % de bonus de match jusqu'à 100 $ |
Par rapport à la dépendance de la vieille école à «jouer au joueur», la nouvelle foule en ligne était souvent considérée comme des «mathématiques» qui ont basé leurs décisions strictement sur les probabilités et les cotes. Ils avaient tendance à être jeunes - Annette Obrestad, une norvégienne, a commencé à jouer en ligne à l'âge de 15 ans, avec le nom de ScreenName «Annette_15». Mais ils ont également été expérimentés. En 2007, lorsque Mme Obrestad a gagné 1 million de livres sterling lors d'un tournoi à l'âge de 18 ans, elle a noté , «J'ai joué des milliers de tournois en ligne. La plupart des professionnels ne jouent que 60 tournois en direct par an, donc je pense que j'ai un avantage là-bas."
Ce sont les joueurs de la nouvelle école qui ont pris la théorie du jeu au sérieux, en particulier l'idée de stratégies d'équilibre de Nash (que les joueurs ont appelé des stratégies de «théorie des jeux optimales»). Comme appliqué au poker, un équilibre de Nash obtient lorsque tous les joueurs choisissent des «stratégies» (des recettes sur la façon de jouer dans chaque situation possible - quand et combien parier, quand appeler, quand plier, etc.) qui maximisent leurs gains monétaires compte tenu des stratégies utilisées par les autres joueurs. Si vous pouviez jouer une stratégie d'équilibre Nash dans le poker, vous ne perdriez jamais d'argent à long terme (une fois que la chance des cartes aurait égalisé), peu importe qui étaient vos adversaires. Même si les autres joueurs connaissaient votre stratégie, ils ne pouvaient pas vous battre - votre stratégie serait «inexploitée». Et John Nash avait prouvé en 1950 que de telles stratégies d'équilibre Nash devaient exister dans le poker.
Bien sûr, il ne suffit pas de savoir que la stratégie parfaite existe - vous devez également savoir à quoi il ressemble. Mais même pour les ordinateurs les plus puissants, trouver une stratégie d'équilibre Nash dans le poker a jusqu'à présent été inaccessible - avec 1 326 combinaisons de mains de départ, 254 251 200 combinaisons possibles de cartes communautaires et quelques restrictions sur les tailles de pari, même le poker à deux joueurs a environ 10 160 situations hypothétiques.
Cependant, cela ne signifiait pas que la théorie des jeux n'avait rien à offrir au poker. Au début, les joueurs de la nouvelle école ont calculé des stratégies d'équilibre Nash dans des modèles simplifiés de poker en utilisant un peu plus que le stylo et le papier. Ensuite, à mesure que la puissance de calcul s'améliorait, ils ont commencé à utiliser les «solveurs» de la théorie du jeu. Ces calculatrices en ligne, disponibles pour quelques centaines de livres, n'étaient pas assez puissantes pour trouver un équilibre Nash dans un jeu complet de poker, mais ils ont rendu beaucoup plus facile de se concentrer sur les stratégies d'équilibre Nash dans des situations spécifiques ou dans des modèles de poker simples. Les joueurs pouvaient brancher les entrées clés (e.g. Nombre de coups de paris à parcourir, tailles de pile, cartes communautaires, tailles de pari autorisées, les cartes possibles que chaque joueur pourrait tenir) et le solveur proposerait les stratégies d'équilibre Nash appropriées. Les joueurs pourraient alors rechercher des modèles et essayer de comprendre la logique derrière ces stratégies - à quelle fréquence devraient-ils parier, quels types de mains devraient-ils parier, etc.
Normes d'élévation
La nouvelle génération de joueurs de poker de la théorie du jeu a révolutionné la façon dont le jeu a été joué. Trois changements se distinguent.
- Bluff agressif. Le plus notable était peut-être à quelle fréquence les joueurs de la nouvelle école bluffés (je.e. parier avec des mains faibles). Lorsque MS Obrestad a commencé à bluff très fréquemment au début des années 2000, ils étaient considérés comme fous; S'ils gagnaient, ça doit être dû à la chance. Auparavant, les joueurs avaient intuitivement pensé qu'ils ne devraient parier principalement que de bonnes mains et un peu de bluff. La théorie des jeux a montré que cette approche était erronée, en particulier dans les premiers stades des mains. Dans les modèles de théorie des jeux, le ratio optimal des «paris bluff» aux «paris de valeur» était généralement d'environ 2: 1 sur le flop (lorsque trois cartes communautaires ont été traitées avec deux autres à venir). Cela signifie que lorsque vous pariez, vous devriez être deux fois plus susceptible d'avoir une main faible qu'une main forte. La logique est double. Tout d'abord, le bluff signifie que vos adversaires devront appeler vos paris souvent pour vous empêcher de gagner avec des mains faibles; Par conséquent, vous gagnerez souvent beaucoup lorsque vous aurez une main forte. Deuxièmement, de nombreuses mains avec lesquelles vous bluff peuvent s'améliorer et devenir une main forte lorsque davantage de cartes communautaires sont traitées. Cela signifie que vous pouvez vous en tirer beaucoup avec le bluff quand il y a encore plus de cartes communautaires à venir.
- Jeu de courte durée. Lorsque les joueurs ont relativement peu de jetons, les décisions peuvent souvent se résumer à un choix entre y aller (i.e. Pariant toutes vos puces en une seule fois) ou pliant. Lorsque le poker peut être simplifié de cette manière, la théorie des jeux fournit des recommandations exactement quand aller et quelles mains pour se plier. Les joueurs de la New School ont mémorisé ces recommandations de manière intensive, ce qui leur donne un avantage significatif sur les concurrents qui ont ignoré les mathématiques et se sont plutôt appuyés sur la «sensation».
- Stratégies mixtes. La théorie des jeux recommande souvent des stratégies mitigées - choisir au hasard quoi faire avec une main donnée dans certaines situations - pour éviter de devenir trop prévisible. Cela était particulièrement important pour les joueurs sur Internet, où les adversaires pouvaient utiliser un logiciel de suivi pour analyser leur jeu et rechercher des faiblesses.
Selon un joueur neuf , «Alors que le poker est devenu plus populaire au cours des 15 dernières années environ, les joueurs se sont considérablement améliorés, au point qu'il est très difficile de battre régulièrement le jeu sans connaissance de la théorie du jeu dans votre coin… les joueurs de la vieille école ont fait leurs millions de jeux d'exploitation , alors que presque tous les joueurs qui font des millions dépendent maintenant de la théorie du jeu de poker."
Alors que la théorie des jeux était principalement la réserve d'une minorité mathématiquement inclinée dans les années 2000, il y a aujourd'hui une forte demande de la part des joueurs de poker occasionnels pour comprendre et déployer la théorie des jeux. En tant que tel, une industrie de la formation au poker axée sur la théorie des jeux a vu le jour. Les livres de poker ont maintenant des titres comme «Jouez au poker optimal: théorie des jeux pratiques pour chaque joueur de poker », Et il existe un certain nombre de cours de formation en ligne et d'applications qui promettent d'enseigner aux joueurs de poker en herbe les secrets de la théorie du jeu.
Peut-être que l'ultime État de la fin du poker viendra lorsque les ordinateurs pourront trouver des stratégies d'équilibre Nash pour l'ensemble du jeu (I.e. Poker «Solve»). L'intelligence artificielle (IA) est exploitée à cette fin. Un logiciel de poker AI, nommé «Pokersnowie» et coûtant 99 $, a été «formé» en jouant contre lui-même des milliards de fois. Un autre, appelé «Libratus», a battu quatre professionnels du poker dans un cerveau de 120 000 mains vs. Le défi de l'IA correspond à plus de 20 jours, en utilisant des algorithmes conçus pour approximer un équilibre Nash. Bien que le poker soit encore trop complexe pour être entièrement «résolu» pour l'instant, les joueurs supposent souvent que le poker AI commence à se rapprocher d'un véritable équilibre Nash du jeu.
Cela ne veut pas dire que la théorie du jeu a toutes les réponses aux joueurs humains. La théorie du jeu de poker fonctionne mieux contre de forts adversaires, car les stratégies d'équilibre de Nash maximisent vos gains uniquement lorsque d'autres concurrents sont «rationnels». Contre les acteurs récréatifs qui font des erreurs systématiques (comme ne pas bluffer suffisamment), l'adoption d'une stratégie de type Nash signifie que vous ne maximisez pas nécessairement vos gains. Cela a déclenché un grand débat dans le monde du poker sur la question de savoir si vous devriez viser à jouer une stratégie basée sur les Nash ou une exploitation (impliquant des écarts systématiques qui peuvent être exploités par les bons joueurs, vous laissant vulnérable, mais qui vous aide à gagner davantage contre les joueurs plus faibles ). En réalité, il n'y a probablement pas beaucoup de conflit ici: les bons joueurs de poker ont besoin des deux stratégies. La théorie des jeux fournit la base de référence à partir de laquelle s'adapter, tout comme la théorie économique traditionnelle avec les consommateurs rationnels agit une référence que l'économie comportementale s'adapte alors pour tenir compte des biais communs que les gens présentent.
Parier sur l'avenir
L'histoire de la théorie des jeux dans le poker nous rappelle les avantages des modèles économiques traditionnels. Même si la théorie des jeux ne peut pas capturer chaque détail d'une main de poker, elle peut toujours fournir des informations pratiques - tout comme les modèles de fusion, par exemple, font pour les régulateurs de compétition. Mais le poker peut également indiquer l'avenir pour les économistes. Alors que la théorie des jeux, avec ses fortes hypothèses sur le fait que les joueurs soient «rationnels», ne fait pas toujours du bon travail pour décrire comment les humains ont joué au poker dans le passé, il fait probablement du bon travail de décrire le poker à enjeux élevés aujourd'hui et un excellent travail de Expliquer comment deux programmes de poker AI jouent les uns contre les autres. Les joueurs de poker AI ont été conçus pour imiter la théorie économique ou, alternativement, semblent s'être appris à fonctionner de manière à satisfaire la théorie économique. Si l'IA satisfait mieux les hypothèses idéalisées des modèles économiques que les humains, et l'IA commence à jouer un rôle plus important dans la prise de décision des consommateurs et des entreprises (E.g. En guidant les choix d'achat des consommateurs et en fixant des prix pour les entreprises), alors peut-être que les modèles économiques de fusions, enchères, de collusion et de discrimination des prix feront un meilleur travail pour décrire les économies dominées par l'IA?
Une certaine prudence est requise ici - le poker peut ne pas être un bon exemple à partir duquel extrapoler et l'IA ne peut pas en fait finir par jouer un rôle plus important dans la prise de décision des consommateurs et des entreprises. Comme l'a expliqué David Parker à Frontier, l'IA est plus susceptible d'être employée dans une situation où il y a une grande quantité de données. Cela permet le développement de:
- Bons modèles prédictifs: En utilisant de grandes quantités de données «avant», l'IA peut développer de bonnes prédictions «après».
- Analyse de classification: Par exemple, en utilisant de nombreuses images de visages, l'IA peut apprendre à identifier un visage dans une nouvelle image (qui est essentiellement une autre version de l'analyse prédictive).
- Jeu de jeu: Dans les jeux avec des règles statiques et bien spécifiées telles que les échecs et GO, l'IA peut jouer à plusieurs reprises contre elle-même pour développer une compréhension des stratégies optimales.
L'utilisation de l'IA dans le poker se trouve beaucoup dans la troisième catégorie. Mais une grande partie de la prise de décision «réelle» est plus désordonnée et plus dynamique que le poker. Les prédictions de l'IA seront inexactes lorsque des données limitées sont disponibles ou lorsque le changement «Règles du jeu» (les nouvelles entreprises entrent sur un marché, les clients changent, etc.).
Compte tenu de l'incertitude sur le rôle futur de l'IA, nous devrons attendre et voir si la révolution de la théorie des jeux dans le poker est un signe de choses à venir dans l'économie réelle… ou si les économistes ne font que bluffer.
Partenaires de casino associés