a póker AI felépítésének lépései-1. rész: vázlat és történelem

Thomas Trenner
ápr 1, 2020 * 2 perc olvasás

ez az első olyan cikksorozatban, amely felvázolja a hiányos információs játékok alapelméletét (a póker csak egy példa), valamint a játékelméleti és számítási eszközöket, amelyek megoldják ezeket a játékokat, vagy ami még fontosabb számunkra, olyan mesterséges intelligenciákat építenek, amelyek képesek legyőzni a legjobb emberi játékosokat.

Megjegyzendő, hogy bár az utóbbi időben sok előrelépés történt a tökéletes információs játékok terén, mint a sakk és a Go, a mély tanulási technikák alkalmazásával, ezek nem közvetlenül a tökéletlen információs beállításhoz vezetnek. Egy kicsit később megyünk bele a részletekbe.

fotó: Micha .. Parzuchowski az Unsplash-ről

annak ellenére, hogy a mély tanulási technikákon alapuló emberfeletti teljesítményű póker AI-k hiányoznak, a számítógépes póker vagy a póker AI-k terén az utóbbi években gyors előrelépés történt. Az inkrementális algoritmikus fejlesztések mindegyike lehetővé tette az AI-k számára, hogy legyőzzék az embereket a póker egyre bonyolultabb verzióiban. Az első áttörés, amelyet széles körben megjegyeztek, 2015-ben történt, amikor a Cepheus megjelent. Ez megoldotta a játékot heads-up Limit Texas Hold ‘ em, egy népszerű pókervariáns, több mint 101-gyel kódolt információkészletek (egy információkészlet számos különféle játékállamnak tekinthető, amelyeket nem lehet megkülönböztetni a rendelkezésre álló információk összevonásával). Ezt követte a Libratus, amely 2017-ben határozottan legyőzte a legjobb profi pókerjátékosok négyét a heads-up No-Limit Texas Hold ‘ em-ben, amely 101 I1 információs készletet tartalmaz. Végül 2019 nyarán megjelent a Pluribus, amely döntő győzelmet aratott az emberi szakemberek ellen a Hatkezes No-Limit Texas Hold ‘ emben. Ez az egyik legtöbbet játszott pókerváltozat, különösen a készpénzes játékokban. Meglepő módon sikerült a Pluribust kiképezni az AWS erőforrásainak felhasználásával, amelyek csak néhány száz dollárba kerültek, és az élő játékot árucikk hardveren végezték. Ezért legalább elméletben lehetővé kell tenni, hogy otthon hozzon létre egy botot, amely megközelíti a Pluribus képességeit.

de elég a történelem most. A sorozat következő cikkeiben a következő témákkal foglalkozom:

  • modellezés tökéletlen információs játékok
  • sajnálom matching
  • Python végrehajtása sajnálom matching
  • Kuhn póker és kontrafaktuális sajnálom minimalizálása (CFR)
  • végrehajtása CFR Python
  • kihasználhatóság, Multiplayer CFR és 3-játékos Kuhn póker
  • Leduc Hold ’em és egy általánosabb CFR rutin a Pythonban
  • Hold’ em szabályok, és kérdések a CFR pókerhez
  • …TBD

kövess engem a Twitteren, hogy frissítéseket kapj, ha új részek kerülnek életbe.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.