Trinn for å bygge En Poker AI-Del 1: Outline Og Historie

Thomas Trenner
1. Apr, 2020 * 2 min lese

Dette er den første i en serie artikler som vil skissere den grunnleggende teorien bak ufullstendige informasjonsspill (Poker er bare ett eksempel) og spillteoretiske og beregningsverktøy for å løse disse spillene eller, enda viktigere for oss, bygge Ai som kan slå de beste menneskelige spillerne.

Merk at mens mye nylig fremgang har blitt gjort i løpet av perfekt informasjon spill Som Chess og Gå ved å bruke Dyp Læring teknikker, disse ikke direkte oversette til ufullkommen informasjon innstillingen. Vi vil gå inn i detaljene for dette litt senere.

Bilde Av [email protected] Parzuchowski På Unsplash

til tross for fravær Av Poker Ai med overmenneskelig ytelse basert På Dyp Læring teknikker, fremgang innen Datamaskinen Poker eller Poker Ai har likevel vært rask de siste årene. Hvert sett med inkrementelle algoritmiske forbedringer tillot AIs å slå mennesker på stadig mer kompliserte Versjoner Av Poker. Det første gjennombruddet som ble mye bemerket kom i 2015 da Cepheus ble utgitt. Dette løste spillet heads-up Limit Texas Hold ‘ em, en populær pokervariant med mer enn 101er (et informasjonssett kan betraktes som en rekke forskjellige spillstater som man ikke kan skille mellom med den tilgjengelige informasjonen samlet sammen). Dette ble etterfulgt Av Libratus som i 2017 avgjørende slo fire av de beste profesjonelle pokerspillerne i heads-up No-Limit Texas Hold ‘ em, som har 101 hryv1 informasjonssett. Til slutt, sommeren 2019, Ble Pluribus utgitt og scoret en avgjørende seier mot menneskelige fagfolk i sekshånds No-Limit Texas Hold ‘ em. Dette er en av de mest spilte pokervarianter der ute, spesielt i cash games. Forbausende klarte De a trene Pluribus ved HJELP AV AWS-ressurser som bare koster noen fa hundre dollar og live-spill ble gjort pa vare maskinvare. Derfor, i det minste i teorien, bør det være mulig å lage en bot som nærmer Seg Pluribus evner hjemme.

men nok med historien for nå. I de neste artiklene i denne serien vil jeg ta opp følgende emner:

  • Modellering ufullkommen informasjon spill
  • Angre matchende
  • Python implementering av angre-matchende
  • Kuhn Poker Og Counterfactual Angre Minimering (CFR)
  • Implementere CFR I Python
  • Utnyttbarhet, Multiplayer CFR OG 3-Spiller Kuhn Poker
  • leduc hold ’em og en mer generisk cfr rutine i python
  • hold’ em regler, og problemer med å bruke cfr for poker
  • …tbd

Følg MEG PÅ TWITTER for å få oppdateringer når nye deler går live.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.