포커 인공 지능 구축 단계-파트 1:개요 및 역사

토마스 트레너
2020 년 4 월 1 일*2 분 읽기

이것은 불완전한 정보 게임의 기본 이론(포커는 단지 하나의 예일뿐입니다)과 이러한 게임을 해결하기위한 게임 이론 및 계산 도구 또는 더 중요한 것은 우리에게 최고의 인간 선수를 이길 수있는 인공 지능을 구축하는 일련의 기사 중 첫 번째 기사입니다.

체스와 바둑과 같은 완벽한 정보 게임의 공간에서 깊은 학습 기술을 적용함으로써 많은 최근의 진전이 이루어졌지만,이것들은 불완전한 정보 설정으로 직접 변환되지는 않습니다. 우리는 이것에 대한 세부 사항에 조금 나중에 갈 것입니다.

딥러닝 기술을 기반으로 한 초인적인 퍼포먼스를 가진 포커 인공지능이 없음에도 불구하고,컴퓨터 포커 또는 포커 인공지능 분야의 진보는 최근 몇 년 동안 급속하게 진행되고 있다. 증분 알고리즘 개선의 각 세트는 인공 지능이 포커의 더욱 복잡한 버전에서 인간을 이길 수 있었다. 널리 알려진 첫 번째 돌파구는 2015 년 세페우스가 석방되었을 때 나왔습니다. 이 헤즈 업 리미트 텍사스 홀덤,101 개 이상의 타우 정보 세트와 인기있는 포커 변형의 게임을 해결(정보 세트는 하나가 함께 풀링 된 정보를 사용할 수 구별 할 수없는 다른 게임 상태의 숫자로 생각 될 수있다). 그 뒤를 이어 2017 년에 1016 정보 세트를 보유한 헤드 업 노 리밋 텍사스 홀덤에서 최고의 프로 포커 플레이어 4 명을 결정적으로 이길 수 있었던 리브라 투스가 뒤 따랐습니다. 마지막으로,2019 년 여름,멀티리버스가 출시되어 6 손 노 리밋 텍사스 홀덤에서 인간 전문가를 상대로 결정적인 승리를 거두었습니다. 이 중 하나입니다 가장 연주 포커 거기 변종,특히 현금 게임. 놀랍게도,그들은 단지 몇 백 달러 비용 및 라이브 플레이는 상용 하드웨어에서 수행되었다. 따라서,적어도 이론적으로,그것은 집에서 복수 버스’기능에 접근하는 로봇을 만들 수 있어야합니다.

하지만 지금은 역사가 충분합니다. 이 시리즈의 다음 기사에서 다음 항목을 다룰 것입니다:

  • 불완전한 정보 게임 모델링
  • 후회 매칭
  • 파이썬 후회 매칭 구현
  • 파이썬 구현

트위터에 나를 따르라 새로운 부품 라이브 갈 때 업데이트를 얻을 수 있습니다.

답글 남기기

이메일 주소는 공개되지 않습니다.