1.빅투의 개요
1.빅투(Big Two)란?
빅투란 플레잉 카드를 사용해서 진행하는 게임으로써, 간단히 설명하자면 각 플레이어가 자신의 손패를 가장 먼저 전부 털어 놓으면 이기는 게임이다.
1.게임 진행
- 플레이어가 해당 라운드의 첫 번쨰 플레이어인 경우
족보와 일치하는 카드의 조합을 손패에서 내려놓는다. 해당 게임에서의 최초의 플레이어는 3다이아몬드를 가진 플레이어다. 그 이후는 마지막 카드를 버린 플레이어를 제외하고 연속적으로 모두 패스를 했을 시, 마지막으로 카드를 버린 플레이어가 첫 번째 플레이어로 라운드를 다시 시작한다.
- 플레이어가 해당 라운드의 첫 번째 플레이어가 아닌 경우
플레이어는 카드를 버릴지 아니면, 패스를 할 지 선택을 한다. 플레이어는 다음을 만족하는 카드의 조합만 버릴 수 있다:
- 해당 라운드의 첫 번째 플레이어가 낸 족보의 카드의 수와 동일한 수의 카드를 버려야 된다. 예를 들어서, 첫 번째 플레이어가 두 장의 카드를 버렸다면, 모든 플레이어는 해당 라운드에서 한 번에 두 장의 카드만 버릴 수 있다.
- 플레이어는 이전에 카드를 버린 사람의 조합보다 더 강한 조합의 카드를 버려야 된다.
- 게임 종료 조건
만약 특정 플레이어가 손패를 버린 후 남아있는 손패가 없다면 해당 게임은 종료된다.
2.족보
번거로움을 피하기 위해, 앞으로 해당 프로젝트에서 카드의 조합을 표기할 때는 다음과 같은 방법으로 표기하자. 대문자 알파벳은 슈트를 숫자와 소문자 알파벳은 끗수를 나타낸다. 예를 들어서, D 34 S 5j는 다이아 3, 4 스페이드 5, J를 나타낸다.
(1) 싱글
1장의 카드로 이루어진 조합이다. 예를 들어서, D3은 싱글이다.
(2) 페어
동일한 끗수의 2장의 카드로 이루어진 조합이다. 예를 들어서, D2 S2는 페어다.
(3) 트리플
동일한 끗수의 3장의 카드로 이루어진 조합이다. 예를 들어서, Dj Cj Hj는 트리플이다.
(4) 스트레이트
연속적인 끗수 5장의 카드로 이루어진 조합이다. 예를 들어서, D25 H346은 스트레이트다. </br>또한, 백스트레이트(a23456)를 제외한 모든 스트레이트는 연속한 끗수여야된다. 즉, jqka2는 스트레이트가 아니다.
(5) 플러시
같은 슈트 5장의 카드로 이루어진 조합이다. 예를 들어서, D457910은 플러시이다.
(6) 풀하우스
같은 끗수 3장 그리고 같은 끗수 2장의 카드로 이루어진 조합이다. 예를 들어서, D35 C3 H35는 풀하우스이다.
(7) 포카드
같은 끗수 4장 그리고 아무 카드 1장으로 이루어진 조합이다. 예를 들어서, D3j Cj Hj Sj는 포카드이다.
(8) 스트레이트 플러시
플러시이면서 스트레이트인 카드의 조합이다. 예를 들어서, S 45678은 스트레이트 플러시이다.
3.카드의 조합의 강함
기본적으로 모든 조합의 경우 끗수가 같은 경우는 슈트의 강함으로 어느 조합이 더 강한지 결정된다.</br> 다이아몬드 < 클로버 < 하트 < 스페이드 순으로 강하다. 끗수의 강함은 3 4 5 6 7 8 9 10 j q k a 2 순이다. (오른쪽에 있을 수록 강한 끝수이다.)
- 동일한 족보인 경우
스트레이트 (플러시)
백스트레이트가 가장 강하며, 그 다음으로는 강한 끗수가 많은 스트레이트가 더 강한 스트레이트다.
풀하우스
동일한 끗수 3개의 끗수가 강할수록 강한 풀하우스이다.
포카드
동일한 끗수 4개의 끗수가 강할수록 강한 포카드이다.
그 이외의 족보
해당 조합을 이루는 카드 중에서 가장 강한 끗수로 강함을 비교한다. 만약 가장 강한 끗수가 동일하다면, 가장 강한 끗수의 슈트를 비교한다.
- 다른 족보인 경우
스트레이트, 플러시, 풀하우스, 포카드, 스트레이트 플러시 순으로 강하다.
4.강화학습 시 예상되는 어려움
빅투는 바둑과 체스와 같은 보드게임과 달리 상대의 패를 알 수 없는 불완전정보 게임이다. 플레이어가 관측한 상태가 이전 상태와 동일한 상태라고해도, 특정 행동이 항상 고정된 정책을 가진 플레이어 상대로도 똑같은 결과를 얻을 수 없음을 의미한다. 따라서 이러한 무작위성은 학습의 안정성에 악영향을 끼칠 것이며, 이러한 불안정성을 잘 다루는 것이 관건이 될 것이라고 예상한다. 또한, 족보의 경우의 수가 매우 많기 때문에 에이전트의 액션을 어떻게 구현할지도 한가지 중요한 안건이 될 것이다.
용어 설명
-
라운드(trick) : 첫 번째 플레이어가 카드를 낸 후, 게임이 종료되거나, 한 플레이어를 제외하고 나머지 플레이어들이 연속적으로 패스를 할 때까지를 라운드라고한다. 공식용어는 아니다.
-
슈트(suit) : 스페이드(♠), 하트(♥), 클로버(♣), 다이아몬드(♦)와 같은 플레잉 카드에 있는 문양을 말한다.
-
끗수(number) : 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, j, q, k, a와 같이 플레잉 카드에 있는 숫자와 알파벳을 말한다.
참고 문헌
- Big two, Wikipedia, https://en.wikipedia.org/wiki/Big_two
- 빅투, 나무위키, https://namu.wiki/w/%EB%B9%85%ED%88%AC