Hôm nay, chúng ta sẽ phân tích 1 trò chơi nhỏ, để minh hoạ cho GTO (lý thuyết trò chơi tối ưu). Cách chơi GTO là cách chơi phổ biến nhất hiện nay đối với những người đánh poker trình độ cao nhất trên thế giới. Có những bạn nghĩ rằng, đánh theo toán dễ dẫn đến cứng nhắc, rập khuôn, dễ bị bắt bài, dễ bị đọc bài, nhưng đó là cách hiểu chưa đúng về áp dụng toán học trong Poker. Như vô địch thế giới năm 2000 Chris Ferguson đã nói “nếu bạn nghĩ toán không quan trọng trong poker, đó là vì bạn chưa biết dùng loại toán đúng”.

Chú ý: Bài hôm nay cực kỳ khó và nặng về toán, nên những bạn nào mới chơi poker có thể bỏ qua. Bài viết chủ yếu nhắm đến lứa người chơi đã rất giàu kinh nghiệm, muốn trải nghiệm 1 chút để có cái nhìn sơ lược về lối chơi hiện đại nhất thời nay.

Luật trò chơi AKQ

  • 2 người chơi, An ngồi trước, Bình ngồi sau
  • Pot đang có $100
  • Mỗi người được chia 1 lá trong bộ bài 3 lá: A, K, Q
  • An đánh trước, và chỉ có thể check
  • Bình đánh sau, và có thể check (showdown) hoặc bet $50
  • Sau khi Bình bet, An có thể fold, hoặc call $50 (2 bên showdown)
  • Tại showdown, ai cầm lá bài lớn hơn sẽ thắng
Hỏi chiến thuật tối ưu của mỗi người là như thế nào? Trước khi đọc phần lời giải, các bạn hãy thử dành thời gian tự mình suy nghĩ xem có tìm ra đáp án không nhé .
Mọi người có thể thấy, trò AKQ này là 1 trò đơn giản hoá của mỗi ván poker. Thay vì có nhiều vòng flop turn river, ta chỉ chơi 1 vòng. Trong poker người ngồi trước có thể nhảy ra đánh trước (donk bet), nhưng thực tế cũng ít người dùng chiêu này, nên ta có thể đơn giản hoá như ở đây: An luôn check. Giải trò chơi này xong sẽ giúp bạn hiểu sâu hơn rất nhiều về 1 tình huống thường xuyên gặp trong Poker.

Chiến thuật của Bình (ngồi sau)

  • Luôn luôn value bet với A (bài nut)
  • Luôn luôn check back với K (bài có show down value, chẳng bet làm gì vì khi bet thì nếu An cầm A chắc chắn sẽ call, cầm Q chắc chắn sẽ fold. Bet này là bet dở, không bluff được hand nào mạnh hơn mình và cũng không value được hand nào yếu hơn mình, nhưng loại bet kiểu này vẫn thường gặp ở những người đánh poker thiếu kinh nghiệm).
  • Thỉnh thoảng bluff với Q

Nếu Bình hầu như luôn bet với Q, An có thể phản lại dễ dàng bằng cách luôn call với A (bài value) và K (bluff catcher). Đây là trường hợp hay thấy ở những người bluff quá nhiều.

Nếu Bình hầu như không bao giờ bet với Q, An có thể phản lại dễ dàng bằng cách luôn fold K khi Bình bet. Đây là trường hợp hay thấy ở những người đánh quá cẩn thận, quá chắc, ra đường là bài khủng nên khó ăn được value.

Nhiệm vụ của chúng ta là tìm ra tỷ lệ chuẩn, tần suất chuẩn bluff với Q. Khi Bình bet $50 vào pot $100, An có pot odds call 1 ăn 3. Đây cũng là tỉ lệ value : bluff cần thiết Bình phải bet, nghĩa là cứ 3 lần bet với A lại 1 lần bet với Q. Lúc này, Bình đạt đến ngưỡng cân bằng (balance), khiến An dù có dùng chiến thuật nào cũng thua. Vì tỷ lệ cầm A và cầm Q như nhau, ta có thể kết luận chiến thuật cuối cùng của Bình là:

  • Luôn bet A
  • Luôn check K
  • Bluff 1/3 trường hợp cầm Q

Chiến thuật của An (ngồi trước)

Khi Bình bluff với Q, Bình liều $50 để ăn $100, liều 1 ăn 2. Đây cũng là tỷ lệ An phải phòng ngự để tránh cho Bình có thể bluff ăn quá dễ dàng, nghĩa là cứ 30 lần Bình bet với Q thì An phải call ít nhất 20 lần, trong đó 15 lần là cầm A, 5 lần cầm K (khi Bình cầm Q thì An có xác suất cầm A hoặc K là 50%). Tóm lại, chiến thuật của An là:
  • Luôn call với A
  • Luôn fold Q (air)
  • Call K (bluff catcher) với tỉ lệ 1/3

Kết luận

Hãy thử thay đổi, áp dụng các chiến thuật khác nhau với An và Bình, và tính thử EV của mỗi chiến thuật. Bạn sẽ thấy, chiến thuật mô tả ở đây là tối ưu nhất với cả 2. Mỗi người chơi càng lệch ra khỏi cân bằng này, càng thua nhiều tiền khi đấu với chiến thuật cân bằng.
Ta cũng có thể thấy, chiến thuật cân bằng không phải là chiến thuật tối ưu nếu đấu với người chơi kém. Ví dụ nếu Bình luôn bluff với Q (aggro fish), An cần call K 100%. Nếu Bình không bao giờ bluff (người chơi passive), An cần fold K 100%. Nếu An luôn call K (calling station), Bình không bao giờ được bluff. Nếu An luôn fold K (nit), Bình phải bluff Q 100%.

Vì thế, chuẩn nhất là khi vào 1 trận đấu với 1 người chơi mới, An và Bình cần đánh theo tần suất bluff và tần suất phòng ngự cân bằng, rồi quan sát, theo dõi đối thủ. Một khi đã chắc chắn nhận ra điểm yếu của đối phương (bluff quá nhiều, call quá nhiều, đánh quá tight, vv…) mới nên rời ra khỏi cân bằng và chuyển sang exploit đối thủ. Còn chưa biết gì về đối thủ mà đã nhảy ra khỏi cân bằng tìm cách exploit, rất dễ phản tác dụng.

Bài tập về nhà: tính thử EV của An và EV của Bình khi áp dụng chiến thuật này. Tại sao lại có sự khác biệt?

Nguồn tham khảo: Mathematics of Poker của Bill Chen.

Hãy Để Lại Bình Luận Của Bạn
Chia sẻ
Bài trướcKhái Niệm Về Balance (Phần 1)
Bài tiếp theoKhái Niệm Về Balance (Phần 2)
HLV Jul Trần đóng góp những bài viết chiến thuật nâng cao cho các bạn từ góc nhìn của một người chơi chuyên nghiệp, từng nhiều lần vô địch các giải poker trong nước và quốc tế.