Hướng dẫn chơi trò chơi board game: Cách kiểm tra số dư như một người chuyên nghiệp

Sau 25 năm phát triển Neutronium: Parallel Wars và thực hiện hơn 12 phiên thử nghiệm được ghi chép lại, tôi có thể cho bạn biết sự khác biệt giữa thử nghiệm chơi thử và thử nghiệm chơi chuyên nghiệp. Yêu cầu bạn bè chơi trò chơi của bạn không phải là chơi thử. Đó là giao lưu với trò chơi của bạn trên bàn. Thử nghiệm trò chơi chuyên nghiệp là xác thực sự cân bằng có hệ thống — các số liệu được xác định, thử nghiệm một biến, thu thập dữ liệu có cấu trúc và kỷ luật để coi mỗi phiên là một thử nghiệm thay vì một trải nghiệm.

Hướng dẫn này bao gồm những gì diễn ra trong thực tế: cách thiết lập một phiên, những gì cần đo lường, cách xác định các loại vấn đề về cân bằng cụ thể và — quan trọng — khi nào nên dừng thử nghiệm và giao hàng. Các nguyên tắc áp dụng cho bất kỳ trò chơi phức tạp nào. Các ví dụ đến từ 47 cơ chế và 13 tầng vũ trụ của Neutronium: Parallel Wars, cung cấp đủ độ phức tạp để kiểm tra sức chịu đựng mọi phương pháp được mô tả ở đây.

Tại sao hầu hết các lần chơi thử đều thất bại

Sai lầm phổ biến nhất khi chơi thử: hỏi "chơi có vui không?" vào cuối một phiên. "Niềm vui" quá rộng để có thể thực hiện được. Vui vẻ không thể cho bạn biết thợ máy nào đã phá vỡ sự cân bằng. Fun không thể cho bạn biết mức độ tương tác trong phiên giảm xuống vào thời điểm nào. Vui vẻ là một kết luận, không phải là một chẩn đoán.

Thay vào đó, hãy đo lường các số liệu cụ thể: tỷ lệ thắng mỗi phe, chuyển sang xung đột đầu tiên, chênh lệch thu nhập ở giữa trận đấu, thời lượng phiên mỗi giai đoạn. Những con số này cho bạn biết nơi để tìm. "Vui vẻ" không cho bạn biết điều gì mà bạn chưa nghi ngờ.

Nghiên cứu điển hình

Quả cầu tuyết cảng hạt nhân — Vũ trụ 7

Các cổng hạt nhân ở Neutronium: Parallel Wars tạo ra thu nhập theo cấp số nhân: 1 cổng mang lại 2 Nn mỗi vòng, 10 cổng mang lại 220 Nn mỗi vòng. Trong những phiên đầu tiên, những người chơi thử mô tả nền kinh tế đang "cảm thấy mất cân bằng". Không hữu ích. Cách khắc phục yêu cầu đo lường: chênh lệch Nn thực tế giữa vị trí dẫn đầu và vị trí cuối cùng ở cuối Vũ trụ 6 là bao nhiêu?

MEQA theo dõi cho thấy tỷ lệ thu nhập giữa người dẫn đầu và người cuối cùng là 14:1 trong phiên 7 — người dẫn đầu đã tích lũy được 6 cổng, người chơi xếp sau có 0. Đó không phải là "cảm giác mất cân bằng". Đó là con số được xác định vượt quá ngưỡng Kiểm soát chất lượng 5:1 và gây ra thay đổi thiết kế bắt buộc. Nếu không có phép đo đó, việc khắc phục sẽ chỉ là phỏng đoán. Với nó, mục tiêu đã được khắc phục: làm cho các cổng có thể bị phá hủy trong khi chiến đấu. Công thức thu nhập không thay đổi. Vấn đề đã được giải quyết.

Thất bại cốt lõi của việc thử nghiệm không có cấu trúc: nếu không có số liệu xác định, bạn không thể phân biệt vấn đề thiết kế với việc điều chỉnh trình phát. Những người chơi có kinh nghiệm thích nghi với cơ chế bị hỏng - họ xây dựng chiến lược xung quanh sự hỏng hóc, ngừng phàn nàn về nó và khiến nó trông giống như "cách trò chơi được chơi". Phép đo cho thấy hành vi đó che giấu điều gì.

Tổng quan về khung MEQA

Đối với Neutronium: Parallel Wars, phương pháp thử nghiệm hệ thống là MEQA Framework — một cấu trúc bốn trụ cột được phát triển trong suốt 25 năm lặp lại. Mỗi trụ cột giải quyết một loại nhu cầu thử nghiệm khác nhau:

M

Khả năng đo lường

Mỗi phiên đều có số liệu xác định được theo dõi trước khi phiên bắt đầu. Tỷ lệ thu nhập, tỷ lệ thắng, số lượng lãnh thổ, thời lượng phiên mỗi giai đoạn. Nếu bạn không thể xác định một số cho nó thì bạn không thể kiểm tra nó.

E

Sự tương tác

Tốc độ được theo dõi theo cấp độ vũ trụ. Thời gian mỗi giai đoạn tiết lộ nơi người chơi thảnh thơi trước khi có phản hồi sau trận đấu. Sự mất tập trung ở những người chơi trẻ tuổi là những thất bại về tương tác có thể đo lường được.

Hỏi

Kiểm soát chất lượng

Đã xác định ngưỡng đạt/không đạt cho mọi chỉ số, được đặt trước khi thu thập bất kỳ dữ liệu nào. Việc vượt qua một ngưỡng sẽ gây ra sự thay đổi trong thiết kế - loại bỏ tính chủ quan khỏi câu hỏi "khi nào một thứ gì đó bị hỏng đủ để sửa chữa?" câu hỏi.

A

Khả năng thích ứng

Các số liệu được theo dõi trên các nhóm người chơi khác nhau: độ tuổi, cấp độ kinh nghiệm, số lượng người chơi. Một máy cân bằng dành cho người lớn có kinh nghiệm có thể thất bại thảm hại với các nhóm tuổi khác nhau.

Phương pháp khung MEQA đầy đủ — bao gồm các số liệu cụ thể được sử dụng cho Neutronium: Parallel Wars và hệ thống ngưỡng QC — được ghi lại chi tiết tại MEQA Khung: Phương pháp đã được chứng minh để kiểm tra sự cân bằng của trò chơi trên bàn cờ. Hướng dẫn này tập trung vào ứng dụng thực tế ở cấp độ phiên học.

Thiết lập phiên chơi thử

Các buổi chơi thử chuyên nghiệp có ba giai đoạn: thiết lập trước phiên, quan sát trong phiên và tóm tắt theo cấu trúc sau phiên. Mỗi giai đoạn đều có những yêu cầu cụ thể mà hầu hết các cuộc chơi thử không chính thức đều bỏ qua hoàn toàn.

Trước phiên: Xác định chính xác một thay đổi về cơ chế mà bạn đang thử nghiệm. Viết nó ra trước khi người chơi đến. Nếu bạn không thể tuyên bố "hôm nay chúng tôi đang kiểm tra xem liệu việc phá hủy các Cảng hạt nhân có làm giảm tỷ lệ thu nhập giữa người đứng đầu và người cuối cùng xuống dưới 5: 1" hay không - thì bạn chưa sẵn sàng tham gia một phiên. Giả thuyết phải cụ thể và có thể kiểm chứng được. Ghi lại các chỉ số cơ bản từ phiên trước để so sánh trực tiếp.

Trong phiên: Chỉ định một người quan sát KHÔNG chơi. Công việc của người quan sát là ghi lại: độ dài phiên trong mỗi giai đoạn, thời gian quyết định mỗi lượt (trung bình), bất kỳ khoảnh khắc bối rối hoặc thảnh thơi nào, trạng thái thắng/thua của mỗi phe trong mỗi vũ trụ. Người quan sát không tham gia chơi, không giải thích các quy tắc và không trả lời các câu hỏi - nếu người chơi có câu hỏi thì đó là dữ liệu. Ghi lại điều khiến họ bối rối và tại sao.

Phỏng vấn sau buổi học: tối đa 15 phút. Chỉ những câu hỏi có cấu trúc - những truy vấn hành vi cụ thể, không phải "bạn có thích nó không?" Xem phần Câu hỏi thường gặp để biết chính xác các câu hỏi cần sử dụng. Thu thập câu trả lời bằng văn bản khi có thể — câu trả lời bằng lời nói làm mất chi tiết và gây ra thành kiến xã hội (người chơi không muốn nói trực tiếp những điều tiêu cực với nhà thiết kế).

Dữ liệu để thu thập mọi phiên không có ngoại lệ:

Xác định vấn đề về số dư

Các vấn đề về cân bằng được chia thành năm loại, mỗi loại có một tín hiệu riêng biệt trong dữ liệu:

Thủ lĩnh chạy trốn: Signal — người chơi dẫn đầu chưa bao giờ thua sau Vũ trụ 5 trong 3 trên 4 phiên. Ngưỡng: nếu người dẫn đầu giành chiến thắng từ vị trí mà họ nắm giữ ở Vũ trụ 4 trong hơn 70% số phiên thì trò chơi sẽ kết thúc ở Vũ trụ 4. Điều tra cơ chế thu nhập và lãnh thổ trong Vũ trụ 1–4.

Tê liệt phân tích: Tín hiệu — thời gian quyết định trung bình mỗi lượt tăng lên khi vũ trụ tiến triển nhanh hơn độ phức tạp của quyết định đảm bảo. Vòng quay trung bình 5 phút ở Vũ trụ 3 trở thành vòng quay trung bình 20 phút ở Vũ trụ 6 với chỉ 2 cơ chế mới được thêm vào cho thấy vấn đề tương tác cơ học, không phải vấn đề phức tạp. Điều tra xem những quyết định cụ thể nào đang mất nhiều thời gian nhất.

Sự thống trị của phe phái: Tín hiệu — một phe duy nhất giành được 60% số phiên trở lên trong 5 bài kiểm tra trở lên. Tỷ lệ thắng dự kiến ​​trong game cân bằng 4 phe là khoảng 25%. Ở mức 60%, phe này không chỉ tốt hơn - nó còn có lợi thế về cấu trúc mà các phe khác không thể vượt qua nếu chơi tốt hơn. Điều tra cơ chế độc đáo của phe thống trị để tìm ra những hiệu ứng tương tác không lường trước được.

Giảm mức độ tương tác: Tín hiệu — người chơi trở nên thụ động hoặc không tương tác rõ ràng ở một vũ trụ cụ thể. Hành vi có thể quan sát được: người chơi kiểm tra điện thoại, rời mắt khỏi bảng, hỏi "khi nào đến lượt tôi?" Đây là những sự kiện có thể đo lường được. Ghi lại thời điểm chúng xảy ra và vũ trụ nào đang diễn ra.

Nghiên cứu điển hình — Sự thống trị của phe phái

Iit Mất cân bằng kinh tế ở vũ trụ 6+

Iit, phe kinh tế, đã thắng 7/10 phiên ở Vũ trụ 6 trở lên do tích lũy thu nhập Cảng Hạt nhân. Dữ liệu rất rõ ràng: tỷ lệ thắng 70%, gấp 4 lần so với mức cơ bản 25% dự kiến. Ba bản sửa lỗi đã được thử nghiệm, mỗi bản một phiên, tuân theo quy tắc một biến.

Thử nghiệm 1: Giảm giá trị thu nhập của Cảng hạt nhân. Kết quả - Tỷ lệ thắng của nó giảm xuống còn 28%, trong phạm vi chấp nhận được. Vấn đề: Người chơi cho biết phe này cảm thấy "trống rỗng" với giá trị cổng bị giảm. Bản sắc nền kinh tế đã bị phá hủy. Khôi phục.

Thử nghiệm 2: Giới hạn số lượng Cổng hạt nhân cho mỗi người chơi. Kết quả - Tỷ lệ thắng là 35%, gần cân bằng hơn. Vấn đề: trò chơi vào cuối trò chơi mất đi động lực leo thang kinh tế. Các phe phái khác đưa ra những quyết định kém thú vị hơn khi nó không thể mở rộng quy mô. Khôi phục.

Thử nghiệm 3: Làm cho các Cảng hạt nhân có thể bị phá hủy trong khi chiến đấu. Kết quả - Tỷ lệ thắng là 31%, trong phạm vi chấp nhận được. Không có tác động tiêu cực đến các phe phái khác. Công thức thu nhập của cảng không thay đổi - bản sắc kinh tế được bảo tồn. Đã xác nhận sửa lỗi.

Quy tắc một biến

Quy tắc một biến là nguyên tắc quan trọng nhất trong kiểm tra cân và là nguyên tắc thường bị vi phạm nhất. Quy tắc: thay đổi chính xác một thứ giữa các phiên.

Lý do là chẩn đoán rõ ràng. Nếu bạn thay đổi ba cơ chế và trò chơi được cải thiện, bạn sẽ không biết thay đổi nào là nguyên nhân. Bạn có thể đã khắc phục được một vấn đề và tạo ra hai vấn đề khác chưa xuất hiện. Bạn có thể đã khắc phục được một triệu chứng và giữ nguyên nguyên nhân gốc rễ. Bạn không thể biết - bởi vì bạn đã thay đổi ba thứ cùng một lúc.

Áp dụng cho Neutronium: Parallel Wars: khi Vũ trụ 7 cảm thấy "quá nhanh" — các phiên chạy ngắn hơn dự kiến và người chơi cảm thấy vội vàng — ba nguyên nhân có thể đã được điều tra trong các phiên riêng biệt:

Nếu không kiểm tra từng thay đổi riêng biệt, thông tin chi tiết của phiên C — vấn đề phân cụm cơ học — sẽ không thể nhìn thấy được. Sự thay đổi kết hợp của B+C có thể trông giống như "việc bổ sung cơ chế đã giúp ích" trong khi bản sửa lỗi thực tế là sắp xếp lại những gì đã có.

Lỗi thường gặp: Chạy một phiên mà bạn đã thay đổi "chỉ hai điều nhỏ". Không có những thay đổi nhỏ trong một trò chơi có cơ chế phụ thuộc lẫn nhau. Mọi thay đổi đều có khả năng là một biến số. Cam kết một lần mỗi phiên.

Thử nghiệm với các nhóm trải nghiệm hỗn hợp

Thử thách cân bằng khó khăn nhất trong thiết kế trò chơi board game không phải là cân bằng phe phái hay tăng thu nhập — mà là đảm bảo những người chơi có kinh nghiệm không thống trị người chơi mới một cách tầm thường trong cùng một phiên chơi. Hầu hết các nhà thiết kế trò chơi hoàn toàn bỏ qua điều này và đánh mất gia đình cũng như khán giả bình thường của họ.

Đối với Neutronium: Parallel Wars, trụ cột MEQA Khả năng thích ứng đã theo dõi tỷ lệ thắng trong các phiên trải nghiệm hỗn hợp một cách rõ ràng. Trước khi giải quyết vấn đề, những người chơi có kinh nghiệm đã giành chiến thắng 78% trong các phiên đấu nhóm hỗn hợp — một sự mất cân bằng nghiêm trọng có thể ngăn cản những người chơi mới quay lại phiên 2.

Giải pháp là Hệ thống điểm chấp của Nhật ký tiến bộ: những người chơi có kinh nghiệm trước đây đã giành chiến thắng trong vũ trụ bắt đầu với số dư Nn âm tỷ lệ thuận với lợi thế về kinh nghiệm của họ. Hiệu chỉnh đến từ dữ liệu phiên MEQA:

<đầu> Số phiên đã chơi (người chơi có kinh nghiệm) Cược chấp bắt đầu Tỷ lệ thắng sau kèo chấp (người chơi exp) 1–3 phiên−5 Nn54% 4–7 phiên−10 Nn52% Hơn 8 phiên−15 Nn51%

Mục tiêu cho tỷ lệ thắng giữa người có kinh nghiệm và người mới là 55–65%. Dưới 55% có nghĩa là không có biểu hiện kỹ năng có ý nghĩa - những người chơi có kinh nghiệm không có lợi thế gì từ kiến ​​thức của họ. Trên 65% có nghĩa là trải nghiệm của người chơi mới bị phá vỡ một cách hiệu quả — họ không thể cạnh tranh bất kể quyết định được đưa ra là gì.

Xác định khoảng trống kinh nghiệm trong dữ liệu: theo dõi số phiên của từng người chơi cùng với dữ liệu thắng/thua. Nếu một người chơi tham gia 10 phiên chiến thắng 75% số trận đấu với những người chơi có 2 phiên, thì việc hiệu chỉnh điểm chấp cần được điều chỉnh — hoặc bản thân cơ chế đang tạo ra những lợi thế không thể đảo ngược và kết hợp quá nhanh.

"Vách đá 12 phiên" trong Neutronium: sau khi người chơi chủ trì tích lũy hơn 12 phiên, trò chơi sẽ không thể truy cập được đối với những người chơi mới tham gia lần đầu tiên. Khoảng cách kiến ​​​​thức cơ học quá lớn để có thể thu hẹp bằng cách chơi thông thường. Khắc phục: hệ thống Nhật ký tiến độ, giúp hiển thị sự khác biệt về trải nghiệm và áp dụng hiệu chỉnh theo tỷ lệ. Nếu không có dữ liệu hiển thị cụ thể vách đá 12 phiên, vấn đề này sẽ xuất hiện dưới dạng "người chơi mới sẽ không quay lại" thay vì "người chơi mới ở phiên 1 với chủ nhà 12 phiên có tỷ lệ thắng 23%."

Khi nào nên ngừng chơi thử

Một trong những sai lầm phổ biến nhất trong quá trình phát triển trò chơi board game là chơi thử vô thời hạn — lấy lý do "chúng tôi vẫn đang thử nghiệm" làm lý do để tránh vận chuyển. Đây là một phản ứng sợ hãi được ngụy trang bằng sự nghiêm khắc. Tại một thời điểm nào đó, dữ liệu sẽ cho bạn biết bạn đã hoàn tất.

Thử nghiệm lợi nhuận giảm dần: nếu ba phiên chơi thử liên tiếp không tạo ra điểm dữ liệu có thể hành động — không có số liệu nào vượt qua ngưỡng QC, không có sự kiện nhầm lẫn mới nào được ghi lại, không xác định được mức giảm tương tác — bạn đã đạt đến độ bão hòa thử nghiệm chơi cho trạng thái hiện tại của trò chơi. Các phiên bổ sung đang tạo ra sự xác nhận chứ không phải sự khám phá.

Tiêu chí sẵn sàng của tàu

Neutronium: Parallel Wars là:

  1. Tỷ lệ thắng của cả 4 phe đều nằm trong khoảng 10% ngang nhau (mục tiêu: mỗi phe 25%, phạm vi chấp nhận được: 22–28% mỗi phe)
  2. Điểm tương tác luôn ở mức trên 4/5 trong tất cả các phiên học ở Đại học 1–6
  3. Không có sự kiện nhầm lẫn nào được ghi nhận trong 3 phiên liên tiếp tại Đại học 1–3 (trò chơi cốt lõi)
  4. Tỷ lệ thắng của trải nghiệm hỗn hợp (có kinh nghiệm so với mới) trong phạm vi 55–65% trong 3 phiên liên tiếp

Khi đáp ứng tất cả bốn tiêu chí trong ba phiên liên tiếp, trò chơi sẽ ở trạng thái sẵn sàng. Không hoàn hảo - "hoàn hảo" không phải là trạng thái có ý nghĩa đối với trò chơi. Tình trạng giao hàng có nghĩa là dữ liệu không còn xác định những cải tiến có thể thay đổi trải nghiệm của người chơi theo cách có thể đo lường được.

Câu hỏi thường gặp

Bạn cần bao nhiêu phiên chơi thử trước khi xuất bản một trò chơi board game?
Tối thiểu 10–15 phiên với các nhóm khác nhau cho một trò chơi có độ phức tạp thấp. Đối với các trò chơi phức tạp có nhiều phe phái và cơ chế sâu sắc, 30–50+ phiên sẽ thực tế hơn. Neutronium: Parallel Wars đã có hơn 12 phiên xác thực số dư được ghi lại — tách biệt khỏi 25 năm phát triển thông thường. Con số không quan trọng bằng chất lượng: 12 phiên có cấu trúc với số liệu xác định sẽ tạo ra nhiều dữ liệu hữu ích hơn 100 phiên không có cấu trúc mà bạn hỏi "có vui không?"
Nhà thiết kế có nên chơi thử nghiệm không?
Không, để kiểm tra số dư cạnh tranh. Sự hiện diện của người thiết kế thay đổi hành vi của người chơi theo hai cách: người chơi đặt câu hỏi cho người thiết kế các quy tắc thay vì ghi lại sự kiện nhầm lẫn và người chơi kiểm duyệt phản hồi của họ để tránh có vẻ quan trọng. Chạy các phiên chỉ dành cho người quan sát để kiểm tra độ cân bằng — nhà thiết kế theo dõi, ghi lại dữ liệu và không tham gia. Nhà thiết kế có thể chơi trong các phiên phản hồi thông thường, nhưng những phiên đó không phải là nguồn dữ liệu cân bằng chính.
Làm cách nào để viết câu hỏi thử nghiệm hay?
Tránh "bạn có thích điều này không?" - quá mơ hồ và xã hội thiên về những câu trả lời tích cực. Sử dụng các câu hỏi hành vi cụ thể: "Tại thời điểm nào bạn cảm thấy chiến lược của mình không còn khả thi nữa?" tiết lộ khi cơ chế bắt kịp không thành công. "Khi nào bạn quyết định chuyển từ mở rộng sang phòng thủ?" cho thấy động lực nhịp độ và áp lực. "Quyết định nào cảm thấy không rõ ràng nhất về hậu quả của nó?" xác định các cơ chế thiếu phản hồi rõ ràng. Các câu hỏi về hành vi tiết lộ các vấn đề về cơ học; câu hỏi ưu tiên tiết lộ vấn đề chủ đề. Chúng là những danh mục riêng biệt và cần có những câu hỏi riêng biệt.
Các nhà thiết kế trò chơi chuyên nghiệp sử dụng công cụ gì để thử nghiệm trò chơi?
Trình mô phỏng trên máy tính bảng để quản lý phiên bản và phiên từ xa — nó cho phép bạn quay lại các phiên bản trước của trò chơi mà không mất thời gian tạo nguyên mẫu vật lý. Google Trang tính để theo dõi dữ liệu phiên — tạo mẫu trước phiên 1 và điền vào các cột giống nhau trong mỗi phiên. Nguyên mẫu giấy (không bao giờ là mô hình kỹ thuật số) để thử nghiệm vật lý sớm — mã thông báo vật lý tiết lộ các vấn đề về công thái học mà mô hình kỹ thuật số ẩn giấu, bao gồm tốc độ xử lý thành phần, khả năng hiển thị trong điều kiện chơi và cảm giác về chi phí quyết định khi bạn thực hiện sử dụng mã thông báo. Bản ghi âm các cuộc thảo luận sau phiên đấu để xem lại sau — người chơi thường nói những điều quan trọng một cách tự nhiên mà người ghi chú sẽ bỏ lỡ vào lúc đó.

Đọc toàn bộ khung MEQA

Phương pháp MEQA hoàn chỉnh — bao gồm ngưỡng QC, định nghĩa chỉ số và nghiên cứu điển hình đầy đủ về Cổng hạt nhân — được ghi lại trong bài viết khung MEQA.

Đọc MEQA Khung →