قبل از انتشار یک بازی رومیزی به چند جلسه پلی تست نیاز دارید؟

حداقل 10-15 جلسه با گروه های مختلف برای یک بازی با پیچیدگی کم. برای بازی های پیچیده با چند جناح و مکانیک عمیق، 30-50+ جلسه. Neutronium: Parallel Wars بیش از 12 جلسه مستند به طور خاص برای اعتبارسنجی تعادل داشته است - جدا از 25 سال بازی معمولی.

آیا طراح باید در پلی تست ها بازی کند؟

نه، برای تست تعادل رقابتی. حضور طراح رفتار بازیکن را تغییر می دهد و داده ها را سوگیری می کند. جلسات صرفاً ناظر را اجرا کنید که در آن طراح بدون مشارکت، تماشا و ضبط میکند.

چگونه سوالات تست بازی خوب بنویسید؟

اجتناب از "از این لذت بردید؟" - خیلی مبهم از سؤالات رفتاری خاص استفاده کنید: "در چه مرحله ای احساس کردید استراتژی شما دیگر قابل اجرا نیست؟" یا "چه زمانی تصمیم گرفتید از توسعه به دفاع تغییر دهید؟" سوالات رفتاری مشکلات مکانیک را آشکار می کند. سوالات ترجیحی مشکلات موضوع را آشکار می کند.

آزمون بازی رومیزی: تعادل را مثل حرفه‌ای‌ها بررسی کنید

Q: طراحان حرفه ای بازی از چه ابزارهایی برای تست بازی استفاده می کنند؟

شبیه ساز Tabletop برای جلسات از راه دور و مدیریت نسخه. برگه های Google برای ردیابی داده های جلسه. نمونههای اولیه کاغذی (هرگز مدلهای دیجیتال) برای آزمایشهای فیزیکی اولیه - توکنهای فیزیکی مشکلات ارگونومیکی را که ماکتهای دیجیتال پنهان میکنند نشان میدهند. ضبط صدای خلاصه برای بررسی.

پس از 25 سال توسعه Neutronium: Parallel Wars و اجرای بیش از 12 جلسه تست پخش مستند، می توانم تفاوت بین playtesting و QZQZXQZX0 playtesting را به شما بگویم. درخواست از دوستان برای بازی کردن بازی شما، تست بازی نیست. این معاشرت با بازی شما روی میز است. تست بازی حرفه ای اعتبار سنجی سیستماتیک تعادل است - معیارهای تعریف شده، آزمایش تک متغیری، جمع آوری داده های ساختاریافته، و نظمی برای تلقی هر جلسه به عنوان یک آزمایش و نه یک تجربه.

این راهنما در عمل به شکل ظاهری آن را پوشش می‌دهد: چگونه یک جلسه را تنظیم کنیم، چه چیزی را اندازه‌گیری کنیم، چگونه دسته‌بندی‌های خاصی از مشکلات تعادل را شناسایی کنیم، و - به طور مهم - چه زمانی آزمایش را متوقف کنیم و ارسال کنیم. این اصول برای هر بازی پیچیده ای اعمال می شود. مثال‌ها از 47 مکانیک Neutronium: Parallel Wars و 13 سطح جهانی آمده‌اند که پیچیدگی کافی برای تست استرس هر روشی را که در اینجا توضیح داده شده است ارائه می‌کند.

چرا اکثر تست های پخش با شکست مواجه می شوند

رایج ترین اشتباه در تست بازی: پرسیدن "آیا جالب بود؟" در پایان یک جلسه "سرگرمی" بیش از حد گسترده است که قابل اجرا نیست. سرگرمی نمی تواند به شما بگوید کدام مکانیک تعادل را شکسته است. سرگرمی نمی تواند به شما بگوید در چه نقطه ای از تعامل جلسه کاهش یافته است. سرگرمی نتیجه گیری است نه تشخیص.

درعوض، معیارهای خاص را اندازه گیری کنید: نرخ برد در هر جناح، تعارض اولی، QZXA0006 متفاوت midgame، طول جلسه در هر فاز. این اعداد به شما می گویند کجا را نگاه کنید. "سرگرمی" چیزی را به شما نمی گوید که قبلاً به آن مشکوک نبودید.

مطالعه موردی

گلوله برفی Nuclear Port — Universe 7

Nuclear Port در Neutronium: Parallel Wars درآمد نمایی ایجاد می کند: 1 پورت 2 Nn در هر دور، 10 پورت 220 Nn در هر دور ایجاد می کند. در جلسات اولیه، بازیکنان آزمایش کننده اقتصاد را به عنوان "احساس عدم تعادل" توصیف کردند. مفید نیست. رفع نیاز به اندازه گیری داشت: تفاوت واقعی Nn بین رهبر و آخرین مکان در انتهای Universe 6 چقدر بود؟
ردیابی
MEQA نسبت درآمد رهبر به آخرین درآمد 14:1 را در جلسه 7 نشان داد - رهبر 6 پورت جمع آوری کرده بود، بازیکنان انتهایی دارای 0 بودند. این "احساس نامتعادل" نیست. این یک عدد تعریف شده است که از آستانه کنترل کیفیت 5:1 فراتر می رود و باعث تغییر طراحی اجباری می شود. بدون آن اندازه گیری، رفع مشکل یک حدس بود. با آن، راه حل مورد هدف قرار گرفت: پورت ها را در طول نبرد قابل تخریب کنید. فرمول درآمد بدون تغییر مشکل حل شد.

شکست اصلی تست پخش بدون ساختار: بدون معیارهای تعریف شده، نمی توانید مشکل طراحی را از انطباق پخش کننده تشخیص دهید. بازیکنان باتجربه خود را با مکانیک‌های شکسته وفق می‌دهند - آنها استراتژی‌هایی را پیرامون شکستگی ایجاد می‌کنند، از شکایت از آن دست نمی‌کشند، و آن را شبیه به «طرز بازی» می‌کنند. اندازه‌گیری نشان می‌دهد که رفتار چه چیزی را پنهان می‌کند.

مروری بر چارچوب MEQA

برای Neutronium: Parallel Wars، روش سیستماتیک تست بازی، چارچوب MEQA است - یک ساختار چهار ستونی که طی 25 سال تکرار توسعه یافته است. هر ستون به دسته متفاوتی از نیازهای آزمایشی پاسخ می‌دهد:

M

قابلیت اندازه گیری

هر جلسه دارای معیارهای عددی است که قبل از شروع جلسه ردیابی می شوند. نسبت درآمد، نرخ برد، تعداد قلمرو، طول جلسه در هر مرحله.اگر نمی توانید عددی برای آن تعریف کنید، نمی توانید آن را آزمایش کنید.

E

Engagement

پیش‌گیری در هر سطح جهان دنبال می‌شود. زمان در هر مرحله نشان می‌دهد که بازیکنان قبل از بازخورد پس از بازی، در چه موقعیتی قرار می‌گیرند. وقفه های توجه در بازیکنان جوان تر، شکست های تعاملی قابل اندازه گیری است.

Q

کنترل کیفیت

آستانه های عبور/شکست تعریف شده برای هر معیار، قبل از جمع آوری داده ها تنظیم شده است. عبور از یک آستانه باعث تغییر طراحی می شود - حذف ذهنیت از "چه زمانی چیزی به اندازه کافی شکسته شده است که تعمیر شود؟" سوال.

A

انطباق پذیری

Metrics در گروه های مختلف بازیکنان ردیابی می شود: محدوده سنی، سطوح تجربه، تعداد بازیکنان. مکانیک متعادل برای بزرگسالان باتجربه ممکن است در گروه‌های سنی مختلط به طرز فاجعه‌باری شکست بخورد.

متدولوژی کامل چارچوب MEQA - شامل معیارهای خاص مورد استفاده برای Neutronium: Parallel Wars و سیستم آستانه QC - با جزئیات در MEQA چارچوب Mehodology برای تست بازی مستند شده است: A تعادل. این راهنما بر روی برنامه کاربردی در سطح جلسه تمرکز دارد.

راه اندازی یک جلسه تست پخش

جلسات تست بازی حرفه ای دارای سه مرحله است: تنظیم قبل از جلسه، مشاهده در طول جلسه، و توضیح ساختار یافته پس از جلسه. هر مرحله نیازمندی‌های خاصی دارد که اکثر آزمایش‌های غیررسمی بازی به طور کامل از آن چشم پوشی می‌کنند.

Pre-sesion: دقیقاً یک تغییر مکانیکی را که در حال آزمایش هستید تعریف کنید. قبل از ورود بازیکنان آن را یادداشت کنید. اگر نمی توانید بگویید "امروز ما در حال آزمایش هستیم که آیا ساخت Nuclear Port های تخریب پذیر نسبت درآمد رهبر به آخرین را به زیر 5:1 کاهش می دهد یا خیر" - شما آماده اجرای یک جلسه نیستید. فرضیه باید مشخص و قابل ابطال باشد. معیارهای پایه را از جلسه قبل برای مقایسه مستقیم ثبت کنید.

در طول جلسه: یک ناظر را تعیین کنید که بازی نمی کند. وظیفه ناظر ثبت این موارد است: طول جلسه در هر فاز، زمان تصمیم گیری در هر نوبت (متوسط)، هر لحظه سردرگمی یا عدم درگیری، حالت برد/باخت به ازای هر جناح در هر جهان. ناظر در بازی شرکت نمی کند، قوانین را توضیح نمی دهد و به سؤالات پاسخ نمی دهد - اگر یک بازیکن سؤالی داشته باشد، آن داده است. آنچه آنها را گیج کرده و چرا آنها را یادداشت کنید.

توضیحات پس از جلسه: حداکثر 15 دقیقه. فقط سؤالات ساختاری - سؤالات رفتاری خاص، نه "آیا از آن لذت بردید؟" برای استفاده از سؤالات دقیق به بخش سؤالات متداول مراجعه کنید.در صورت امکان پاسخ‌های کتبی را جمع‌آوری کنید - پاسخ‌های شفاهی جزئیات را از دست می‌دهند و سوگیری اجتماعی را معرفی می‌کنند (بازیکنان تمایلی به گفتن مستقیم چیزهای منفی به طراح ندارند).

داده برای جمع آوری هر جلسه بدون استثنا:

طول جلسه در هر ردیف جهان

برد/باخت در هر جناح

تعداد چرخش به اولین نبرد

تفاوت درآمد بین بازیکن برتر و بازیکن آخر در midgame

تعداد رویدادهای سردرگمی بازیکن (تعریف شده به این صورت: بازیکن یک سوال قوانین می پرسد یا یک اقدام غیرقانونی انجام می دهد)

تشخیص مشکلات موجودی

مشکلات تعادل به پنج دسته تقسیم می شوند که هر کدام سیگنال مشخصی در داده ها دارند:

رهبر فراری: سیگنال — بازیکن پیشرو هرگز پس از Universe 5 در 3 جلسه از 4 جلسه شکست نخورد. آستانه: اگر رهبر از موقعیتی که در Universe 4 در بیش از 70٪ جلسات داشت برنده شود، بازی به طور موثر در Universe 4 به پایان می رسد. مکانیک درآمد و قلمرو در جهان های 1-4 را بررسی کنید.

فلج تجزیه و تحلیل: سیگنال — میانگین زمان تصمیم گیری در هر نوبت با افزایش سریعتر جهان ها نسبت به پیچیدگی تصمیم گیری افزایش می یابد. یک چرخش متوسط 5 دقیقه ای در جهان 3 تبدیل شدن به یک چرخش متوسط 20 دقیقه ای در جهان 6 با تنها 2 مکانیک جدید اضافه شده نشان دهنده یک مشکل تعامل مکانیکی است، نه یک مشکل پیچیدگی. بررسی کنید که کدام تصمیمات خاص بیشترین زمان را می گیرند.

تسلط جناح: سیگنال - یک جناح منفرد برنده 60٪ یا بیشتر از جلسات در 5 یا بیشتر آزمایش است. نرخ برد مورد انتظار در یک بازی متعادل 4 جناحی تقریباً 25٪ است. در 60%، جناح نه تنها بهتر است - بلکه یک مزیت ساختاری دارد که سایر جناح ها نمی توانند با بازی بهتر بر آن غلبه کنند. مکانیک منحصر به فرد جناح غالب را برای اثرات متقابل پیش بینی نشده بررسی کنید.

افت تعامل: سیگنال - بازیکنان در یک جهان خاص منفعل می شوند یا به طور آشکاری درگیر می شوند. رفتار قابل مشاهده: بازیکنان تلفن ها را چک می کنند، نگاهشان را از تخته دور می کنند، می پرسند "نوبت من کی است؟" اینها رویدادهای قابل اندازه گیری هستند. زمان وقوع آنها و جهان در حال پیشرفت را ثبت کنید.

مطالعه موردی — تسلط جناحی

Iit عدم تعادل اقتصادی در Universe 6+

Iit، جناح اقتصادی، به دلیل انباشت درآمد Nuclear Port، 7 جلسه از 10 جلسه را در Universe 6 و بالاتر برد. داده ها واضح بود: نرخ برد 70 درصد، 4× بالاتر از 25 درصد پایه مورد انتظار. سه اصلاح، یکی در هر جلسه، با پیروی از قانون تک متغیری آزمایش شد.

Test 1: ارزش درآمدی Nuclear Port را کاهش دهید. نتیجه - نرخ برد Iit به 28٪ کاهش یافت، در محدوده قابل قبول. مشکل: پخش‌کننده‌های Iit گزارش کردند که جناح احساس می‌کند "توخالی" با مقدار پورت کاهش یافته است. هویت اقتصادی از بین رفت. برگشت.

Test 2: محدودیت تعداد Nuclear Port برای هر بازیکن. نتیجه - نرخ برد Iit 35٪، نزدیک به متعادل. مشکل: بازی در اواخر بازی پویایی تشدید اقتصادی خود را از دست داد. وقتی Iit نمی توانست مقیاس پذیر باشد، گروه های دیگر تصمیمات کمتر جالبی را گزارش کردند. بازگشت.

Test 3: Nuclear Port را در طول نبرد قابل تخریب کنید. نتیجه - نرخ برد Iit 31٪، در محدوده قابل قبول. هیچ تاثیر منفی بر سایر جناح ها ندارد. فرمول درآمد بندر بدون تغییر - هویت اقتصادی حفظ می شود.رفع تایید شد.

قانون تک متغیره

قانون تک متغیری مهمترین اصل در تست تعادل و بیشترین نقض شده است. قانون: دقیقاً یک چیز را بین جلسات تغییر دهید.

دلیل آن وضوح تشخیصی است. اگر سه مکانیک را تغییر دهید و بازی بهبود یابد، نمی دانید که کدام تغییر مسئول بوده است. ممکن است یک مشکل را برطرف کرده باشید و دو مشکل دیگر را ایجاد کرده باشید که هنوز آشکار نشده اند. ممکن است یک علامت را برطرف کرده باشید و علت اصلی را در جای خود رها کرده باشید. شما نمی توانید بدانید - زیرا سه چیز را به طور همزمان تغییر دادید.

برای Neutronium: Parallel Wars اعمال شد: زمانی که Universe 7 احساس "خیلی سریع" می کرد - جلسات کوتاه تر از حد انتظار اجرا می شود و بازیکنان احساس عجله می کردند - سه دلیل احتمالی در جلسات جداگانه بررسی شد:

Session A: گام بلند — یک چرخه غنی سازی اضافی به Universe 7 اضافه کرد. نتیجه: طول جلسه 8 دقیقه افزایش یافت. امتیاز نامزدی بدون تغییر نه علت اصلی.

Session B: مکانیک های اضافی به Universe 7 اضافه شد. نتیجه: طول جلسه 5 دقیقه افزایش یافت. امتیاز مشارکت افزایش یافت. علت جزئی شناسایی شد.

Session C: مکانیک های موجود را مجدداً ترتیب داد تا چگالی تصمیم را به طور یکنواخت توزیع کند. نتیجه: طول جلسه 6 دقیقه افزایش یافت و امتیاز تعامل به طور معنی داری افزایش یافت. علت اصلی شناسایی شد - خوشه‌بندی مکانیکی در انتهای کیهان پایانه‌های شتابزده ایجاد کرد.

بدون آزمایش هر تغییر به طور جداگانه، بینش جلسه C - مشکل خوشه بندی مکانیکی - نامرئی بود. تغییر ترکیبی B+C ممکن است شبیه «افزودن مکانیک کمک کرد» به نظر می‌رسید، زمانی که تعمیر واقعی در حال مرتب کردن مجدد چیزی بود که قبلاً وجود داشت.

اشتباه رایج: اجرای جلسه ای که در آن «فقط دو چیز کوچک» را تغییر داده اید. هیچ تغییر کوچکی در یک بازی با مکانیک های وابسته به هم وجود ندارد. هر تغییری به طور بالقوه یک متغیر است. به یک جلسه در هر جلسه متعهد شوید.

آزمایش با گروه های تجربی مختلط

سخت‌ترین چالش تعادل در طراحی بازی‌های رومیزی، تعادل جناحی یا مقیاس‌بندی درآمد نیست – این تضمین می‌کند که بازیکنان باتجربه بر بازیکنان جدید در همان جلسه تسلط ندارند. اکثر طراحان بازی این موضوع را به طور کامل نادیده می گیرند و خانواده و مخاطبان عادی خود را از دست می دهند.

برای Neutronium: Parallel Wars، ستون سازگاری MEQA نرخ برد را در جلسات با تجربه ترکیبی به صراحت ردیابی کرد. قبل از پرداختن به مشکل، بازیکنان باتجربه 78 درصد از جلسات گروهی ترکیبی را بردند - عدم تعادل شدیدی که مانع از بازگشت بازیکنان جدید به جلسه 2 می‌شود.

راه حل سیستم نقص Progress Journal بود: بازیکنان باتجربه که قبلاً یک جهان را برده اند با تعادل منفی Nn متناسب با مزیت تجربه خود شروع می کنند. کالیبراسیون از داده های جلسه MEQA بدست آمد:

جلسات بازی شده (بازیکن باتجربه) نقص شروع نرخ برد پس از معلولیت (مقداربازیکن)

1–3 جلسه −5 Nn 54%QZXQZXA
4–7 جلسه −10 Nn 52%

8+ جلسات −15 Nn X51%Q6QZXA

هدف نرخ برد با تجربه در مقابل جدید 55 تا 65 درصد است. زیر 55 درصد به این معنی است که هیچ بیان مهارت معناداری وجود ندارد - بازیکنان با تجربه هیچ مزیتی از دانش خود ندارند. بالاتر از 65٪ به این معنی است که تجربه بازیکن جدید به طور موثر شکسته شده است - آنها نمی توانند بدون توجه به تصمیمات اتخاذ شده رقابت کنند.

شناسایی شکاف‌های تجربه در داده‌ها: پیگیری تعداد جلسات برای هر بازیکن در کنار داده‌های برد/باخت. اگر بازیکنی با 10 جلسه 75 درصد از بازی ها را در مقابل بازیکنان با 2 جلسه برنده شود، کالیبراسیون نقص نیاز به تنظیم دارد - یا خود مکانیک ها مزایای غیرقابل برگشتی ایجاد می کنند که خیلی سریع ترکیب می شوند.

"صخره 12 جلسه ای" در Neutronium: پس از اینکه بازیکنان میزبان بیش از 12 جلسه را جمع کردند، بازی برای بازیکنان جدیدی که برای اولین بار به آن ملحق می شوند غیرقابل دسترس شد. شکاف دانش مکانیک بیش از حد بزرگ بود که نمی‌توان از طریق بازی معمولی پل زد. رفع: سیستم Progress Journal، که تفاوت تجربه را قابل مشاهده کرد و یک تصحیح متناسب را اعمال کرد. بدون داده‌هایی که صخره 12 جلسه‌ای را به طور خاص نشان می‌دهند، این مشکل به‌عنوان «بازیکنان جدید برنمی‌گردند» به جای «بازیکنان جدید در جلسه 1 با میزبان‌های 12 جلسه‌ای 23 درصد نرخ برد دارند» ظاهر می‌شد.

زمانی که تست پخش را متوقف کنیم

یکی از رایج‌ترین اشتباهات در توسعه بازی‌های رومیزی، تست بازی به‌طور نامحدود است – استفاده از «ما هنوز در حال آزمایش هستیم» به عنوان دلیلی برای اجتناب از حمل و نقل. این یک پاسخ ترس است که لباس سختگیرانه به تن کرده است. در برخی موارد، داده‌ها به شما می‌گویند که کارتان تمام شده است.

آزمون بازدهی کاهنده : اگر سه جلسه تست پخش متوالی هیچ نقطه داده عملی ایجاد نکرد - هیچ متریکی از آستانه QC نگذرد، هیچ رویداد سردرگمی جدیدی ثبت نشده است، هیچ افت تعاملی برای آزمایش فعلی بازی مشخص شده است. جلسات اضافی در حال تأیید هستند، نه کشف.
معیارهای آمادگی کشتی
Neutronium: Parallel Wars عبارتند از:

نرخ برد در هر 4 جناح در 10٪ برابر است (هدف: هر کدام 25٪، محدوده قابل قبول: 22-28٪ در هر جناح)
امتیاز
Engagement در تمام جلسات در Universes 1–6
بالاتر از 4 از 5 باقی می ماند
هیچ رویداد سردرگمی ثبت شده در 3 جلسه متوالی در Universes 1–3 (بازی اصلی)

نرخ برد با تجربه مخلوط (تجربه شده در مقابل جدید) در محدوده 55 تا 65 درصد در 3 جلسه متوالی

وقتی هر چهار معیار در سه جلسه متوالی برآورده شد، بازی در وضعیت کشتی قرار دارد. کامل نیست - "کامل" یک حالت معنی دار برای یک بازی نیست. شرایط کشتی به این معنی است که داده‌ها دیگر پیشرفت‌هایی را که تجربه بازیکن را به روشی قابل اندازه‌گیری تغییر می‌دهند شناسایی نمی‌کنند.

سوالات متداول

چند جلسه تست پلی قبل از انتشار یک بازی رومیزی نیاز دارید؟

حداقل 10-15 جلسه با گروه های مختلف برای یک بازی با پیچیدگی کم. برای بازی های پیچیده با چند جناح و مکانیک عمیق، 30 تا 50+ جلسات واقع بینانه تر است.Neutronium: Parallel Wars بیش از 12 جلسه تأیید تعادل مستند داشته است - جدا از 25 سال بازی توسعه معمولی. این تعداد کمتر از کیفیت مهم است: 12 جلسه ساختاریافته با معیارهای تعریف شده داده‌های کاربردی تری نسبت به 100 جلسه بدون ساختار تولید می‌کنند که در آن‌ها پرسیده بودید "سرگرم بود؟"

آیا طراح باید در تست های پخش بازی کند؟

No، برای تست تعادل رقابتی. حضور طراح به دو صورت رفتار بازیکن را تغییر می دهد: بازیکنان به جای ضبط یک رویداد سردرگمی، از طراح سوالات قوانین می پرسند، و بازیکنان بازخورد خود را تعدیل می کنند تا انتقادی به نظر نرسند. جلسات صرفاً مشاهده‌گر را برای تست تعادل اجرا کنید - طراح تماشا می‌کند، داده‌ها را ضبط می‌کند و شرکت نمی‌کند. طراح می‌تواند در جلسات بازخورد معمولی بازی کند، اما این جلسات نباید منبع اصلی داده‌های تعادل باشند.

چگونه سوالات تست بازی خوب می نویسید؟

Avoid "از این کار لذت بردی؟" - بیش از حد مبهم و سوگیری اجتماعی نسبت به پاسخ های مثبت. از سؤالات رفتاری خاص استفاده کنید: "در چه مرحله ای احساس کردید استراتژی شما دیگر قابل اجرا نیست؟" نشان می دهد که مکانیک رسیدن به عقب شکست می خورد. چه زمانی تصمیم گرفتید از گسترش به دفاع تغییر دهید؟ پویایی سرعت و فشار را نشان می دهد. کدام تصمیم در پیامدهای آن نامشخص بود؟ مکانیک هایی را که فاقد بازخورد قابل مشاهده هستند شناسایی می کند. سوالات رفتاری مشکلات مکانیک را آشکار می کند. سوالات ترجیحی مشکلات موضوع را آشکار می کند. آنها دسته های جداگانه ای هستند و نیاز به سوالات جداگانه دارند.

طراحان حرفه ای بازی از چه ابزارهایی برای تست بازی استفاده می کنند؟

Tabletop Simulator برای جلسات از راه دور و مدیریت نسخه - به شما امکان می دهد بدون از دست دادن زمان نمونه اولیه فیزیکی به نسخه های قبلی بازی برگردید. برگه‌های Google برای ردیابی داده‌های جلسه - قبل از جلسه 1 یک الگو ایجاد کنید و هر جلسه همان ستون‌ها را پر کنید. نمونه‌های اولیه کاغذی (هرگز مدل‌های دیجیتال) برای آزمایش‌های فیزیکی اولیه - توکن‌های فیزیکی مشکلات ارگونومیکی را که ماکت‌های دیجیتال پنهان می‌کنند، آشکار می‌کنند، از جمله سرعت رسیدگی به اجزا، دید در شرایط بازی، و احساس هزینه تصمیم‌گیری هنگام استفاده فیزیکی از توکن‌ها. ضبط‌های صوتی خلاصه‌های پس از جلسه برای بررسی بعدی - بازیکنان اغلب چیزهای مهمی را به‌طور غیرمعمول می‌گویند که یادداشت‌بر در لحظه از دست می‌دهد.

فریم ورک کامل MEQA را بخوانید

روش کامل MEQA - از جمله آستانه QC، تعاریف متریک و مطالعه موردی کامل Nuclear Port - در مقاله چارچوب MEQA مستند شده است.
چارچوب MEQA را بخوانید →

جلسات بازی شده (بازیکن باتجربه)	نقص شروع	نرخ برد پس از معلولیت (مقداربازیکن)
1–3 جلسه	−5 Nn	54%QZXQZXA
4–7 جلسه	−10 Nn	52%
8+ جلسات	−15 Nn	X51%Q6QZXA