След 25 години разработване на Neutronium: Parallel Wars и провеждане на 12+ документирани сесии за тестване на игра, мога да ви кажа разликата между тестване на игра и професионално тестване на игра. Да помолите приятели да играят вашата игра не е тестване на играта. Това е общуване с вашата игра на масата. Професионалното тестване на игра е систематично валидиране на баланса — дефинирани показатели, тестване с една променлива, събиране на структурирани данни и дисциплината да се третира всяка сесия като експеримент, а не като опит.
Това ръководство описва как изглежда това на практика: как да настроите сесия, какво да измервате, как да идентифицирате конкретни категории проблеми с баланса и — най-важното — кога да спрете тестването и да изпратите. Принципите важат за всяка сложна игра. Примерите идват от 47-те механики и 13-те нива на вселената на Neutronium: Parallel Wars, които предоставят достатъчно сложност за стрес-тест на всяка методология, описана тук.
Защо повечето тестове за игра са неуспешни
Единствената най-честа грешка при тестването на играта: питането „забавно ли беше?“ в края на сесията. „Забавление“ е твърде широко, за да бъде приложимо. Fun не може да ви каже кой механик е нарушил баланса. Fun не може да ви каже в кой момент от сесията ангажиментът е отпаднал. Забавлението е заключение, а не диагноза.
Вместо това измервайте специфични показатели: процент на победи на фракция, конфликт от завои към първи, разлика в приходите по средата на играта, дължина на сесия на фаза. Тези числа ви казват къде да търсите. „Забавление“ не ви казва нищо, което вече не сте подозирали.
Снежната топка на ядрения порт — Вселена 7
Ядрените портове в Neutronium: Parallel Wars генерират експоненциален доход: 1 порт дава 2 Nn на рунд, 10 порта носят 220 Nn на рунд. В ранните сесии тестерите на игра описаха икономиката като „чувстваща се небалансирана“. Не е полезно. Корекцията изискваше измерване: каква беше действителната разлика Nn между лидера и последното място в края на Вселена 6?
MEQA Проследяването разкри съотношение между лидер и последен доход от 14:1 в сесия 7 — лидерът е натрупал 6 портове, изоставащите играчи са имали 0. Това не е „небалансирано усещане“. Това е определен брой, който надвишава прага за контрол на качеството 5:1 и задейства задължителна промяна на дизайна. Без това измерване поправката щеше да е предположение. С него корекцията беше насочена: направете портовете разрушими по време на битка. Формулата на доходите остава непроменена. Проблемът е разрешен.
Основният провал на неструктурираното тестване на играта: без дефинирани показатели не можете да различите проблем с дизайна от адаптация на играч. Опитните играчи се адаптират към счупената механика — те изграждат стратегии около счупеността, спират да се оплакват от нея и я карат да изглежда като „начина, по който се играе играта“. Измерването разкрива какво крие поведението.
Общ преглед на рамката MEQA
За Neutronium: Parallel Wars методологията за систематично тестване на играта е MEQA Framework — структура от четири стълба, разработена в продължение на 25 години итерация. Всеки стълб отговаря на различна категория нужди от тестване:
Измеримост
Всяка сесия има определени цифрови показатели, проследявани преди началото на сесията. Коефициенти на доходи, процент на печалба, брой територии, продължителност на сесията на фаза. Ако не можете да дефинирате число за него, не можете да го тествате.
Ангажимент
Пейсинг, проследяван по ниво на вселена. Времето на фаза разкрива къде играчите се освобождават преди обратната връзка след играта. Прекъсванията на вниманието при по-младите играчи са измерими неуспехи при ангажиране.
Контрол на качеството
Дефинирани прагове за преминаване/неуспех за всеки показател, зададени преди събирането на данни. Преминаването на прага предизвиква промяна в дизайна - премахване на субективността от "кога нещо е достатъчно счупено, за да се поправи?" въпрос.
Адаптивност
Метрики, проследявани в различни групи играчи: възрастови групи, нива на опит, брой играчи. Механик, балансиран за опитни възрастни, може катастрофално да се провали със смесени възрастови групи.
Пълната методология на MEQA Framework — включително специфичните показатели, използвани за Neutronium: Parallel Wars и QC праговата система — е документирана подробно в MEQA Framework: Доказана методология за тестване на настолна игра Баланс. Това ръководство се фокусира върху практическото приложение на ниво сесия.
Настройване на сесия за тестване на игра
Професионалните сесии за тестване на игра имат три фази: настройка преди сесията, наблюдение по време на сесията и структуриран дебриф след сесията. Всяка фаза има специфични изисквания, които повечето неофициални тестове за игра пропускат изцяло.
Предварителна сесия: Определете точно една механична промяна, която тествате. Запишете го, преди да пристигнат играчите. Ако не можете да заявите „днес ние тестваме дали превръщането на ядрените пристанища в разрушими намалява съотношението доходи лидер към последен под 5:1“ — не сте готови да проведете сесия. Хипотезата трябва да е конкретна и подлежаща на фалшификация. Запишете базовите показатели от предишната сесия за директно сравнение.
По време на сесията: Определете един наблюдател, който НЕ играе. Работата на наблюдателя е да записва: продължителност на сесията на фаза, време за вземане на решение на ход (средно), всякакви моменти на объркване или откъсване, състояние на победа/загуба за фракция за вселена. Наблюдателят не участва в играта, не обяснява правилата и не отговаря на въпроси — ако играчът има въпрос, това са данни. Запишете какво ги е объркало и защо.
Разбор след сесията: максимум 15 минути. Само структурирани въпроси — конкретни поведенчески запитвания, а не „Хареса ли ви?“ Вижте секцията с често задавани въпроси за точните въпроси, които да използвате. Събирайте писмени отговори, когато е възможно — устните отговори губят детайли и въвеждат социални пристрастия (играчите не са склонни да казват отрицателни неща директно на дизайнера).
Данни за събиране на всяка сесия без изключение:
- Продължителност на сесията за ниво на вселена
- Печалба/загуба на фракция
- Превърнете броя към първа битка
- Разлика в приходите между лидер и изоставащ играч в средата на играта
- Брой събития на объркване на играча (дефинирани като: играч задава въпрос за правила или предприема незаконно действие)
Идентифициране на проблеми с баланса
Проблемите с баланса попадат в пет категории, всяка с различен сигнал в данните:
Избягал лидер: Сигнал — водещият играч никога не е губил след Universe 5 в 3 от 4 сесии. Праг: ако лидерът спечели от позиция, която е заемал във Вселена 4 в повече от 70% от сесиите, играта ефективно приключва във Вселена 4. Проучете механиката на приходите и територията във Вселени 1–4.
Парализа на анализа: Сигнал — средното време за вземане на решение на ход се увеличава, тъй като вселените напредват по-бързо, отколкото изисква сложността на решението. 5-минутен среден ход във Вселена 3, превръщащ се в 20-минутен среден ход във Вселена 6 с добавени само 2 нови механики, предполага проблем с механичното взаимодействие, а не проблем със сложността. Проучете кои конкретни решения отнемат най-много време.
Доминиране на фракцията: Сигнал — една фракция печели 60% или повече от сесиите в 5 или повече теста. Очакваният процент на печалба в балансирана игра с 4 фракции е приблизително 25%. При 60% фракцията не е просто по-добра — тя има структурно предимство, което другите фракции не могат да преодолеят с по-добра игра. Проучете уникалната механика на доминиращата фракция за непредвидени ефекти на взаимодействие.
Спад на ангажираността: Сигнал — играчите стават пасивни или видимо неангажирани в конкретна вселена. Наблюдаваното поведение: играчите проверяват телефоните, отместват поглед от дъската, питат "кога е моят ред?" Това са измерими събития. Запишете кога се случват и коя вселена е била в ход.
Икономически дисбаланс във Вселена 6+
Iit, икономическата фракция, спечели 7 от 10 сесии във Вселена 6 и по-нови поради натрупването на приходи от Nuclear Port. Данните бяха ясни: 70% печалба, 4 пъти над очакваните 25% базова линия. Бяха тествани три корекции, по една на сесия, следвайки правилото за една променлива.
Тест 1: Намалете стойностите на приходите от ядрено пристанище. Резултат — Процентът на печалби падна до 28%, в приемлив диапазон. Проблем: Играчите на Iit съобщиха, че фракцията се чувства „куха“ с намалена стойност на порта. Идентичността на икономиката беше унищожена. Връщане назад.
Тест 2: Ограничете броя на ядрените портове на играч. Резултат — Iit win rate 35%, по-близо до балансиран. Проблем: играта в края на играта загуби динамиката си на икономическа ескалация. Други фракции докладваха по-малко интересни решения, когато Iit не можеше да мащабира. Връщане назад.
Тест 3: Направете ядрените портове разрушими по време на битка. Резултат — процент на печалба 31%, в приемлив диапазон. Няма отрицателни ефекти върху други фракции. Формулата на пристанищния доход непроменена — икономическата идентичност се запазва. Поправката е потвърдена.
Правилото за една променлива
Правилото за една променлива е най-важният принцип при тестването на баланса и най-често нарушаваният. Правилото: променете точно едно нещо между сесиите.
Причината е диагностичната яснота. Ако промените три механики и играта се подобри, не знаете коя промяна е отговорна. Може да сте коригирали един проблем и да сте създали два други, които все още не са се проявили. Може да сте коригирали симптом и да сте оставили първопричината на място. Не можете да знаете — защото сте променили три неща едновременно.
Приложено към Neutronium: Parallel Wars: когато Universe 7 се почувства „твърде бърз“ — сесиите протичаха по-кратко от очакваното и играчите се чувстваха прибързани — три възможни причини бяха изследвани в отделни сесии:
- Сесия A: Разширено темпо — добавен един допълнителен цикъл на обогатяване към Вселена 7. Резултат: продължителността на сесията се увеличи с 8 минути. Резултатът за ангажираност не е променен. Не е основната причина.
- Сесия B: Допълнителни механики, добавени към Вселена 7. Резултат: продължителността на сесията се увеличи с 5 минути. Резултатът за ангажираност се увеличи. Установена частична причина.
- Сесия C: Преподредени съществуващи механики, за да се разпредели по-равномерно плътността на решенията. Резултат: продължителността на сесията се увеличи с 6 минути И резултатът за ангажираност се увеличи значително. Идентифицирана първопричина — механично групиране в края на вселената създаде бързи краища.
Без тестване на всяка промяна поотделно, прозрението на сесия C — проблемът с механичното групиране — би било невидимо. Комбинираната промяна на B+C може да е изглеждала като „добавянето на механика помогна“, когато действителната корекция беше пренареждане на това, което вече беше там.
Тестване с групи със смесен опит
Най-трудното предизвикателство за балансиране в дизайна на настолни игри не е балансът на фракции или мащабирането на приходите — това е да се гарантира, че опитните играчи не доминират тривиално над новите играчи в една и съща сесия. Повечето дизайнери на игри пренебрегват това изцяло и губят своето семейство и случайна аудитория.
За Neutronium: Parallel Wars, стълбът за адаптивност MEQA проследи изрично процентите на печалба в сесии със смесен опит. Преди да се заеме с проблема, опитни играчи спечелиха 78% от сесиите в смесени групи - сериозен дисбаланс, който би попречил на новите играчи да се върнат за сесия 2.
Решението беше системата за хендикап в дневника на прогреса: опитни играчи, които преди това са печелили вселена, започват с отрицателен Nn баланс, пропорционален на предимството им в опита. Калибрирането идва от MEQA данни за сесията:
<таблица class="data-table">Целта за процент на победи опитни срещу нови е 55–65%. Под 55% означава, че няма смислено изразяване на умения — опитните играчи нямат предимство от знанията си. Над 65% означава, че изживяването на новия играч е ефективно нарушено — те не могат да се състезават независимо от взетите решения.
Идентифициране на пропуски в данните: проследявайте броя на сесиите за всеки играч заедно с данните за победи/загуби. Ако играч с 10 сесии печели 75% от игрите срещу играчи с 2 сесии, калибрирането на хендикапа се нуждае от корекция — или самите механики създават необратими предимства, които се натрупват твърде бързо.
„Скалата с 12 сесии“ в Neutronium: след като играчите на хоста натрупаха 12+ сесии, играта стана недостъпна за нови играчи, които се присъединиха за първи път. Пропастта в знанията на механиците беше твърде голяма, за да се преодолее чрез нормална игра. Поправка: системата Progress Journal, която направи разликата в опита видима и приложи пропорционална корекция. Без данните, показващи конкретно пропастта от 12 сесии, този проблем щеше да се появи като „нови играчи не се връщат“, а не „новите играчи в сесия 1 с домакини от 12 сесии имат 23% процент на победа.“
Кога да спрете тестването на игра
Една от най-честите грешки при разработката на настолни игри е безкрайното тестване на играта — използването на „все още тестваме игра“ като причина за избягване на изпращането. Това е реакция на страх, облечена като строгост. В даден момент данните ви казват, че сте готови.
Тестът за намаляваща възвръщаемост: ако три последователни сесии за тестване на игра не доведат до точки с данни, които могат да се предприемат — никой показател не преминава прага на QC, не се записват нови събития на объркване, не се установяват спадове на ангажираността — вие сте достигнали насищането на теста за текущото състояние на играта. Допълнителните сесии произвеждат потвърждение, а не откриване.
Критериите за готовност на кораба Neutronium: Parallel Wars са:
- Процентът на победа във всичките 4 фракции е в рамките на 10% от равните (цел: 25% всяка, приемлив диапазон: 22–28% на фракция)
- Резултатът за ангажираност остава над 4 от 5 във всички сесии във Вселени 1–6
- Няма записани объркващи събития в 3 последователни сесии във Вселени 1–3 (основната игра)
- Процент на победи при смесен опит (опитен срещу нов) в рамките на 55–65% диапазон в 3 последователни сесии
Когато и четирите критерия са изпълнени в три последователни сесии, играта е в състояние на кораб. Не е перфектно — „перфектно“ не е смислено състояние за една игра. Състоянието на кораба означава, че данните вече не идентифицират подобрения, които биха променили изживяването на играча по измерим начин.
Често задавани въпроси
Прочетете пълната рамка MEQA
Пълната методология на MEQA — включително прагове за QC, дефиниции на показатели и пълния казус на Nuclear Port — е документирана в статията за MEQA Framework.
Прочетете рамката MEQA →