Водич за тестирање друштвених игара: Како тестирати равнотежу као професионалац

<п>После 25 година развоја <стронг>__БРАНД_НПВ_0033__ и покретања 12+ документованих сесија тестирања, могу да вам кажем разлику између тестирања играња и <ем>професионалног тестирања. Замолити пријатеље да играју вашу игру није тестирање. То је дружење са вашом игром на столу. Професионално тестирање играња је систематска провера равнотеже — дефинисане метрике, тестирање једне променљиве, прикупљање структурираних података и дисциплина да се свака сесија третира као експеримент, а не као искуство. <п>Овај водич покрива како то изгледа у пракси: како подесити сесију, шта мерити, како идентификовати специфичне категорије проблема са равнотежом и — што је најважније — када престати са тестирањем и испоруком. Принципи се примењују на сваку сложену игру. Примери потичу из __БРАНД_НПВ_0034__ 47 механика и 13 универзалних нивоа, који су обезбедили довољно сложености да се тестира свака методологија која је овде описана на стрес. <х2>Зашто већина Плаитестирања не успе <п>Једина најчешћа грешка у тестирању игре: питање „да ли је било забавно?“ на крају седнице. „Забава“ је превише широка да би се могла применити. Забава вам не може рећи који је механичар прекинуо равнотежу. Забава вам не може рећи у ком тренутку је ангажовање пало. Забава је закључак, а не дијагноза. <п>Уместо тога, мерите специфичне показатеље: <стронг>стопа победа по фракцијама, <стронг>конфликт преокрета у први, <стронг>разлика у приходу усред утакмице, <стронг>дужина сесије по фази. Ови бројеви вам говоре где да тражите. „Забава“ вам не говори ништа на шта већ нисте сумњали. <див __АТТР0000__> <див __АТТР0001__>Студија случаја <х3>Тхе Нуцлеар Порт Сновбалл — Универзум 7 <п>Нуклеарне луке у __БРАНД_НПВ_0035__ генеришу експоненцијални приход: 1 порт даје 2 Нн по рунди, 10 портова даје 220 Нн по рунди. У раним сесијама, плејтестери су описали економију као „осећај неуравнотежености“. Није корисно. Поправка је захтевала мерење: колика је била стварна разлика Нн између лидера и последњег места на крају Универзума 6? <п>__БРАНД_МЕКА_0043__ праћење је открило однос лидера и последњег прихода од 14:1 у сесији 7 — лидер је акумулирао 6 портова, а играчи у заостатку су имали 0. То није „осећај неуравнотежености“. То је дефинисани број који премашује праг контроле квалитета 5:1 и покреће обавезну промену дизајна. Без тог мерења, поправка би била само нагађање. Уз то, исправка је била циљана: учините портове уништивим током борбе. Формула прихода непромењена. Проблем решен. <п>Главни неуспех неструктурисаног тестирања репродукције: без дефинисаних метрика, не можете разликовати проблем дизајна од адаптације играча. Искусни играчи се прилагођавају поквареној механици — граде стратегије око покварености, престају да се жале на то и чине да изгледа као „начин на који се игра игра“. Мерење открива шта понашање крије. <х2>Преглед __БРАНД_МЕКА_0044__ оквира <п>За __БРАНД_НПВ_0036__, методологија систематског тестирања играња је <а __АТТР0002__>__БРАНД_МЕКА_0045__ оквир — структура са четири стуба развијена током 25 година понављања. Сваки стуб се бави различитим категоријама потреба за тестирањем: <див __АТТР0003__> <див __АТТР0004__> <див __АТТР0005__>М <х3>Мерљивост <п>Свака сесија има дефинисане нумеричке показатеље који се прате пре почетка сесије. Односи прихода, стопе победа, број територија, дужина сесије по фази. Ако не можете да дефинишете број за њега, не можете га тестирати. <див __АТТР0006__> <див __АТТР0007__>Е <х3>Ангажовање <п>Праћени темпо по нивоу универзума. Време по фази открива где се играчи одвајају пре него што то ураде повратне информације после утакмице. Прекиди пажње код млађих играча су мерљиви неуспеси ангажовања. <див __АТТР0008__> <див __АТТР0009__>П <х3>Контрола квалитета <п>Дефинисани прагови пролазности/неуспеха за сваки показатељ, који се постављају пре прикупљања података. Прелазак прага покреће промену дизајна — уклањање субјективности из „када је нешто довољно покварено да се поправи?“ питање. <див __АТТР0010__> <див __АТТР0011__>А <х3>Прилагодљивост <п>Показатељи који се прате у различитим групама играча: узрасти, нивои искуства, број играча. Механичар избалансиран за искусне одрасле особе може катастрофално да пропадне у групама мешовитих узраста. <п>Комплетна __БРАНД_МЕКА_0046__ Фрамеворк методологија — укључујући специфичне метрике коришћене за __БРАНД_НПВ_0037__ и систем граничних вредности КЦ — је детаљно документована у <а __АТТР0012__>__БРАНД_МЕКА Фрамеворк Метход фор А_ Тестинг Боард Гаме Метход фор А_ Баланс. Овај водич се фокусира на практичну апликацију на нивоу сесије. <х2>Подешавање сесије тестирања репродукције <п>Професионалне сесије тестирања игре имају три фазе: подешавање пре сесије, посматрање током сесије и структурирани извештај након сесије. Свака фаза има специфичне захтеве које већина неформалног тестирања у потпуности прескаче. <п><стронг>Пре-сесија: Дефинишите тачно једну механичку промену коју тестирате. Запишите то пре него што играчи стигну. Ако не можете да кажете „данас тестирамо да ли омогућавање уништавања нуклеарних лука смањује однос водећих и последњих прихода испод 5:1“ — нисте спремни да покренете сесију. Хипотеза мора бити конкретна и фалсификабилна. Забележите основну метрику из претходне сесије за директно поређење. <п><стронг>Током сесије: Одредите једног посматрача који НЕ игра. Посао посматрача је да забележи: дужину сесије по фази, време одлучивања по заокрету (просечно), све тренутке конфузије или одвајања, стање победе/губитка по фракцијама по универзуму. Посматрач не учествује у игри, не објашњава правила и не одговара на питања — ако играч има питање, то су подаци. Забележите шта их је збунило и зашто. <п><стронг>Извештавање после сесије: максимално 15 минута. Само структурирана питања — специфични упити о понашању, а не „да ли сте уживали у томе?“ Погледајте одељак Честа питања за тачна питања која треба да користите. Прикупите писмене одговоре када је то могуће — вербални одговори губе детаље и уводе друштвену пристрасност (играчи нерадо говоре негативне ствари дизајнеру директно). <п>Подаци за прикупљање сваке сесије без изузетка: <ул> <ли>Дужина сесије по нивоу универзума <ли>Победа/губитак по фракцијама <ли>Пребаци број на прву борбу <ли>Разлика у приходима између лидера и играча који заостаје на средини игре <ли>Број догађаја забуне играча (дефинисан као: играч поставља питање о правилима или предузима незакониту радњу) <х2>Идентификовање проблема са равнотежом <п>Проблеми са равнотежом спадају у пет категорија, од којих свака има посебан сигнал у подацима: <п><стронг>Одбегли лидер: Сигнал — водећи играч никада није изгубио после Универсе 5 у 3 од 4 сесије. Праг: ако лидер победи са позиције коју су имали у Универзуму 4 у више од 70% сесија, игра се ефективно завршава на Универзуму 4. Истражите механику прихода и територије у Универзуму 1–4.<п><стронг>Парализа анализе: Сигнал — просечно време одлучивања по заокрету се повећава како универзум напредује брже него што то захтева сложеност одлуке. Просечан окрет од 5 минута у Универзуму 3 који постаје просечан окрет од 20 минута у Универзуму 6 са само 2 додане нове механике сугерише проблем механичке интеракције, а не проблем сложености. Истражите које конкретне одлуке одузимају највише времена. <п><стронг>Доминација фракције: Сигнал — једна фракција осваја 60% или више сесија у 5 или више тестова. Очекивана стопа победа у уравнотеженој игри са 4 фракције је приближно 25%. Са 60%, фракција није само боља – она има структурну предност коју друге фракције не могу да превазиђу бољом игром. Истражите јединствену механику доминантне фракције за непредвиђене ефекте интеракције. <п><стронг>Пад ангажовања: Сигнал — играчи постају пасивни или видљиво деактивирани у одређеном универзуму. Понашање које се може приметити: играчи проверавају телефоне, скрећу поглед са табле, питају "када је мој ред?" Ово су мерљиви догађаји. Забележите када се дешавају и који универзум је био у току. <див __АТТР0013__> <див __АТТР0014__>Студија случаја — Доминација фракција <х3>Ит Ецономи Дисбаланс ат Универсе 6+ <п>Иит, економска фракција, победила је у 7 од 10 сесија на Универзуму 6 и више због акумулације прихода од Нуклеарне луке. Подаци су били јасни: 70% победа, 4к изнад очекиваних 25% основне линије. Три исправке су тестиране, једна по сесији, у складу са правилом једне променљиве. <п><стронг>Тест 1: Смањите вредности прихода од нуклеарне луке. Резултат — Иит стопа победа је пала на 28%, у прихватљивом опсегу. Проблем: Иит играчи су пријавили да се фракција осећа „шупљом“ са смањеном вредношћу порта. Уништен је економски идентитет. Враћање. <п><стронг>Тест 2: Ограничите број нуклеарних портова по играчу. Резултат — Иит стопа победе 35%, ближе уравнотеженој. Проблем: игра у касној утакмици изгубила је динамику економске ескалације. Друге фракције су пријавиле мање занимљиве одлуке када Иит није могао да се повећа. Враћање. <п><стронг>Тест 3: Учините нуклеарне луке уништеним током борбе. Резултат — Иит стопа победа 31%, унутар прихватљивог опсега. Нема негативних ефеката на друге фракције. Формула прихода луке непромењена — економски идентитет очуван. Исправка је потврђена. <х2>Правило једне променљиве <п>Правило једне варијабле је најважнији принцип у тестирању равнотеже и најчешће кршено. Правило: <стронг>промените тачно једну ствар између сесија. <п>Разлог је јасноћа дијагностике. Ако промените три механике и игра се побољша, не знате која је промена била одговорна. Можда сте решили један проблем и направили два друга која се још нису манифестовала. Можда сте поправили симптом и оставили основни узрок на месту. Не можете знати — јер сте променили три ствари истовремено. <п>Примењено на __БРАНД_НПВ_0038__: када се Универсе 7 осећао „пребрзо“ — сесије трају краће него што се очекивало, а играчи су се осећали журно — три могућа узрока су истражена у одвојеним сесијама:<ул> <ли><стронг>Сесија А: Проширено пејсинг — додат је један додатни циклус обогаћивања у Универзум 7. Резултат: дужина сесије је повећана за 8 минута. Оцена ангажовања је непромењена. Није основни узрок. <ли><стронг>Сесија Б: Додатна механика је додата у Универзум 7. Резултат: дужина сесије је повећана за 5 минута. Повећан резултат ангажовања. Делимичан узрок идентификован. <ли><стронг>Сесија Ц: Преуређена постојећа механика да би се густина одлучивања равномерније распоредила. Резултат: дужина сесије је повећана за 6 минута И резултат ангажовања се значајно повећао. Идентификован је основни узрок — механичко груписање на крају универзума створило је брзе завршетке. <п>Без тестирања сваке промене засебно, увид сесије Ц – проблем механичког груписања – био би невидљив. Комбинована промена Б+Ц је можда изгледала као „додавање механике је помогло“, када је стварна поправка преуређивала оно што је већ било. <див __АТТР0015__> <стронг>Уобичајена грешка: Покретање сесије у којој сте променили „само две мале ствари“. У игри са међузависном механиком нема малих промена. Свака промена је потенцијално променљива. Посветите се једном по сесији. <х2>Тестирање са мешовитим искуственим групама <п>Најтежи изазов равнотеже у дизајну друштвених игара није равнотежа фракција или скалирање прихода – већ се осигурава да искусни играчи не доминирају тривијално над новим играчима у истој сесији. Већина дизајнера игара ово потпуно игнорише и губи своју породицу и повремене публике. <п>За __БРАНД_НПВ_0039__, __БРАНД_МЕКА_0048__ стуб прилагодљивости је експлицитно пратио стопе победа у сесијама са мешовитим искуством. Пре него што су се позабавили проблемом, искусни играчи су освојили 78% сесија у мешовитим групама — озбиљна неравнотежа која би спречила нове играче да се врате на сесију 2. <п>Решење је био <стронг>Прогрес Јоурнал систем хендикепа: искусни играчи који су претходно освојили универзум почињу са негативним Нн салдом пропорционалним њиховој предности у искуству. Калибрација је дошла из __БРАНД_МЕКА_0049__ података сесије: <табела __АТТР0016__> <тхеад> <тр> <тх>Одигране сесије (искусан играч) <тх>Почетни хендикеп <тх>Стопа победа после хендикепа (експ. играч) <тбоди> <тр><тд>1–3 сесије<тд>−5 Нн<тд>54% <тр><тд>4–7 сесија<тд>−10 Нн<тд>52% <тр><тд>8+ сесија<тд>−15 Нн<тд>51% <п>Циљ за искусан-нову стопу победа је 55–65%. Испод 55% значи да нема смисленог изражавања вештине — искусни играчи немају предност од свог знања. Изнад 65% значи да је искуство новог играча ефективно покварено — не могу да се такмиче без обзира на донете одлуке. <п>Идентификовање недостатака у искуству у подацима: пратите број сесија за сваког играча заједно са подацима о победама/поразима. Ако играч са 10 сесија побеђује у 75% утакмица против играча са 2 сесије, потребно је прилагођавање калибрације хендикепа — или сама механика ствара неповратне предности које се пребрзо спајају.<п>„Литица од 12 сесија“ у __БРАНД_НЕУТРОНИУМ_0042__: након што су играчи домаћини сакупили 12+ сесија, игра је постала недоступна новим играчима који су се придружили по први пут. Јаз у механичарском знању био је превелик да би се премостио кроз нормалну игру. Поправка: систем дневника напретка, који је разликовао искуство видљивим и применио пропорционалну корекцију. Без података који посебно показују литицу од 12 сесија, овај проблем би се појавио као „нови играчи се не враћају“, а не „нови играчи на сесији 1 са домаћинима од 12 сесија имају стопу победа од 23%. <х2>Када зауставити Плаитестинг <п>Једна од најчешћих грешака у развоју друштвених игара је тестирање на неодређено време — коришћење „још увек тестирамо“ као разлог за избегавање испоруке. Ово је одговор на страх обучен као строгост. У неком тренутку, подаци вам говоре да сте завршили. <п><стронг>Тест опадајућих приноса: ако три узастопне сесије тестирања не дају никакве тачке података – ниједан показатељ не прелази праг контроле квалитета, не бележе се нови догађаји конфузије, нису идентификовани падови ангажовања – достигли сте засићење теста за игру за тренутно стање игре. Додатне сесије производе потврду, а не откривање. <п>__БРАНД_НПВ_0040__ критеријуми спремности брода су: <ол> <ли>Стопа победа у све 4 фракције је унутар 10% једнаке (циљ: 25% свака, прихватљив опсег: 22–28% по фракцији) <ли>Резултат ангажовања остаје изнад 4 од 5 у свим сесијама у Универзума 1–6 <ли>Нису забележени догађаји конфузије у 3 узастопне сесије на Универсима 1–3 (основна игра) <ли>Стопа победа у мешовитом искуству (искусни према новим) у распону од 55–65% у 3 узастопне сесије <п>Када су испуњена сва четири критеријума у три узастопне сесије, игра је у стању за брод. Није савршено — „савршено“ није значајно стање за игру. Стање испоруке значи да подаци више не идентификују побољшања која би променила искуство играча на мерљив начин.<х2>Честа питања <див __АТТР0017__> <див __АТТР0018__> <див __АТТР0019__>Колико вам је потребно сесија теста пре објављивања друштвене игре? <див __АТТР0020__>Минимално 10–15 сесија са различитим групама за игру мале сложености. За сложене игре са више фракција и дубоком механиком, реалније је 30–50+ сесија. __БРАНД_НПВ_0041__ је имао 12+ документованих сесија валидације биланса — одвојено од 25 година повременог развоја. Број је мање важан од квалитета: 12 структурираних сесија са дефинисаним показатељима производи више података од 100 неструктурираних сесија у којима сте питали „да ли је било забавно?“ <див __АТТР0021__> <див __АТТР0022__>Да ли дизајнер треба да игра у плаитестовима? <див __АТТР0023__>Не, за такмичарско тестирање равнотеже. Присуство дизајнера мења понашање играча на два начина: играчи постављају питања правилима дизајнера уместо да снимају догађај конфузије, а играчи модерирају своје повратне информације како би избегли да изгледају критично. Покрените сесије само за посматраче за тестирање равнотеже — дизајнер гледа, снима податке и не учествује. Дизајнер може да игра у повременим сесијама повратних информација, али те сесије не би требало да буду примарни извор података о стању. <див __АТТР0024__> <див __АТТР0025__>Како написати добра питања за тестирање? <див __АТТР0026__>Избегавајте „да ли сте уживали у овоме?“ — превише неодређено и друштвено пристрасно према позитивним одговорима. Користите специфична питања понашања: „У ком тренутку сте сматрали да ваша стратегија више није одржива?“ открива када механика сустизања закаже. „Када сте одлучили да пређете са проширења на одбрану?“ открива динамику пејсинга и притиска. „Која одлука је била најнејаснија по својим последицама?“ идентификује механике којима недостаје видљива повратна информација. Питања о понашању откривају проблеме механике; питања о преференцијама откривају проблеме теме. То су засебне категорије и потребна су им посебна питања. <див __АТТР0027__> <див __АТТР0028__>Које алате професионални дизајнери игара користе за тестирање играња? <див __АТТР0029__>Столни симулатор за удаљене сесије и управљање верзијама — омогућава вам да се вратите на претходне верзије игре без губљења времена физичког прототипа. Гоогле табеле за праћење података о сесији — направите шаблон пре сесије 1 и попуните исте колоне сваке сесије. Папирни прототипови (никада дигитални мокапи) за рано физичко тестирање — физички токени откривају ергономске проблеме које дигитални мокапи скривају, укључујући брзину руковања компонентама, видљивост у условима игре и осећај трошкова одлуке када физички предате токене. Гласовни снимци саопштавања након сесије за каснији преглед — играчи често неоправдано кажу важне ствари које белешки пропусте у овом тренутку. <див __АТТР0030__> <х3>Прочитајте комплетан __БРАНД_МЕКА_0050__ оквир <п>Комплетна __БРАНД_МЕКА_0051__ методологија — укључујући прагове контроле квалитета, метричке дефиниције и комплетну студију случаја нуклеарне луке — је документована у чланку оквира __БРАНД_МЕКА_0052__. <а __АТТР0031__ __АТТР0032__>Прочитајте __БРАНД_МЕКА_0053__ оквир →