Kutu Oyunu Test Etme: Dengeyi Profesyonel Gibi Test Et

Q: Tasarımcı oyun testlerinde oynamalı mı?

Hayır, rekabetçi denge testi için. Tasarımcının varlığı oyuncu davranışını değiştirir ve verileri önyargılı hale getirir. Tasarımcının katılmadan izlediği ve kaydettiği yalnızca gözlemci oturumları çalıştırın.

Q: İyi oyun testi sorularını nasıl yazarsınız?

'Bundan hoşlandın mı?' - çok belirsiz. Spesifik davranışsal sorular kullanın: 'Hangi noktada stratejinizin artık geçerli olmadığını hissettiniz?' veya 'Genişlemeden savunmaya geçmeye ne zaman karar verdiniz?' Davranışsal sorular mekanik sorunları ortaya çıkarır; tercih soruları tema sorunlarını ortaya çıkarmaktadır.

Q: Profesyonel oyun tasarımcıları oyun testi için hangi araçları kullanıyor?

Uzak oturumlar ve sürüm yönetimi için Masaüstü Simülatörü. Google Oturum verilerinin takibi için sayfalar. Erken fiziksel testler için kağıt prototipler (asla dijital maketler değil) - fiziksel jetonlar, dijital maketlerin gizlediği ergonomik sorunları ortaya çıkarır. İncelenmek üzere bilgilendirmelerin ses kayıtları.

25 yıl boyunca Neutronium: Parallel Wars'i geliştirdikten ve 12'den fazla belgelenmiş oyun testi oturumu yürüttükten sonra, size oyun testi ile professional oyun testi arasındaki farkı anlatabilirim. Arkadaşlarınızdan oyununuzu oynamalarını istemek oyun testi değildir. Masadaki oyununuzla sosyalleşiyor. Profesyonel oyun testi, sistematik denge doğrulamadır; tanımlı ölçümler, tek değişkenli testler, yapılandırılmış veri toplama ve her oturumu bir deneyimden ziyade bir deney olarak ele alma disiplinidir.

Bu kılavuz, pratikte neye benzediğini kapsar: bir seansın nasıl ayarlanacağı, neyin ölçüleceği, belirli denge sorunları kategorilerinin nasıl tanımlanacağı ve - en önemlisi - testin ne zaman durdurulup gönderileceği. İlkeler her türlü karmaşık oyun için geçerlidir. Örnekler Neutronium: Parallel Wars'in 47 mekaniğinden ve 13 evren katmanından alınmıştır; bunlar, burada açıklanan her metodolojinin stres testine tabi tutulması için yeterli karmaşıklığı sağlamıştır.

Çoğu Oyun Testi Neden Başarısız Oluyor

Oyun testinde en sık karşılaşılan hata: "Eğlenceli miydi?" diye sormak. bir oturumun sonunda. "Eğlence", eyleme geçirilemeyecek kadar geniş kapsamlıdır. Eğlence size hangi tamircinin dengeyi bozduğunu söyleyemez. Eğlence size oturumun hangi noktasında etkileşimin düştüğünü söyleyemez. Eğlence bir teşhis değil, bir sonuçtur.

Bunun yerine belirli ölçümleri ölçün: grup başına kazanma oranı, ilk çatışmaya dönüş, gelir farkı oyunortası, faz başına oturum uzunluğu. Bu sayılar size nereye bakmanız gerektiğini söyler. "Eğlence" size daha önce şüphelenmediğiniz hiçbir şeyi söylemez.

Örnek Olay

Nuclear Port Kartopu — Evren 7

Neutronium: Parallel Wars'teki

Nuclear Port'ler üstel gelir üretir: 1 bağlantı noktası tur başına 2 Nn sağlar, 10 bağlantı noktası tur başına 220 Nn sağlar. İlk oturumlarda oyun testçileri ekonomiyi "dengesiz hissetmek" olarak tanımladılar. Yararlı değil. Düzeltme ölçüm gerektiriyordu: Evren 6'nın sonundaki lider ile son yer arasındaki gerçek Nn farkı neydi?

MEQA takibi, 7. oturumda lider-son gelir oranının 14:1 olduğunu ortaya çıkardı; lider 6 liman biriktirmişti, arkadaki oyuncular ise 0 liman biriktirmişti. Bu "dengesiz bir duygu" değil. Bu, 5:1 Kalite Kontrol eşiğini aşan ve zorunlu bir tasarım değişikliğini tetikleyen tanımlanmış bir sayıdır. Bu ölçüm olmasaydı, düzeltme bir tahmin olurdu. Bununla birlikte, düzeltme hedeflendi: bağlantı noktalarını savaş sırasında yok edilebilir hale getirmek. Gelir formülü değişmedi. Sorun çözüldü.

Yapılandırılmamış oyun testinin temel başarısızlığı: Tanımlanmış ölçümler olmadan, tasarım sorununu oyuncu uyarlamasından ayırt edemezsiniz. Deneyimli oyuncular bozuk mekanizmalara uyum sağlarlar; kırıklık etrafında stratejiler geliştirirler, bundan şikayet etmeyi bırakırlar ve "oyunun oynanma şekli" gibi görünmesini sağlarlar. Ölçüm, davranışın neyi gizlediğini ortaya çıkarır.

MEQA Çerçevesine Genel Bakış

Neutronium: Parallel Wars için sistematik oyun testi metodolojisi, 25 yıllık yineleme boyunca geliştirilen dört sütunlu bir yapı olan MEQA Çerçevesi'tir. Her sütun farklı bir test ihtiyacı kategorisine yöneliktir:

Ölçülebilirlik

Her oturum, oturum başlamadan önce izlenen tanımlı sayısal ölçümlere sahiptir. Gelir oranları, kazanma oranları, bölge sayıları, aşama başına oturum uzunluğu.Eğer ona bir sayı tanımlayamıyorsanız test edemezsiniz.

Nişan

İlerleme hızı evren katmanı başına izlenir. Aşama başına zaman, oyuncuların oyun sonrası geri bildirimden önce nerede ayrıldığını ortaya çıkarır. Genç oyunculardaki dikkat kesintileri ölçülebilir katılım başarısızlıklarıdır.

Kalite Kontrol

Her ölçüm için tanımlanmış başarılı/başarısız eşikleri, herhangi bir veri toplanmadan önce ayarlanır. Bir eşiğin aşılması, bir tasarım değişikliğini tetikler; "bir şey ne zaman düzeltilecek kadar bozulur?" sorusundaki öznelliği ortadan kaldırır. soru.

Uyarlanabilirlik

Farklı oyuncu grupları genelinde takip edilen ölçümler: yaş aralıkları, deneyim seviyeleri, oyuncu sayıları. Deneyimli yetişkinler için dengelenmiş bir tamirci, karışık yaş gruplarında feci şekilde başarısız olabilir.

MEQA Çerçeve metodolojisinin tamamı - Neutronium: Parallel Wars ve QC eşik sistemi için kullanılan belirli ölçümler de dahil olmak üzere - MEQA Çerçevesi: Masa Oyunu Dengesini Test Etmek için Kanıtlanmış Bir Metodoloji adresinde ayrıntılı olarak belgelenmiştir. Bu kılavuz, oturum düzeyindeki pratik uygulamaya odaklanmaktadır.

Oyun Testi Oturumu Ayarlama

Profesyonel oyun testi oturumlarının üç aşaması vardır: oturum öncesi kurulum, oturum sırasında gözlem ve oturum sonrası yapılandırılmış bilgilendirme. Her aşamanın, çoğu resmi olmayan oyun testinin tamamen atladığı özel gereksinimleri vardır.

Seans öncesi: Test ettiğiniz tam olarak tek bir mekanik değişikliği tanımlayın. Oyuncular gelmeden önce bunu yazın. "Bugün Nuclear Port'leri yok edilebilir hale getirmenin lider-son gelir oranını 5:1'in altına düşürüp düşürmediğini test ediyoruz" diyemiyorsanız, bir oturum başlatmaya hazır değilsiniz. Hipotez spesifik ve yanlışlanabilir olmalıdır. Doğrudan karşılaştırma için önceki oturumdaki temel ölçümleri kaydedin.

Oturum sırasında: Oynamayan bir gözlemci belirleyin. Gözlemcinin görevi şunları kaydetmektir: aşama başına oturum uzunluğu, tur başına karar süresi (ortalama), kafa karışıklığı veya ayrılma anları, evren başına grup başına kazanç/mağlubiyet durumu. Gözlemci oyuna katılmaz, kuralları açıklamaz ve soruları yanıtlamaz; eğer bir oyuncunun bir sorusu varsa, bu veridir. Kafalarını neyin karıştırdığını ve nedenini kaydedin.

Oturum sonrası bilgilendirme: Maksimum 15 dakika. Yalnızca yapılandırılmış sorular - belirli davranışsal sorgular, "hoşunuza gitti mi?" Kullanılacak tam sorular için SSS bölümüne bakın.Mümkün olduğunda yazılı yanıtlar toplayın; sözlü yanıtlar ayrıntıları kaybeder ve sosyal önyargıya neden olur (oyuncular doğrudan tasarımcıya olumsuz şeyler söylemek konusunda isteksizdir).

İstisnasız her oturumu toplayacak veriler:

Evren katmanı başına oturum uzunluğu
Grup başına galibiyet/mağlubiyet
İlk dövüşe kadar dönüş sayısı
Oyun ortasında lider ve arkadaki oyuncu arasındaki gelir farkı
Oyuncu kafa karışıklığı olaylarının sayısı (şu şekilde tanımlanır: oyuncu kural sorusu sorar veya kural dışı bir eylemde bulunur)

Denge Sorunlarını Belirleme

Denge sorunları, her biri verilerde farklı bir sinyale sahip beş kategoriye ayrılır:

Kaçak lider: Signal — Lider oyuncu, Evren 5'ten sonra 4 oturumun 3'ünde hiç kaybetmedi. Eşik: Lider, oturumların %70'inden fazlasında Evren 4'te tuttuğu bir konumdan kazanırsa, oyun etkin bir şekilde Evren 4'te sona erer. 1-4. Evrenlerdeki gelir ve bölge mekanizmalarını araştırın.

Analiz felci: Sinyal — evrenler karar karmaşıklığının gerektirdiğinden daha hızlı ilerledikçe tur başına ortalama karar süresi artıyor. Evren 3'te ortalama 5 dakikalık bir dönüşün, yalnızca 2 yeni mekaniğin eklendiği Evren 6'da ortalama 20 dakikalık bir dönüşe dönüşmesi, bir karmaşıklık sorunu değil, mekanik bir etkileşim sorunu olduğunu gösteriyor. Hangi spesifik kararların en çok zaman aldığını araştırın.

Fraksiyon hakimiyeti: Sinyal — 5 veya daha fazla testte oturumların %60 veya daha fazlasını kazanan tek bir grup. Dengeli bir 4 gruplu oyunda beklenen kazanma oranı yaklaşık %25'tir. %60 ile grup sadece daha iyi olmakla kalmıyor, aynı zamanda diğer grupların daha iyi oyunla üstesinden gelemeyeceği yapısal bir avantaja da sahip. Öngörülemeyen etkileşim etkileri için baskın grubun benzersiz mekanizmalarını araştırın.

Etkileşim düşüşü: Sinyal — oyuncuların belirli bir evrende pasif hale gelmesi veya gözle görülür şekilde bağlantısının kesilmesi. Gözlemlenebilir davranış: Oyuncular telefonlarını kontrol ediyor, oyun alanından uzaklaşıyor ve "sıra bana ne zaman?" diye soruyor. Bunlar ölçülebilir olaylardır. Ne zaman meydana geldiklerini ve hangi evrenin devam ettiğini kaydedin.

Örnek Olay — Grup Hakimiyeti

Iit Evren 6+

'de Ekonomi Dengesizliği Ekonomi grubu

Iit, Nuclear Port gelir birikimi nedeniyle Evren 6 ve üzeri 10 oturumdan 7'sini kazandı. Veriler açıktı: Kazanma oranı %70, beklenen %25'in 4 kat üzerinde. Tek değişken kuralı izlenerek oturum başına bir tane olmak üzere üç düzeltme test edildi.

Test 1: Nuclear Port gelir değerlerini azaltın. Sonuç — Iit kazanma oranı kabul edilebilir aralıkta %28'e düştü. Sorun: Iit oyuncuları, bağlantı noktası değerinin azalması nedeniyle grubun "boş" hissettiğini bildirdi. Ekonomi kimliği yok edildi. Geri Alma.

Test 2: Oyuncu başına Nuclear Port sayısını sınırlayın. Sonuç — Iit kazanma oranı %35, dengeye yakın. Sorun: Oyunun sonlarında oyun ekonomik yükselme dinamiğini kaybetti. Diğer gruplar, Iit ölçeklenemediğinde daha az ilginç kararlar bildirdiler. Geri Alma.

Test 3: Nuclear Port'leri savaş sırasında yok edilebilir hale getirin. Sonuç — Iit kazanma oranı %31, kabul edilebilir aralıkta. Diğer gruplar üzerinde olumsuz bir etkisi yok. Liman geliri formülü değişmedi; ekonomik kimlik korundu.Düzeltme onaylandı.

Tek Değişkenli Kural

Tek değişken kuralı, denge testinde en önemli ve en sık ihlal edilen prensiptir. Kural: oturumlar arasında tam olarak tek bir şeyi değiştirin.

Bunun nedeni teşhis netliğidir. Eğer üç mekaniği değiştirirseniz ve oyun gelişirse, bunun hangi değişiklikten kaynaklandığını bilemezsiniz. Bir sorunu çözmüş ve henüz ortaya çıkmamış iki tane daha yaratmış olabilirsiniz. Bir semptomu düzeltmiş ve temel nedeni yerinde bırakmış olabilirsiniz. Bilemezsiniz çünkü aynı anda üç şeyi değiştirdiniz.

Neutronium: Parallel Wars'e uygulandı: Evren 7'nin "çok hızlı" olduğunu hissettiğinde (oyuncular beklenenden daha kısa sürüyor ve oyuncular aceleye gelmiş gibi hissediyor) üç olası neden ayrı oturumlarda araştırıldı:

Oturum A: Genişletilmiş ilerleme hızı — Evren 7'ye bir ek zenginleştirme döngüsü eklendi. Sonuç: oturum süresi 8 dakika arttı. Etkileşim puanı değişmedi. Temel neden değil.
Oturum B: Evren 7'ye ek mekanikler eklendi. Sonuç: oturum süresi 5 dakika arttı. Etkileşim puanı arttı. Kısmi neden belirlendi.
Oturum C: Karar yoğunluğunu daha eşit bir şekilde dağıtmak için mevcut mekanikler yeniden sıralandı. Sonuç: Oturum süresi 6 dakika arttı VE katılım puanı önemli ölçüde arttı. Temel neden belirlendi; evrenin sonundaki mekanik kümelenme aceleye getirilmiş sonlara neden oldu.

Her değişikliği ayrı ayrı test etmeseydik, C oturumunun içgörüsü (mekanik kümeleme sorunu) görünmez olurdu. B+C'nin birleşik değişimi "mekanik eklemenin faydası oldu" gibi görünebilirdi, oysa asıl düzeltme zaten orada olanı yeniden düzenlemekti.

Yaygın hata: "Yalnızca iki küçük şeyi" değiştirdiğiniz bir oturum yürütmek. Birbirine bağımlı mekaniği olan bir oyunda küçük bir değişiklik yoktur. Her değişiklik potansiyel olarak bir değişkendir. Oturum başına bir tane taahhüt edin.

Karma Deneyim Gruplarıyla Test

Masa oyunu tasarımındaki en zorlu denge mücadelesi grup dengesi veya gelir ölçeklendirmesi değildir; deneyimli oyuncuların aynı oturumda yeni oyunculara önemsiz bir şekilde hükmetmemesini sağlamaktır. Çoğu oyun tasarımcısı bunu tamamen görmezden gelir ve ailelerini ve sıradan izleyicilerini kaybeder.

Neutronium: Parallel Wars için MEQA Uyarlanabilirlik sütunu, karma deneyim oturumlarındaki kazanma oranlarını açıkça izledi. Sorunu çözmeden önce deneyimli oyuncular karma grup oturumlarının %78'ini kazandı; bu, yeni oyuncuların 2. oturuma geri dönmesini engelleyecek ciddi bir dengesizlik.

Çözüm, Progress Journal handikap sistemiydi: daha önce bir evren kazanan deneyimli oyuncular, deneyim avantajlarıyla orantılı negatif bir Nn bakiyesiyle başlar. Kalibrasyon MEQA oturum verilerinden geldi:

Oynatılan Oturumlar (deneyimli oyuncu)	Başlangıç Handikapı	Handikap Sonrası Kazanma Oranı (exp.oyuncu)
1–3 oturum	−5 Nn	%54
4–7 oturum	−10 Nn	%52
8+ oturum	−15 Nn	%51

Deneyimli-yeni kazanma oranı hedefi %55-65'tir. %55'in altında anlamlı bir beceri ifadesi olmadığı anlamına gelir; deneyimli oyuncuların bilgilerinden hiçbir avantajı yoktur. %65'in üzerinde yeni oyuncu deneyiminin fiilen bozulduğu anlamına gelir; alınan kararlar ne olursa olsun rekabet edemezler.

Verilerdeki deneyim boşluklarını belirleme: Galibiyet/mağlubiyet verilerinin yanı sıra her oyuncu için oturum sayısını takip edin. 10 oturuma sahip bir oyuncu, 2 oturuma sahip oyunculara karşı oyunların %75'ini kazanıyorsa handikap kalibrasyonunun ayarlanması gerekir veya mekaniklerin kendisi çok hızlı bir şekilde birleşen geri dönüşü olmayan avantajlar yaratıyordur.

Neutronium'teki "12 oturumluk uçurum": Ev sahibi oyuncular 12'den fazla oturum biriktirdikten sonra, oyuna ilk kez katılan yeni oyuncular için oyuna erişilemez hale geldi. Mekanik bilgi açığı normal oyunla başa çıkamayacak kadar büyüktü. Düzeltme: Deneyim farkını görünür hale getiren ve orantılı bir düzeltme uygulayan İlerleme Günlüğü sistemi. Özellikle 12 oturumluk uçurumu gösteren veriler olmasaydı, bu sorun "12 oturumluk sunucularla 1. oturumdaki yeni oyuncuların %23 kazanma oranına sahip olması" yerine "yeni oyuncuların geri gelmemesi" şeklinde ortaya çıkacaktı.

Oyun Testi Ne Zaman Durdurulmalı

Masa oyunu geliştirmede en yaygın hatalardan biri, süresiz olarak oyun testi yapmaktır; nakliyeden kaçınmak için "hala oyun testi yapıyoruz" ifadesini kullanmak. Bu katılık görünümüne bürünmüş bir korku tepkisidir. Bir noktada veriler size işinizin bittiğini söyler.

azalan getiri testi: ardışık üç oyun testi oturumu eyleme geçirilebilir veri noktası üretmiyorsa (hiçbir ölçüm QC eşiğini geçmiyorsa, hiçbir yeni karışıklık olayı kaydedilmiyor, hiçbir etkileşim düşüşü tanımlanmıyorsa), oyunun mevcut durumu için oyun testi doygunluğuna ulaşmışsınızdır. Ek oturumlar keşif değil onay sağlıyor.

Neutronium: Parallel Wars'in gemiye hazır olma kriterleri şunlardır:

4 grubun tamamındaki galibiyet oranı eşit olanın %10'u dahilinde (hedef: her biri %25, kabul edilebilir aralık: grup başına %22-28)
Etkileşim puanı, Evren 1-6'daki tüm oturumlarda 5 üzerinden 4'ün üzerinde kalıyor
Evren 1-3'te (temel oyun) art arda 3 oturumda herhangi bir karışıklık olayı kaydedilmedi
Ardışık 3 oturumda %55-65 aralığında karma deneyim kazanma oranı (deneyimli ve yeni)

Ardışık üç oturumda dört kriterin tümü karşılandığında, oyun çalışır durumdadır. Mükemmel değil — "mükemmel" bir oyun için anlamlı bir durum değildir. Gemi durumu, verilerin artık oyuncu deneyimini ölçülebilir bir şekilde değiştirecek iyileştirmeleri tanımlamadığı anlamına gelir.

Sıkça Sorulan Sorular

Bir masa oyununu yayınlamadan önce kaç oyun testi oturumuna ihtiyacınız var?

Düşük karmaşıklığa sahip bir oyun için farklı gruplarla minimum 10-15 oturum. Birden fazla gruba ve derin mekanizmalara sahip karmaşık oyunlar için 30-50'den fazla oturum daha gerçekçidir.Neutronium: Parallel Wars, 25 yıllık gündelik gelişim oyunlarından ayrı olarak 12'den fazla belgelenmiş denge doğrulama oturumu gerçekleştirdi. Sayı, kaliteden daha az önemlidir: Tanımlı metriklere sahip 12 yapılandırılmış oturum, "eğlenceli miydi?" diye sorduğunuz 100 yapılandırılmamış oturumdan daha fazla eyleme geçirilebilir veri üretir

Tasarımcı oyun testlerinde oynamalı mı?

Hayır, rekabetçi denge testi için. Tasarımcının varlığı, oyuncu davranışını iki şekilde değiştirir: Oyuncular, bir kafa karışıklığı olayını kaydetmek yerine tasarımcıya kurallarla ilgili sorular sorar ve oyuncular, eleştirel görünmekten kaçınmak için geri bildirimlerini düzenler. Denge testi için yalnızca gözlemci oturumları çalıştırın; tasarımcı verileri izler, kaydeder ve katılmaz. Tasarımcı sıradan geri bildirim oturumlarında oynayabilir ancak bu oturumlar denge verilerinin birincil kaynağı olmamalıdır.

İyi oyun testi sorularını nasıl yazarsınız?

"Bundan hoşlandınız mı?" sorularından kaçının - çok belirsiz ve olumlu yanıtlara karşı sosyal olarak önyargılı. Spesifik davranışsal sorular kullanın: "Hangi noktada stratejinizin artık geçerli olmadığını hissettiniz?" yakalama mekaniği başarısız olduğunda ortaya çıkar. "Genişlemeden savunmaya geçmeye ne zaman karar verdiniz?" Hız ve basınç dinamiklerini ortaya çıkarır. "Sonuçları açısından en belirsiz olan karar hangisi?" Görünür geri bildirimi olmayan mekanizmaları tanımlar. Davranışsal sorular mekanik sorunları ortaya çıkarır; tercih soruları tema sorunlarını ortaya çıkarmaktadır. Bunlar ayrı kategorilerdir ve ayrı sorulara ihtiyaç duyarlar.

Profesyonel oyun tasarımcıları oyun testi için hangi araçları kullanır?

Uzak oturumlar ve sürüm yönetimi için Masaüstü Simülatörü — fiziksel prototip süresini kaybetmeden oyunun önceki sürümlerine geri dönmenizi sağlar. Google Oturum verilerini izlemeye yönelik sayfalar — 1. oturumdan önce bir şablon oluşturun ve her oturumda aynı sütunları doldurun. Erken fiziksel testler için kağıt prototipler (dijital maketler değil) - fiziksel jetonlar, bileşen işleme hızı, oyun koşulları altında görünürlük ve jetonları fiziksel olarak taahhüt ettiğinizde karar maliyeti hissi dahil olmak üzere dijital maketlerin gizlediği ergonomik sorunları ortaya çıkarır. Daha sonra incelenmek üzere oturum sonrası bilgilendirmelerin ses kayıtları — oyuncular genellikle önemli şeyleri düşünmeden söylerler ve not alan kişi o anda gözden kaçırır.

MEQA Çerçevesinin tamamını okuyun

QC eşikleri, metrik tanımları ve Nuclear Port örnek olay incelemesinin tamamı dahil olmak üzere MEQA metodolojisinin tamamı MEQA Çerçeve makalesinde belgelenmiştir.

MEQA Çerçevesini Okuyun →