Masa Oyunu Oyun Testi Kılavuzu: Dengeyi Bir Profesyonel Gibi Test Etme

25 yıl boyunca Neutronium: Parallel Wars'i geliştirdikten ve 12'den fazla belgelenmiş oyun testi oturumu yürüttükten sonra, size oyun testi ile profesyonel oyun testi arasındaki farkı söyleyebilirim. Arkadaşlarınızdan oyununuzu oynamalarını istemek oyun testi değildir. Masadaki oyununuzla sosyalleşiyor. Profesyonel oyun testi, sistematik denge doğrulamadır; tanımlı ölçümler, tek değişkenli testler, yapılandırılmış veri toplama ve her oturumu bir deneyimden ziyade bir deney olarak ele alma disiplinidir.

Bu kılavuz, pratikte neye benzediğini ele alıyor: bir oturumun nasıl oluşturulacağı, neyin ölçüleceği, belirli denge sorunları kategorilerinin nasıl tanımlanacağı ve — en önemlisi — testlerin ne zaman durdurulup gönderileceği. İlkeler her türlü karmaşık oyun için geçerlidir. Örnekler Neutronium: Parallel Wars'nin 47 mekaniğinden ve 13 evren katmanından alınmıştır; bunlar, burada açıklanan her metodolojinin stres testine tabi tutulması için yeterli karmaşıklığı sağlamıştır.

Oyun Testlerinin Çoğu Neden Başarısız?

Oyun testlerinde en sık yapılan hata: "Eğlenceli miydi?" diye sormak. bir oturumun sonunda. "Eğlence", eyleme geçirilemeyecek kadar geniş kapsamlıdır. Eğlence size hangi tamircinin dengeyi bozduğunu söyleyemez. Eğlence size oturumun hangi noktasında etkileşimin düştüğünü söyleyemez. Eğlence bir teşhis değil, bir sonuçtur.

Bunun yerine belirli metrikleri ölçün: grup başına kazanma oranı, ilk çatışmaya dönüş, oyun ortasında gelir farkı, aşama başına oturum uzunluğu. Bu sayılar size nereye bakmanız gerektiğini söyler. "Eğlence" size daha önce şüphelenmediğiniz hiçbir şeyi söylemez.

Örnek Olay

Nükleer Liman Kartopu — Evren 7

Neutronium: Parallel Wars'deki Nükleer Bağlantı Noktaları üstel gelir üretir: 1 bağlantı noktası tur başına 2 Nn, 10 bağlantı noktası tur başına 220 Nn sağlar. İlk oturumlarda oyun testçileri ekonomiyi "dengesiz hissetmek" olarak tanımladılar. Yararlı değil. Düzeltme ölçüm gerektiriyordu: Evren 6'nın sonundaki lider ile son yer arasındaki gerçek Nn farkı neydi?

MEQA izleme, 7. oturumda lider-son gelir oranının 14:1 olduğunu ortaya çıkardı — lider 6 liman biriktirmişti, arkadaki oyuncular ise 0 liman biriktirmişti. Bu "dengesiz bir duygu" değil. Bu, 5:1 Kalite Kontrol eşiğini aşan ve zorunlu bir tasarım değişikliğini tetikleyen tanımlanmış bir sayıdır. Bu ölçüm olmasaydı, düzeltme bir tahmin olurdu. Bununla birlikte, düzeltme hedeflendi: bağlantı noktalarını savaş sırasında yok edilebilir hale getirmek. Gelir formülü değişmedi. Sorun çözüldü.

Yapılandırılmamış oyun testinin temel başarısızlığı: Tanımlanmış ölçümler olmadan, tasarım sorununu oyuncu uyarlamasından ayırt edemezsiniz. Deneyimli oyuncular bozuk mekanizmalara uyum sağlarlar; kırıklık etrafında stratejiler geliştirirler, bundan şikayet etmeyi bırakırlar ve "oyunun oynanma şekli" gibi görünmesini sağlarlar. Ölçüm, davranışın neyi gizlediğini ortaya çıkarır.

MEQA Çerçevesine Genel Bakış

Neutronium: Parallel Wars için sistematik oyun testi metodolojisi, 25 yıllık yineleme boyunca geliştirilen dört sütunlu bir yapı olan MEQA Çerçevesi'dir. Her sütun farklı bir test ihtiyacı kategorisine hitap ediyor:

M

Ölçülebilirlik

Her oturum, oturum başlamadan önce izlenen tanımlı sayısal metriklere sahiptir. Gelir oranları, kazanma oranları, bölge sayıları, aşama başına oturum uzunluğu. Bunun için bir sayı tanımlayamazsanız test edemezsiniz.

E

Etkileşim

İlerleme hızı evren katmanı başına izlenir. Aşama başına zaman, oyuncuların oyun sonrası geri bildirimden önce nerede ayrıldığını ortaya çıkarır. Genç oyunculardaki dikkat kesintileri ölçülebilir katılım başarısızlıklarıdır.

S

Kalite Kontrolü

Herhangi bir veri toplanmadan önce belirlenen, her ölçüm için tanımlanmış başarılı/başarısız eşikleri. Bir eşiğin aşılması, bir tasarım değişikliğini tetikler; "bir şey ne zaman düzeltilecek kadar bozulur?" sorusundaki öznelliği ortadan kaldırır. soru.

A

Uyarlanabilirlik

Farklı oyuncu grupları genelinde takip edilen metrikler: yaş aralıkları, deneyim seviyeleri, oyuncu sayıları. Deneyimli yetişkinler için dengelenmiş bir tamirci, karma yaş gruplarında feci şekilde başarısız olabilir.

Neutronium: Parallel Wars için kullanılan belirli ölçümler ve QC eşik sistemi de dahil olmak üzere MEQA Çerçeve metodolojisinin tamamı, MEQA Çerçeve: Masa Oyunu Dengesini Test Etmek için Kanıtlanmış Bir Metodoloji adresinde ayrıntılı olarak belgelenmiştir. Bu kılavuz, oturum düzeyindeki pratik uygulamaya odaklanmaktadır.

Oyun Testi Oturumu Ayarlama

Profesyonel oyun testi oturumlarının üç aşaması vardır: oturum öncesi hazırlık, oturum sırasında gözlem ve oturum sonrası yapılandırılmış bilgilendirme. Her aşamanın, çoğu resmi olmayan oyun testinin tamamen atladığı özel gereksinimleri vardır.

Oturum öncesi: Test ettiğiniz tam olarak tek bir mekanik değişikliği tanımlayın. Oyuncular gelmeden önce bunu yazın. "Bugün Nükleer Limanları yok edilebilir hale getirmenin lider-son gelir oranını 5:1'in altına düşürüp düşürmediğini test ediyoruz" diyemiyorsanız, bir oturum düzenlemeye hazır değilsiniz. Hipotez spesifik ve yanlışlanabilir olmalıdır. Doğrudan karşılaştırma için önceki oturumdaki temel metrikleri kaydedin.

Oturum sırasında: OYNAMAYAN bir gözlemci belirleyin. Gözlemcinin görevi şunları kaydetmektir: aşama başına oturum uzunluğu, tur başına karar süresi (ortalama), kafa karışıklığı veya ayrılma anları, evren başına grup başına kazanç/mağlubiyet durumu. Gözlemci oyuna katılmaz, kuralları açıklamaz ve soruları yanıtlamaz; eğer bir oyuncunun bir sorusu varsa, bu veridir. Kafalarını neyin karıştırdığını ve nedenini kaydedin.

Oturum sonrası bilgilendirme: Maksimum 15 dakika. Yalnızca yapılandırılmış sorular - belirli davranışsal sorgular, "hoşunuza gitti mi?" Kullanılacak tam sorular için SSS bölümüne bakın. Mümkün olduğunda yazılı yanıtlar toplayın. Sözlü yanıtlar ayrıntıları kaybeder ve sosyal önyargıya neden olur (oyuncular doğrudan tasarımcıya olumsuz şeyler söylemek konusunda isteksizdir).

İstisnasız her oturumda toplanacak veriler:

Denge Sorunlarını Tanımlama

Denge sorunları beş kategoriye ayrılır ve her biri verilerde farklı bir sinyale sahiptir:

Kaçak lider: Signal — Lider oyuncu, Evren 5'ten sonra 4 oturumun 3'ünde hiç kaybetmedi. Eşik: Lider, Evren 4'te tuttuğu bir konumdan oturumların %70'inden fazlasında kazanırsa oyun etkin bir şekilde Evren 4'te sona erer. Evren 1-4'teki gelir ve bölge mekanizmalarını araştırın.

Analiz felci: Sinyal — evrenler karar karmaşıklığının gerektirdiğinden daha hızlı ilerledikçe tur başına ortalama karar süresi artar. Evren 3'te ortalama 5 dakikalık bir dönüşün, yalnızca 2 yeni mekaniğin eklendiği Evren 6'da ortalama 20 dakikalık bir dönüşe dönüşmesi, bir karmaşıklık sorunu değil, mekanik bir etkileşim sorunu olduğunu gösteriyor. Hangi spesifik kararların en çok zaman aldığını araştırın.

Grup hakimiyeti: Sinyal — 5 veya daha fazla testte oturumların %60 veya daha fazlasını kazanan tek bir grup. Dengeli bir 4 gruplu oyunda beklenen kazanma oranı yaklaşık %25'tir. %60 ile grup sadece daha iyi olmakla kalmıyor, aynı zamanda diğer grupların daha iyi oyunla üstesinden gelemeyeceği yapısal bir avantaja da sahip. Öngörülemeyen etkileşim etkileri açısından baskın grubun benzersiz mekanizmalarını araştırın.

Etkileşim düşüşü: Sinyal — oyuncuların belirli bir evrende pasif hale gelmesi veya gözle görülür şekilde bağlantısının kesilmesi. Gözlemlenebilir davranış: Oyuncular telefonlarını kontrol ediyor, oyun alanından uzaklaşıyor ve "sıra bana ne zaman?" diye soruyor. Bunlar ölçülebilir olaylardır. Ne zaman meydana geldiklerini ve hangi evrenin devam ettiğini kaydedin.

Örnek Olay — Grup Hakimiyeti

Evren 6+'da Ekonomi Dengesizliği

Ekonomi grubu Iit, Nükleer Liman gelir birikimi nedeniyle Evren 6 ve üzeri 10 oturumdan 7'sini kazandı. Veriler açıktı: Kazanma oranı %70, beklenen %25'in 4 kat üzerinde. Tek değişken kuralı izlenerek oturum başına bir tane olmak üzere üç düzeltme test edildi.

Test 1: Nükleer Liman gelir değerlerini azaltın. Sonuç — Kazanma oranı kabul edilebilir aralıkta %28'e düştü. Sorun: Iit oyuncuları, bağlantı noktası değerinin azalması nedeniyle grubun "boş" hissettiğini bildirdi. Ekonomi kimliği yok edildi. Geri alma.

Test 2: Oyuncu başına Nükleer Bağlantı Noktası sayısını sınırlayın. Sonuç — Kazanma oranım %35, dengeye daha yakın. Sorun: Oyunun sonlarında oyun ekonomik yükselme dinamiğini kaybetti. Diğer gruplar ölçeklenemediğinde daha az ilgi çekici kararlar bildirdiler. Geri alma.

Test 3: Nükleer Bağlantı Noktalarını savaş sırasında yok edilebilir hale getirin. Sonuç — Kabul edilebilir aralıkta kazanma oranım %31. Diğer gruplar üzerinde olumsuz bir etkisi yok. Liman geliri formülü değişmedi; ekonomik kimlik korundu. Düzeltme onaylandı.

Tek Değişkenli Kural

Tek değişken kuralı, denge testlerinde en önemli ve en sık ihlal edilen prensiptir. Kural: Oturumlar arasında tam olarak tek bir şeyi değiştirin.

Bunun nedeni teşhisin netliğidir. Eğer üç mekaniği değiştirirseniz ve oyun gelişirse, bunun hangi değişiklikten kaynaklandığını bilemezsiniz. Bir sorunu çözmüş ve henüz ortaya çıkmamış iki tane daha yaratmış olabilirsiniz. Bir semptomu düzeltmiş ve temel nedeni yerinde bırakmış olabilirsiniz. Bilemezsiniz çünkü aynı anda üç şeyi değiştirdiniz.

Neutronium: Parallel Wars'ye uygulandı: Evren 7'nin "çok hızlı" olduğu, yani oturumların beklenenden kısa sürdüğü ve oyuncuların aceleye geldiği hissine kapıldığı durumlarda, ayrı oturumlarda üç olası neden araştırıldı:

Her değişikliği ayrı ayrı test etmeseydik, C oturumundaki bilgiler (mekanik kümeleme sorunu) görünmez olurdu. B+C'nin birleşik değişikliği, "mekanik eklemenin işe yaradığı" gibi görünebilirdi, halbuki asıl düzeltme zaten orada olanı yeniden düzenlemekti.

Yaygın hata: "Yalnızca iki küçük şeyi" değiştirdiğiniz bir oturum yürütmek. Birbirine bağımlı mekaniği olan bir oyunda küçük bir değişiklik yoktur. Her değişiklik potansiyel olarak bir değişkendir. Oturum başına bir tane taahhüt edin.

Karma Deneyim Gruplarıyla Test Etme

Masa oyunu tasarımındaki en zorlu denge mücadelesi grup dengesi veya gelir ölçeklendirmesi değildir; deneyimli oyuncuların aynı oturumda yeni oyunculara önemsiz bir şekilde hükmetmemesini sağlamaktır. Çoğu oyun tasarımcısı bunu tamamen görmezden geliyor ve ailelerini ve sıradan izleyicilerini kaybediyor.

Neutronium: Parallel Wars için MEQA Uyarlanabilirlik sütunu, karma deneyim oturumlarındaki kazanma oranlarını açıkça izledi. Sorunu çözmeden önce, deneyimli oyuncular karma grup oturumlarının %78'ini kazandı; bu, yeni oyuncuların 2. oturuma geri dönmesini engelleyecek ciddi bir dengesizlikti.

Çözüm İlerleme Günlüğü handikap sistemi oldu: Daha önce bir evren kazanan deneyimli oyuncular, deneyim avantajlarıyla orantılı olarak negatif bir Nn bakiyesiyle başlıyor. Kalibrasyon MEQA oturum verilerinden geldi:

Oynatılan Oturumlar (deneyimli oyuncu) Başlangıç Handikapı Handikap Sonrası Kazanma Oranı (tecrübeli oyuncu) 1–3 seans−5 Nn%54 4–7 seans−10 Nn%52 8+ oturum−15 Nn%51

Deneyimli-yeni kazanma oranı hedefi %55-65'tir. %55'in altında anlamlı bir beceri ifadesi olmadığı anlamına gelir; deneyimli oyuncuların bilgilerinden hiçbir avantajı yoktur. %65'in üzerinde olması, yeni oyuncu deneyiminin fiilen bozulduğu anlamına gelir; alınan kararlar ne olursa olsun rekabet edemezler.

Verilerdeki deneyim boşluklarını belirleme: Galibiyet/mağlubiyet verilerinin yanı sıra her oyuncu için oturum sayısını takip edin. 10 oturuma sahip bir oyuncu, 2 oturuma sahip oyunculara karşı oyunların %75'ini kazanıyorsa handikap kalibrasyonunun ayarlanması gerekir veya mekaniklerin kendisi çok hızlı bir şekilde birleşen geri dönüşü olmayan avantajlar yaratıyordur.

Neutronium'deki "12 oturumluk uçurum": Ev sahibi oyuncular 12'den fazla oturum biriktirdikten sonra, oyuna ilk kez katılan yeni oyuncular için oyuna erişilemez hale geldi. Mekanik bilgi açığı normal oyunla başa çıkamayacak kadar büyüktü. Düzeltme: Deneyim farkını görünür hale getiren ve orantılı bir düzeltme uygulayan İlerleme Günlüğü sistemi. Özellikle 12 oturumluk uçurumu gösteren veriler olmasaydı, bu sorun "12 oturumluk sunucularla 1. oturumdaki yeni oyuncuların %23 kazanma oranına sahip olması" yerine "yeni oyuncuların geri gelmemesi" şeklinde ortaya çıkacaktı.

Oyun Testi Ne Zaman Durdurulmalı

Masa oyunu geliştirmede en yaygın hatalardan biri süresiz olarak oyun testi yapmaktır; gönderimden kaçınmak için "hala oyun testi yapıyoruz" ifadesini kullanmak. Bu katılık görünümüne bürünmüş bir korku tepkisidir. Bir noktada veriler size işinizin bittiğini söyler.

Azalan getiri testi: Art arda üç oyun testi oturumu eyleme geçirilebilir veri noktası üretmiyorsa (hiçbir ölçüm QC eşiğini geçmiyorsa, yeni karışıklık olayları kaydedilmiyorsa, etkileşimde herhangi bir düşüş tanımlanmıyorsa) oyunun mevcut durumu için oyun testi doygunluğuna ulaşmışsınızdır. Ek oturumlar keşif değil onay sağlıyor.

Neutronium: Parallel Wars'nin gemiye hazırlık kriterleri şunlardır:

  1. 4 grubun tümünde kazanma oranı eşit olanın %10'u dahilindedir (hedef: her biri %25, kabul edilebilir aralık: grup başına %22-28)
  2. Etkileşim puanı, Evren 1-6'daki tüm oturumlarda 5 üzerinden 4'ün üzerinde kalıyor
  3. Evren 1-3'te (ana oyun) art arda 3 oturumda herhangi bir karışıklık olayı kaydedilmedi
  4. Karma deneyim kazanma oranı (deneyimli ve yeni) ardışık 3 oturumda %55-65 aralığında

Dört kriterin tümü birbirini takip eden üç oturumda karşılandığında oyun çalışır durumdadır. Mükemmel değil — "mükemmel" bir oyun için anlamlı bir durum değildir. Gönderim durumu, verilerin artık oyuncu deneyimini ölçülebilir bir şekilde değiştirecek iyileştirmeleri tanımlamadığı anlamına gelir.

Sık Sorulan Sorular

Bir masa oyununu yayınlamadan önce kaç oyun testi oturumuna ihtiyacınız var?
Düşük karmaşıklığa sahip bir oyun için farklı gruplarla minimum 10–15 oturum. Birden fazla gruba ve derin mekanizmalara sahip karmaşık oyunlar için 30-50'den fazla oturum daha gerçekçidir. Neutronium: Parallel Wars, 25 yıllık gündelik gelişim oyunlarından ayrı olarak, 12'den fazla belgelenmiş denge doğrulama oturumu gerçekleştirdi. Sayı, kaliteden daha az önemlidir: Tanımlı metriklere sahip 12 yapılandırılmış oturum, "eğlenceli miydi?" diye sorduğunuz 100 yapılandırılmamış oturumdan daha fazla işlem yapılabilir veri üretir.
Tasarımcı oyun testlerinde oynamalı mı?
Hayır, rekabetçi denge testi için. Tasarımcının varlığı, oyuncu davranışını iki şekilde değiştirir: Oyuncular, bir kafa karışıklığı olayını kaydetmek yerine tasarımcıya kurallarla ilgili sorular sorar ve oyuncular, eleştirel görünmekten kaçınmak için geri bildirimlerini düzenler. Denge testi için yalnızca gözlemci oturumları çalıştırın; tasarımcı verileri izler, kaydeder ve katılmaz. Tasarımcı sıradan geri bildirim oturumlarında oynayabilir ancak bu oturumlar denge verilerinin birincil kaynağı olmamalıdır.
İyi oyun testi sorularını nasıl yazarsınız?
"Bundan hoşlandınız mı?" sorusundan kaçının. - çok belirsiz ve olumlu yanıtlara karşı sosyal olarak önyargılı. Spesifik davranışsal sorular kullanın: "Hangi noktada stratejinizin artık geçerli olmadığını hissettiniz?" yakalama mekaniği başarısız olduğunda ortaya çıkar. "Genişlemeden savunmaya geçmeye ne zaman karar verdiniz?" Hız ve basınç dinamiklerini ortaya çıkarır. "Sonuçları açısından en belirsiz olan karar hangisi?" Görünür geri bildirimi olmayan mekanizmaları tanımlar. Davranışsal sorular mekanik sorunları ortaya çıkarır; tercih soruları tema sorunlarını ortaya çıkarmaktadır. Bunlar ayrı kategorilerdir ve ayrı sorulara ihtiyaç duyarlar.
Profesyonel oyun tasarımcıları oyun testi için hangi araçları kullanır?
Uzak oturumlar ve sürüm yönetimi için Masaüstü Simülatörü — fiziksel prototip süresini kaybetmeden oyunun önceki sürümlerine geri dönmenizi sağlar. Oturum verilerini izlemek için Google E-Tablolar — 1. oturumdan önce bir şablon oluşturun ve her oturumda aynı sütunları doldurun. Erken fiziksel testler için kağıt prototipler (dijital maketler değil) - fiziksel jetonlar, bileşen işleme hızı, oyun koşulları altında görünürlük ve jetonları fiziksel olarak taahhüt ettiğinizde karar maliyeti hissi dahil olmak üzere dijital maketlerin gizlediği ergonomik sorunları ortaya çıkarır. Daha sonra incelenmek üzere oturum sonrası bilgilendirmelerin ses kayıtları; oyuncular genellikle önemli şeyleri düşüncesizce söylerler ve not alan kişi o anda gözden kaçırır.

MEQA Çerçevesinin Tamamını Okuyun

Tam MEQA metodolojisi (KK eşikleri, metrik tanımları ve tam Nükleer Liman örnek olay incelemesi dahil) MEQA Çerçeve makalesinde belgelenmiştir.

MEQA Çerçevesini okuyun →