Usaha untuk mencipta tingkah laku kawanan yang realistik dalam permainan telah lama mencabar pembangun, tetapi model bahasa AI kini menunjukkan keupayaan yang mengagumkan dalam pembangunan permainan. Satu eksperimen terbaru telah mencabar pelbagai model AI untuk mencipta permainan menggembalakan biri-biri yang dipanggil Shepherd's Dog dalam satu percubaan sahaja, dengan Claude 3.7 muncul sebagai pemenang yang jelas.
Konsep di sebalik Shepherd's Dog adalah ringkas tetapi menarik: pemain mengawal seekor anjing untuk menggembalakan biri-biri ke dalam kandang sebelum matahari terbenam. Apa yang menjadikan permainan ini menarik ialah tingkah laku kawanan biri-biri yang realistik, yang mesti menunjukkan dinamik kumpulan yang autentik sambil bertindak balas terhadap kehadiran anjing dan mengemudi di sekitar halangan.
Model AI Menunjukkan Tahap Kejayaan yang Berbeza
Claude 3.7 mendominasi pertandingan dengan skor 24/28, mencipta apa yang digambarkan oleh ramai pengguna sebagai permainan yang benar-benar menyeronokkan dengan pergerakan biri-biri yang natural. Versi Claude bahkan menganimasikan peralihan matahari terbenam tanpa diarahkan secara khusus untuk berbuat demikian. Seorang pemain menyatakan bahawa permainan tersebut terasa seperti permainan mudah alih pada zaman awal iPhone dalam kesederhanaan dan daya tarikannya.
Model lain menunjukkan hasil yang bercampur-campur. O3-mini dari Anthropic mendapat skor 16/28, melaksanakan algoritma boids klasik untuk tingkah laku kawanan. Walaupun secara teknikal mengagumkan, beberapa pengguna menyatakan bahawa pendekatan ini tidak terasa sepenuhnya natural untuk biri-biri kerana algoritma boids mengekalkan pergerakan yang berterusan, sedangkan biri-biri sebenar boleh kekal tidak bergerak.
Di bahagian bawah carta kedudukan, model seperti Deepseek gagal menghasilkan JavaScript yang sah, manakala GPT-4o dan Gemini Pro masing-masing mendapat hanya 4/28 mata, dengan ciri-ciri terhad dan masalah fungsi.
Papan Pendahulu Model AI untuk Permainan Anjing Gembala
Model | Skor | Catatan |
---|---|---|
Claude 3.7 | 24/28 | Demo yang sangat mengagumkan, kurang beberapa dinamik halangan |
o3-mini | 16/28 | Kurang beberapa ciri, tetapi mempunyai kawanan & permainan yang baik |
o1 Pro | 12/28 | Serupa dengan o3-mini |
Mistral | 12/28 | Pengembalaan tidak dilaksanakan dengan betul |
GPT-4o | 4/28 | Ciri-ciri terhad, model tidak mahu meneruskan |
Gemini Pro | 4/28 | Sukar kerana biri-biri tidak kekal dalam kandang |
Deepseek | 0/28 | JavaScript tidak sah |
Cursor | 0/28 | Mengagumkan tetapi mungkin tidak layak sebagai "one-shot" |
Algoritma Kawanan: Teras Cabaran
Cabaran utama dalam mencipta permainan ini terletak pada pelaksanaan tingkah laku kawanan yang realistik. Banyak model AI menggunakan algoritma boids secara lalai, satu pendekatan terkenal untuk mensimulasikan tingkah laku kawanan yang dibangunkan pada tahun 1980-an. Walau bagaimanapun, seperti yang ditunjukkan oleh seorang pengulas, boids mungkin tidak ideal untuk simulasi biri-biri:
Nampaknya o3-mini melaksanakan algoritma 'boids' untuk kawanan (mungkin kerana prevalensinya dalam talian), tetapi saya dapati di sini ia tidak benar-benar sesuai. Memang dalam boids setiap elemen mempunyai halaju yang tetap (atau minimum), sehingga biri-biri tidak pernah berhenti 'berlari'. Saya dapati tingkah laku kawanan Claude kelihatan lebih natural, untuk biri-biri.
Pandangan ini menekankan bagaimana pelaksanaan Claude 3.7 berjaya mencipta tingkah laku mamalia yang lebih realistik dengan membolehkan biri-biri mempunyai kelajuan minimum sifar—perbezaan halus tetapi penting yang menjadikan simulasinya terasa lebih autentik.
Penglibatan Komuniti dan Penambahbaikan
Respons komuniti terhadap permainan yang dihasilkan oleh AI ini telah menggalakkan, dengan beberapa pengguna berkongsi versi mereka sendiri atau mencadangkan penambahbaikan. Seorang pengguna mencipta versi yang dipertingkatkan menggunakan beberapa model AI secara kombinasi, menunjukkan bagaimana panduan manusia boleh membantu memperbaiki kod yang dihasilkan oleh AI.
Beberapa pengguna menyatakan isu kebolehgunaan yang akan mendapat manfaat daripada penghalusan manusia, seperti peta yang terlalu besar pada desktop atau biri-biri yang terperangkap di sudut. Pemerhatian ini menekankan bahawa walaupun AI boleh mencipta permainan yang berfungsi dalam satu percubaan, ujian permainan dan pengulangan oleh manusia masih penting untuk menggilap pengalaman tersebut.
Menariknya, beberapa pengulas menyebut bahawa mereka sebelum ini telah cuba mencipta permainan serupa sendiri, menunjukkan bahawa konsep menggembalakan biri-biri mempunyai daya tarikan yang luas di kalangan pembangun permainan. Cabaran untuk mendapatkan tingkah laku kawanan yang tepat nampaknya menjadi halangan umum yang dihadapi oleh ramai orang.
Eksperimen ini menunjukkan kemajuan pesat keupayaan pengkodan AI sambil juga mendedahkan had semasa mereka. Sebagai ciptaan satu percubaan tanpa maklum balas atau pengulangan, permainan ini mewakili pencapaian teknikal yang mengagumkan, tetapi mereka masih mendapat manfaat daripada penghalusan manusia untuk mencapai potensi penuh mereka.
Bagi mereka yang berminat untuk mencuba permainan yang dicipta oleh AI ini, permainan tersebut boleh didapati melalui pratonton HTML GitHub, walaupun beberapa pengguna melaporkan amaran keselamatan daripada pelayar tertentu—halangan yang tidak dijangka untuk apa yang pada asasnya adalah permainan HTML/JavaScript ringkas yang dihoskan di GitHub Pages.
Rujukan: Konsep Permainan Shepherd's Dog dan Carta Kedudukan AI