Pengumuman terbaru mengenai Kimi k1.5, sebuah model AI multi-modal baharu yang mendakwa mempunyai keupayaan penaakulan terkini, telah mencetuskan perbincangan dalam komuniti AI mengenai amalan pelepasan model dan perkembangan landskap pembangunan AI. Walaupun model ini menunjukkan metrik prestasi yang mengagumkan, maklum balas komuniti menyoroti kebimbangan yang semakin meningkat tentang ketelusan dan kebolehcapaian dalam penyelidikan AI.
Tuntutan Prestasi Utama:
- Skor AIME : 77.5
- Skor MATH 500: 96.2
- Codeforces : Persentil ke-94
- Skor MathVista : 74.9
Keupayaan Model:
- Tetingkap konteks: 128k
- Multi-modal: Teks dan visual
- Penaakulan Short-CoT dan Long-CoT
Kebangkitan Makmal AI China
Kemunculan Kimi k1.5, bersama-sama dengan perkembangan terbaru seperti DeepSeek-R1, memperlihatkan kemajuan pesat makmal-makmal AI China dalam perlumbaan AI global. Perbincangan komuniti menunjukkan trend menarik dalam pembangunan AI China, terutamanya dalam pendekatan mereka terhadap kecekapan dan pengoptimuman. Seperti yang dinyatakan oleh salah seorang ahli komuniti:
Tidak mengejutkan bahawa negara yang mempunyai 20% daripada populasi dunia mempunyai ramai orang pintar. Yang menarik adalah bagaimana China telah memberi tumpuan untuk melakukan lebih banyak dengan sumber yang terhad - kedudukan mereka sebagai underdog dari segi perkakasan telah mendorong fokus besar terhadap kecekapan model dan penyulingan, yang memberi manfaat kepada kita semua.
Perbahasan API-First vs Sumber Terbuka
Satu isu yang menjadi pertikaian dalam komuniti berkisar tentang strategi pelepasan model. Walaupun Kimi k1.5 menjanjikan akses API melalui OpenPlatform mereka, ramai penyelidik dan pembangun menyuarakan kekecewaan terhadap trend syarikat yang menggunakan repositori GitHub terutamanya untuk tujuan promosi berbanding berkongsi kod sebenar atau pemberat model. Amalan ini telah mencetuskan perbahasan tentang ketelusan dan kebolehulangan dalam penyelidikan AI.
Gambar rajah yang memaparkan Sistem Latihan Pembelajaran Pengukuhan untuk LLM, menonjolkan proses-proses yang terlibat dalam penskalaan dan kecekapan yang berkaitan dengan strategi pelancaran model |
Dokumentasi dan Amalan Pelepasan
Komuniti telah membangkitkan kebimbangan tentang corak syarikat-syarikat AI, terutamanya dari China, yang menggunakan repositori GitHub sebagai platform pemasaran berbanding repositori sumber terbuka sebenar. Pengkritik menyatakan bahawa repositori ini sering hanya mengandungi fail README dan dokumentasi API sahaja, yang membawa kepada seruan untuk pelabelan yang lebih jelas tentang jenis kandungan repositori dan amalan pelepasan yang lebih telus.
Kesan kepada Komuniti Penyelidikan AI
Walaupun terdapat kontroversi mengenai format pelepasannya, sumbangan teknikal Kimi k1.5, terutamanya dalam meningkatkan panjang konteks dan kecekapan pembelajaran pengukuhan, diiktiraf sebagai berpotensi berharga untuk bidang ini. Prestasi model yang dilaporkan dalam pelbagai penanda aras, termasuk AIME dan MATH-500, menunjukkan kemajuan ketara dalam keupayaan penaakulan AI, walaupun komuniti tetap berhati-hati tentang dakwaan tersebut sehingga pengesahan bebas dapat dilakukan.
Situasi ini mencerminkan ketegangan yang lebih luas dalam bidang AI antara kepentingan komersial dan keterbukaan akademik, menyoroti keperluan untuk piawaian yang lebih jelas dalam cara model AI baharu dipersembahkan dan dikongsi dengan komuniti penyelidikan.
Rujukan: Kimi k1.5: Scaling Reinforcement Learning with LLMs