Dalam acara pelancaran yang dinanti-nantikan yang menarik lebih sejuta penonton, xAI milik Elon Musk telah memperkenalkan Grok-3, model kecerdasan buatan terbaru mereka. Walaupun mendakwa sebagai AI terpintar di dunia, keputusan prestasi sebenar telah mencetuskan perbincangan penting tentang hala tuju pembangunan AI dan pulangan yang semakin berkurangan daripada pelaburan pengkomputeran besar-besaran.
Pelancaran dan Tuntutan Prestasi
Grok-3 menandakan pencapaian penting sebagai model pertama yang memecahkan halangan 1400 mata pada papan pendahulu Chatbot Arena. Model ini menunjukkan keupayaan yang lebih tinggi dalam matematik, penaakulan saintifik, dan pengaturcaraan berbanding model arus perdana semasa. Visi bercita-besar Musk merangkumi penggunaan Grok-3 untuk pengiraan misi SpaceX ke Marikh dan meramalkan penemuan bertaraf Hadiah Nobel dalam tempoh tiga tahun.
Metrik Prestasi:
- Skor Arena Chatbot: 1402 mata (yang pertama mencapai 1400)
- Peningkatan prestasi berbanding pesaing: 1-2%
- Garis masa pembangunan: 122 hari untuk 100,000 GPU pertama, 92 hari untuk kumpulan kedua
![]() |
---|
Grok-3 bertujuan untuk membantu dalam pengiraan misi SpaceX ke Marikh, dengan graf yang menunjukkan potensi penggunaannya dalam perjalanan angkasa lepas |
Pelaburan Pengkomputeran Besar-besaran
Pembangunan Grok-3 memerlukan sumber pengkomputeran yang belum pernah terjadi sebelum ini, menggunakan 200,000 GPU NVIDIA H100. Ini mewakili peningkatan kuasa pengkomputeran sebanyak 263 kali ganda berbanding DeepSeek V3, yang menggunakan hanya 2,000 GPU H800 selama dua bulan. Untuk menyokong infrastruktur besar ini, xAI telah menandatangani perjanjian bernilai 5 bilion dolar Amerika dengan Dell untuk pelayan yang dioptimumkan untuk AI yang dilengkapi dengan cip NVIDIA GB200.
Perbandingan Sumber Pengkomputeran:
- Grok-3 : 200,000 GPU NVIDIA H100
- DeepSeek V3 : 2,000 GPU H800
- Nisbah kuasa latihan: 263:1
Semakan Realiti Prestasi
Walaupun pelaburan pengkomputeran yang sangat besar, kelebihan prestasi Grok-3 kelihatan sederhana. Ujian awal mendedahkan model ini menghadapi masalah dengan tugas penaakulan asas, seperti membandingkan nombor (9.11 berbanding 9.9) tanpa konteks, dan masalah fizik asas. Peningkatan prestasi sebenar berbanding pesaing seperti DeepSeek R1 dan GPT-4 hanya mencapai 1-2% dalam ujian penanda aras.
Implikasi Industri
Pelancaran Grok-3 telah menyoroti titik perubahan kritikal dalam pembangunan AI. Ramalan bekas ketua saintis OpenAI, Ilya Sutskever, bahawa pra-latihan seperti yang kita kenali akan berakhir kelihatan semakin relevan. Industri menghadapi cabaran dengan pengurangan data latihan berkualiti dan pulangan yang semakin berkurangan daripada pelaburan pengkomputeran besar-besaran, mencadangkan keperluan pendekatan baharu untuk mencapai kecerdasan buatan umum (AGI) yang sebenar.
Pelaburan Infrastruktur:
- Nilai perjanjian Dell: USD $5 bilion
- Perkakasan: Pelayan dilengkapi cip NVIDIA GB200
- Garis masa pelaksanaan: Sepanjang 2025
![]() |
---|
Perbahasan antara perisian sumber tertutup dan sumber terbuka menunjukkan keperluan untuk pendekatan inovatif dalam landskap AI yang berkembang seperti yang ditonjolkan oleh pelancaran Grok-3 |
Akses dan Ketersediaan
xAI menjadikan Grok-3 tersedia terlebih dahulu kepada pelanggan X Premium Plus, dengan rancangan untuk melancarkan perkhidmatan langganan Super Grok yang berasingan. Syarikat ini juga telah komited untuk menjadikan versi Grok terdahulu sebagai sumber terbuka sebaik sahaja versi terbaru matang sepenuhnya, menunjukkan keseimbangan antara kepentingan komersial dan sumbangan komuniti.