Grok 3 Dikritik Kerana Kesalahan Matematik Asas dan Kelemahan Keselamatan

BigGo Editorial Team
Grok 3 Dikritik Kerana Kesalahan Matematik Asas dan Kelemahan Keselamatan

Dalam perkembangan terbaru yang menarik perhatian komuniti AI, model bahasa terbaru xAI iaitu Grok 3 telah menghadapi cabaran besar sejurus selepas pelancarannya yang berprofil tinggi. Walaupun terdapat dakwaan yang tinggi tentang keunggulannya, model ini telah menerima kritikan terhadap kedua-dua keupayaan prestasi dan langkah-langkah keselamatannya.

Isu Prestasi Muncul

Pasukan xAI Elon Musk memperkenalkan Grok 3 dengan dakwaan berani tentang keupayaannya, terutamanya dalam matematik, sains, dan pengaturcaraan. Walau bagaimanapun, ujian awal mendedahkan beberapa kelemahan yang membimbangkan. Model ini menghadapi masalah dengan perbandingan nombor asas, terutamanya gagal menentukan sama ada 9.11 lebih besar daripada 9.9. Kesilapan asas ini telah menimbulkan kebimbangan dalam kalangan pakar teknologi dan pengguna, terutamanya memandangkan sumber yang besar telah dilaburkan dalam pembangunannya.

Pembangunan Yang Memerlukan Sumber Besar

Pembangunan Grok 3 melibatkan sumber pengkomputeran yang sangat besar, menggunakan lebih 200,000 cip H100 dengan jumlah tempoh latihan 200 juta jam. Ini sangat berbeza dengan pesaing seperti DeepSeek V3, yang mencapai prestasi setanding dengan hanya menggunakan 2,000 cip H800 dan masa latihan dua bulan. Perbezaan dalam kecekapan penggunaan sumber ini telah menimbulkan persoalan tentang keberkesanan kos dan pendekatan pembangunannya.

Kelemahan Keselamatan Terdedah

Dalam masa 24 jam selepas pelancarannya, firma keselamatan Adversa AI berjaya menembusi Grok 3, mendedahkan kelemahan keselamatan yang ketara. Pasukan ini menggunakan pelbagai kaedah - pendekatan linguistik, adversarial, dan pengaturcaraan - untuk memintas langkah-langkah keselamatan model. Pelanggaran ini membolehkan model tersebut mendedahkan maklumat sensitif dan menghasilkan kandungan yang berpotensi berbahaya, menimbulkan kebimbangan serius tentang protokol keselamatannya.

Langkah Keselamatan Terhad

Tidak seperti pesaingnya seperti Google dan OpenAI, yang melaksanakan langkah keselamatan yang kukuh, Grok 3 sengaja direka dengan sekatan yang lebih sedikit. Pilihan reka bentuk ini, digabungkan dengan data latihannya yang bersumber dari X (dahulunya Twitter) di mana moderasi kandungan telah dikurangkan, telah menghasilkan model yang mungkin menghasilkan respons yang lebih kontroversi dan berpotensi berisiko.

Perkembangan Masa Hadapan

Sebagai tindak balas kepada kritikan tersebut, Musk telah mengakui bahawa versi semasa masih dalam beta, dan menjanjikan pelancaran lengkap dalam beberapa bulan akan datang. Syarikat ini juga menunjukkan keterbukaan terhadap maklum balas pengguna, mencadangkan komitmen untuk menangani kelemahan awal ini. Walau bagaimanapun, insiden-insiden ini telah menimbulkan persoalan penting tentang keseimbangan antara keupayaan AI, keselamatan, dan pembangunan yang bertanggungjawab dalam bidang model bahasa besar yang berkembang pesat.