AMD akhirnya telah mendedahkan penanda aras prestasi untuk pemecut AI Instinct MI300X yang sangat dinantikan, menandakan langkah penting dalam usaha syarikat untuk memasuki pasaran perkakasan AI yang kompetitif. Hasilnya, walaupun menjanjikan, mendedahkan kekuatan dan bidang yang perlu diperbaiki semasa AMD berusaha untuk mencabar dominasi NVIDIA.
Prestasi Kompetitif, dengan Pengecualian
Dalam penanda aras AI MLPerf v4.1, khususnya pada model Llama 2 70B, MI300X menunjukkan prestasi yang hampir setanding dengan GPU H100 NVIDIA:
- Senario pelayan: MI300X sedikit mengatasi H100 (21,028 berbanding 20,605 token/saat)
- Senario luar talian: MI300X sedikit ketinggalan berbanding H100 (23,514 berbanding 24,323 token/saat)
Walaupun keputusan ini menunjukkan keupayaan AMD untuk bersaing, ia datang dengan konteks penting. MI300X mempunyai prestasi teori yang jauh lebih tinggi (2.6 POPS berbanding 1.98 TFLOPS untuk H100) dan kapasiti memori lebih daripada dua kali ganda (192GB berbanding 80GB). Ini menunjukkan AMD mungkin belum sepenuhnya memanfaatkan potensi perkakasan, berkemungkinan disebabkan cabaran pengoptimuman perisian.
Perbandingan penanda aras prestasi antara platform AMD MI300X dan Nvidia H100 |
Spesifikasi Perkakasan
MI300X mengagumkan dengan kehebatan teknikalnya:
- 153 bilion transistor menggunakan proses TSMC 5nm dan 6nm
- 320 unit pengiraan (304 aktif dalam konfigurasi semasa)
- 192GB memori HBM3 dengan lebar jalur 5.3 TB/s
- Sambungan Infinity Fabric generasi keempat
Pandangan ke Hadapan: Cabaran dan Peluang
-
Pengoptimuman Perisian: Tumpukan perisian ROCm AMD akan menjadi penting untuk merapatkan jurang dengan ekosistem CUDA NVIDIA yang matang.
-
Persaingan Akan Datang: GPU H200 dan B200 NVIDIA yang akan datang menjanjikan peningkatan prestasi yang ketara, mengekalkan tekanan terhadap AMD.
-
Kelebihan Memori: Kapasiti memori besar MI300X boleh menjadi pembeza utama untuk mengendalikan model AI yang lebih besar.
-
Penanda Aras Lebih Luas Diperlukan: AMD hanya mengeluarkan keputusan Llama 2 70B setakat ini. Prestasi merentasi keseluruhan suite ujian MLPerf akan memberikan gambaran yang lebih menyeluruh.
-
Perkakasan Generasi Seterusnya: AMD merancang untuk melancarkan MI325X dengan 288GB memori HBM3e pada tahun ini, berpotensi mengatasi NVIDIA dalam kapasiti memori.
Semasa AMD terus memperbaiki perkakasan dan tumpukan perisian AI, persaingan dalam pasaran pemecut AI dijangka akan meningkat. Walaupun MI300X menunjukkan potensi, AMD masih perlu berusaha untuk memanfaatkan sepenuhnya kelebihan perkakasannya dan mencabar kedudukan NVIDIA yang kukuh.
Gambaran keseluruhan promosi Platform AMD Instinct™, menyerlahkan ciri-ciri dan keupayaan canggihnya yang penting untuk pengkomputeran AI |