Intel secara rasmi telah mengumumkan pelancaran pemecut AI Gaudi 3, meletakkannya sebagai alternatif yang lebih murah berbanding GPU H100 NVIDIA yang dominan dalam pasaran kecerdasan buatan yang berkembang pesat.
Gaudi 3 mewakili lompatan besar ke hadapan berbanding pendahulunya, dengan 64 teras pemproses tensor (TPC) dan 8 enjin pendaraban matriks (MME). Setiap pemecut dilengkapi dengan 128GB memori jalur lebar tinggi (HBM2E) dan memberikan prestasi FP8 sehingga 1,856 TFLOPS. Intel telah memperkemaskan seni bina untuk memberi tumpuan kepada operasi FP8 dan BFloat16, yang penting untuk beban kerja AI moden.
Walaupun metrik prestasi mentah Gaudi 3 kurang daripada H100 NVIDIA dalam beberapa aspek, Intel bergantung pada strategi penetapan harganya untuk mendapatkan bahagian pasaran. Syarikat itu mendakwa bahawa Gaudi 3 menawarkan prestasi sehingga 80% lebih baik bagi setiap dolar berbanding H100 untuk model AI tertentu. Intel telah menunjukkan bahawa kit pemecut lapan-Gaudi 3 akan berharga kira-kira $125,000, bersamaan dengan kira-kira $15,625 seunit - perbezaan yang ketara berbanding harga semasa $30,000+ untuk satu unit NVIDIA H100.
Ciri-ciri utama Gaudi 3 termasuk:
- 64 Teras Pemprosesan Tensor (TPC)
- 8 Enjin Pendaraban Matriks (MME)
- 128GB memori HBM2E dengan jalur lebar 3.67 TB/s
- 96MB cache SRAM pada cip
- 24 antara muka rangkaian 200GbE
- 600W TDP
Intel menyatakan peningkatan prestasi yang ketara dalam tugas inferens AI. Untuk model LLaMA 3 8B, Gaudi 3 dikatakan menawarkan peningkatan 9% dalam kelajuan inferens sambil memberikan prestasi 80% lebih baik bagi setiap dolar berbanding H100. Dengan model yang lebih besar seperti LLaMA 70B, Intel mendakwa pemprosesan inferens 19% lebih baik dan dua kali ganda prestasi bagi setiap dolar.
Gaudi 3 akan tersedia dalam pelbagai bentuk, termasuk kad yang serasi dengan OAM dan kad tambahan PCIe. Intel telah bekerjasama dengan pengeluar pelayan utama seperti Dell, HPE, dan Supermicro untuk mengintegrasikan Gaudi 3 ke dalam sistem mereka yang berfokuskan AI. Ketersediaan awan juga dirancang, dengan IBM Cloud dan Intel Tiber Developer Cloud sendiri akan menawarkan sumber Gaudi 3.
Ketika perlumbaan perkakasan AI semakin sengit, strategi Intel dengan Gaudi 3 nampaknya tertumpu pada menyediakan pilihan yang lebih berpatutan untuk organisasi yang ingin menggunakan AI secara besar-besaran. Walau bagaimanapun, dengan seni bina Blackwell NVIDIA yang akan datang, masih belum pasti sama ada kelebihan harga Intel akan cukup untuk menguasai sebahagian besar pasaran pemecut AI.
Ketersediaan umum sistem berasaskan Gaudi 3 dijangka pada suku keempat 2023, dengan beberapa rakan kongsi seperti Dell dan Supermicro mula menghantar seawal Oktober. Pelancaran ini menandakan saat kritikal bagi Intel kerana ia berusaha untuk menegakkan dirinya sebagai pesaing serius dalam ruang perkakasan AI yang didominasi oleh NVIDIA.
Penyelesaian AI serba boleh Intel direka untuk memenuhi keperluan pelbagai industri, meningkatkan kemajuan teknologi merentasi sektor |