Landskap kecerdasan buatan menyaksikan perkembangan penting apabila model AI sumber terbuka DeepSeek menunjukkan keserasian dengan GPU buatan China Moore Threads, yang berpotensi mengurangkan pergantungan pada perkakasan NVIDIA tradisional untuk tugas-tugas inferens AI.
Pencapaian Teknikal
Moore Threads telah berjaya menggunakan model DeepSeek-R1-Distill-Qwen-7B pada kedua-dua kad grafik pelanggan MTT S80 dan kad grafik gred pusat data MTT S4000. Pelaksanaan ini menggunakan rangka kerja Ollama, iaitu penyelesaian ringan yang direka untuk menjalankan model bahasa besar secara tempatan pada pelbagai sistem operasi, digabungkan dengan pengoptimuman enjin inferens proprietari Moore Threads.
- Harga API DeepSeek: USD 2.2 bagi sejuta token output
- Harga API OpenAI: USD 60 bagi sejuta token output
- Perkakasan yang Disokong: MTT S80 (GPU pelanggan), MTT S4000 (GPU pusat data)
- Sokongan Rangka Kerja: Ollama (MacOS, Linux, Windows)
- Model yang Serasi: DeepSeek-R1-Distill-Qwen-7B
Kesan Pasaran
Perkembangan ini berlaku pada masa yang kritikal ketika DeepSeek sedang membuat kejutan dalam komuniti AI global. Strategi harga syarikat ini sangat agresif, menawarkan perkhidmatan API pada kadar 2.2 dolar Amerika bagi sejuta token output, jauh lebih rendah berbanding kadar OpenAI sebanyak 60 dolar Amerika bagi sejuta token. Syarikat teknologi utama China termasuk Alibaba, ByteDance, Baidu, dan JD Cloud telah mengintegrasikan model DeepSeek ke dalam perkhidmatan awan mereka.
Prestasi dan Integrasi
Walaupun metrik prestasi khusus belum didedahkan, Moore Threads mendakwa hasil yang cemerlang melalui pengoptimuman pengiraan khas dan pengurusan memori yang lebih baik. GPU syarikat ini telah menunjukkan keserasian CUDA, yang sangat bermanfaat untuk aplikasi bahasa Cina. Integrasi ini mewakili langkah penting ke hadapan dalam keupayaan perkakasan AI domestik China.
Implikasi Masa Depan
Kejayaan penggunaan model DeepSeek pada GPU Moore Threads menandakan perubahan yang berpotensi dalam landskap perkakasan AI. Perkembangan ini boleh membawa kepada pilihan pelaksanaan AI yang lebih berpatutan dan mudah diakses, terutamanya di pasaran China. Walau bagaimanapun, penting untuk diperhatikan bahawa demonstrasi semasa terhad kepada model yang telah disuling, dan perbandingan prestasi menyeluruh dengan penyelesaian AMD, Apple, atau NVIDIA masih belum ditentukan.