DeepSeek R1 Mencabar Dominasi OpenAI dengan Model AI Berprestasi Tinggi dan Kos Rendah

BigGo Editorial Team

DeepSeek R1 Mencabar Dominasi OpenAI dengan Model AI Berprestasi Tinggi dan Kos Rendah

Dalam perkembangan penting bagi industri kecerdasan buatan, syarikat permulaan AI China, DeepSeek telah menggemparkan komuniti teknologi global dengan model bahasa terbarunya, DeepSeek R1. Model ini telah menarik perhatian kerana mencapai tahap prestasi setanding dengan model-model canggih OpenAI sambil mengekalkan kos yang jauh lebih rendah dan mengamalkan pendekatan sumber terbuka.

Prestasi Revolusioner dan Kecekapan Kos

DeepSeek R1 telah menunjukkan keupayaan yang luar biasa, terutamanya dalam bidang kimia, matematik, dan pengkodan, yang setanding dengan prestasi model o1 OpenAI. Model ini telah menduduki tempat ketiga pada papan pendahulu Chatbot Arena, mengatasi pesaing-pesaing mapan seperti Google Gemini dan Microsoft Copilot. Dalam ujian kompetitif, DeepSeek R1 mencapai kadar kemenangan yang mengagumkan melebihi 80% dalam 30 pusingan cabaran.

Metrik Prestasi Model:

Kedudukan: Tempat ke-3 di Chatbot Arena
Kadar kemenangan: Melebihi 80% dalam ujian 30 pusingan
Bidang kekuatan utama: Kimia, Matematik, Pengkodan

Kejayaan dalam Pengurangan Kos

Salah satu aspek paling menonjol dalam pencapaian DeepSeek adalah keberkesanan kosnya. Kos latihan untuk DeepSeek V3, pendahulu kepada R1, berjumlah kira-kira 5.58 juta Dolar Amerika, yang mewakili kurang daripada satu persepuluh daripada 78 juta Dolar Amerika yang dilaporkan diperlukan untuk melatih model seperti GPT-4. Pengurangan kos yang dramatik ini telah dicapai melalui seni bina inovatif dan algoritma yang dioptimumkan, mencabar pandangan konvensional tentang kos pembangunan model AI.

Perbandingan Kos:

Kos latihan DeepSeek-V3: USD 5.58 juta
Anggaran kos latihan GPT-4: USD 78 juta
Pengurangan kos: ~93% berbanding model tradisional

Inovasi Teknikal dan Kebolehcapaian

Model ini menggabungkan beberapa teknologi terkini, termasuk Multi-head Latent Attention (MLA), seni bina Mixture of Experts (MoE), dan latihan ketepatan rendah FP8. DeepSeek telah menjadikan inovasi ini mudah diakses oleh komuniti AI global dengan menjadikan pemberat model sebagai sumber terbuka dan menyediakan butiran latihan yang lengkap, menggalakkan ketelusan dan pembangunan kolaboratif.

Harga API:

Token input (cache hit): CNY 0.5/juta
Token input (cache miss): CNY 2/juta
Token output: CNY 8/juta

Kesan pada Dinamik Industri

Kemunculan DeepSeek R1 telah mencetuskan riak yang ketara di Silicon Valley. Syarikat-syarikat teknologi utama, termasuk Meta, dilaporkan sedang menganalisis keupayaan model ini, manakala AMD telah mengumumkan integrasi DeepSeek V3 ke dalam produk GPU Instinct MI300X mereka. Perkembangan ini menunjukkan kemungkinan perubahan dalam dinamik kuasa industri AI, yang secara tradisinya didominasi oleh syarikat-syarikat berasaskan Amerika Syarikat.


Landskap persaingan dalam industri AI, memaparkan kebangkitan pemain baharu seperti DeepSeek-R1 di kalangan aplikasi yang telah mantap

Strategi Harga dan Akses Pasaran

DeepSeek telah melaksanakan struktur harga yang kompetitif untuk perkhidmatan APInya. Token input dihargai pada 0.5 Yuan China setiap juta untuk cache hits dan 2 Yuan China untuk cache misses, manakala token output berharga 8 Yuan China setiap juta. Strategi harga ini menjadikan teknologi ini lebih mudah diakses kepada pembangun dan penyelidik di seluruh dunia, berpotensi mendemokrasikan akses kepada keupayaan AI yang canggih.

Berita Berkaitan

‌

‌
‌

‌

‌
‌

‌