DeepSeek R1 Dilancarkan dengan Prestasi Setara OpenAI o1, Menawarkan Model Sumber Terbuka Berlesen MIT

BigGo Editorial Team
DeepSeek R1 Dilancarkan dengan Prestasi Setara OpenAI o1, Menawarkan Model Sumber Terbuka Berlesen MIT

Dalam perkembangan penting bagi industri AI, DeepSeek telah secara rasmi melancarkan model R1, menandakan pencapaian penting dalam pembangunan AI sumber terbuka. Pelancaran ini merupakan langkah strategik yang menggabungkan keupayaan berprestasi tinggi dengan pendekatan sumber terbuka, berpotensi mengubah landskap kebolehcapaian dan pembangunan model AI.

Pendekatan Latihan Revolusioner

DeepSeek R1 memperkenalkan kaedah latihan baharu yang terutamanya bergantung pada pembelajaran peneguhan (RL), berbeza daripada pendekatan penalaan terkawal (SFT) tradisional. Varian R1-Zero menunjukkan keberkesanan latihan RL tulen, mencapai peningkatan prestasi yang luar biasa tanpa data SFT konvensional. Pendekatan inovatif ini telah menghasilkan keputusan yang ketara, dengan prestasi model pada AIME 2024 meningkat dari 15.6% kepada 71.0% melalui latihan RL sahaja.

Penanda Aras Prestasi

Model ini telah menunjukkan keupayaan luar biasa merentasi pelbagai penanda aras, terutamanya dalam tugasan matematik, pengkodan, dan penaakulan. DeepSeek R1 mencapai skor 79.8% pada AIME 2024 dan skor mengagumkan 97.3% pada MATH-500, menyamai atau sedikit melebihi prestasi OpenAI o1. Dalam pertandingan pengkodan, model ini mencapai penarafan Elo 2029 pada Codeforces, mengatasi 96.3% peserta manusia.

Prestasi Penanda Aras:

  • AIME 2024: 79.8% (melebihi OpenAI o1)
  • MATH-500: 97.3% (setanding dengan OpenAI o1)
  • Codeforces: Penarafan Elo 2029 (lebih baik daripada 96.3% peserta manusia)
Jim Fan membincangkan landskap persaingan AI, mengetengahkan peningkatan prestasi DeepSeek-R1
Jim Fan membincangkan landskap persaingan AI, mengetengahkan peningkatan prestasi DeepSeek-R1

Strategi Harga Kompetitif

DeepSeek telah menetapkan R1 dengan harga yang sangat kompetitif untuk perkhidmatan APInya. Kadar API model ditetapkan pada Dolar Amerika 0.14 bagi setiap juta token untuk cache hits dan Dolar Amerika 0.55 untuk cache misses pada input, dengan output berharga Dolar Amerika 2.19 bagi setiap juta token. Struktur harga ini mewakili kelebihan kos yang ketara berbanding tawaran OpenAI, menjadikan keupayaan AI termaju lebih mudah diakses oleh pembangun dan perniagaan.

Perbandingan Harga API:

  • DeepSeek R1:

    • Input (hit cache): USD 0.14/sejuta token
    • Input (miss cache): USD 0.55/sejuta token
    • Output: USD 2.19/sejuta token
  • OpenAI o1:

    • Input: USD 15/sejuta token
    • Output: USD 60/sejuta token

Komitmen Sumber Terbuka

Pelancaran ini bukan sahaja merangkumi model tetapi juga dokumentasi teknikal yang komprehensif dan enam model kecil yang telah disuling. Mengikut Lesen MIT, pengguna boleh menggunakan, mengubah suai, dan mengkomersialkan model secara bebas, termasuk pemberat dan outputnya. Pendekatan ini berbeza ketara daripada kebanyakan model AI komersial, menggalakkan ketelusan dan inovasi kolaboratif dalam komuniti AI.

Penyulingan dan Pembangunan Ekosistem

DeepSeek telah berjaya menyuling keupayaan R1 kepada model yang lebih kecil dan praktikal menggunakan seni bina popular seperti Qwen dan Llama. Versi 32B dan 70B yang disuling mencapai tahap prestasi setanding dengan OpenAI o1-mini, menunjukkan keberkesanan pemindahan pengetahuan dari model yang lebih besar kepada yang lebih kecil sambil mengekalkan standard prestasi yang tinggi.

Implikasi Masa Depan

Pelancaran ini merupakan langkah penting ke arah pendemokrasian keupayaan AI termaju. Dengan menggabungkan prestasi terkini dengan kebolehcapaian sumber terbuka dan harga yang kompetitif, DeepSeek R1 boleh mempercepatkan inovasi dalam bidang AI sambil menjadikan alat AI yang berkuasa lebih mudah diakses kepada pelbagai pembangun dan organisasi.