Pendekatan DeepSeek Terhadap Sumber Terbuka AI: Mengimbangi Inovasi dengan Cabaran Praktikal

BigGo Editorial Team
Pendekatan DeepSeek Terhadap Sumber Terbuka AI: Mengimbangi Inovasi dengan Cabaran Praktikal

Dalam dunia pembangunan AI yang berkembang pesat, DeepSeek baru-baru ini telah mengumumkan pendekatannya untuk menjadikan komponen enjin inferensnya sebagai sumber terbuka, mencetuskan perbincangan penting dalam komuniti teknologi. Bukannya melepaskan keseluruhan kod sumber mereka, yang menghadapi beberapa cabaran praktikal, syarikat tersebut telah memilih untuk membuat sumbangan yang lebih strategik kepada ekosistem sumber terbuka.

Jurang Prestasi Mendedahkan Potensi Pengoptimuman yang Ketara

Komuniti telah mengenal pasti jurang prestasi yang besar antara enjin inferens yang tersedia secara umum dan sistem dalaman DeepSeek. Menurut komen daripada pengguna yang biasa dengan penanda aras, vLLM (enjin inferens sumber terbuka) mencapai sekitar 5,000 token keseluruhan per saat dengan set data sharegpt dan 12,000 token per saat dengan konfigurasi rawak 2000/100 di bawah keadaan konkurensi tinggi. Sebaliknya, sistem dalaman DeepSeek dilaporkan menghasilkan kira-kira 73,700 token per saat semasa pra-pengisian dan 14,800 token per saat semasa penyahkodan pada satu nod H800. Perbezaan dramatik ini menunjukkan betapa banyaknya ruang untuk peningkatan yang wujud dalam ruang inferens sumber terbuka.

Perbandingan Prestasi: vLLM vs. Enjin Dalaman DeepSeek

Sistem Konfigurasi Prestasi
vLLM dataset sharegpt, keserempakan tinggi ~5,000 token/s
vLLM rawak 2000/100, keserempakan tinggi ~12,000 token/s
DeepSeek Dalaman nod H800, praisian ~73,700 token/s input
DeepSeek Dalaman nod H800, penyahkodan ~14,800 token/s output

Cabaran Sumber Terbuka DeepSeek

  • Perbezaan Kod Asas: Berasaskan cabang vLLM berusia setahun dengan penyesuaian besar
  • Kebergantungan Infrastruktur: Terikat rapat dengan sistem dalaman
  • Kekangan Kapasiti Penyelenggaraan: Pasukan penyelidikan kecil yang fokus pada pembangunan model

Strategi Sumbangan DeepSeek

  • Ekstrak ciri-ciri kendiri sebagai pustaka bebas
  • Kongsi teknik pengoptimuman dan butiran pelaksanaan
  • Bekerjasama dengan projek sumber terbuka sedia ada

Cabaran Mengekalkan Kod Sumber yang Telah Diubahsuai

Ramai pembangun dalam komuniti menyatakan empati dengan penjelasan DeepSeek mengenai perbezaan kod sumber. Enjin inferens syarikat itu adalah berdasarkan cabang awal vLLM dari lebih setahun yang lalu, dan sejak itu telah banyak diubahsuai untuk model khusus mereka. Situasi ini bergema dengan banyak jurutera perisian yang telah mengalami cabaran serupa dengan mengekalkan cabang yang terlalu jauh berbeza daripada kod sumber asalnya. Hutang teknikal yang terkumpul melalui pengubahsuaian yang meluas menjadikannya semakin sukar untuk menggabungkan penambahbaikan komuniti atau mengekalkan kod untuk kes penggunaan yang lebih luas.

Saya pernah mengalami situasi ini. Mungkin beberapa daripada kita pernah... Pendekatan mereka untuk bekerja dengan memisahkan subperpustakaan yang boleh diselenggarakan dan berkongsi maklumat secara langsung walaupun tidak bersepadu kelihatan cara yang sangat baik untuk bekerja dengan komuniti.

Logik Komersial Di Sebalik AI Sumber Terbuka

Satu perbincangan menarik berkisar tentang mengapa syarikat AI komersial berkongsi penyelidikan dan teknologi mereka pada asalnya. Beberapa ahli komuniti menawarkan pandangan mengenai logik perniagaan yang mendorong tingkah laku yang seolah-olah bercanggah ini. Motivasinya kelihatan pelbagai: menarik bakat terbaik yang mahu kerja mereka diterbitkan, mewujudkan pengaruh dalam industri, memposisikan teknologi sebagai standard, dan mempercepatkan kemajuan seluruh bidang yang akhirnya memberi manfaat kepada semua peserta.

Beberapa pengulas menyatakan bahawa dalam bidang yang berkembang pesat seperti AI, berada dekat dengan kemajuan yang berlaku di seluruh ekosistem mungkin lebih berharga daripada menyimpan inovasi secara rahsia. Perspektif ini membingkai sumbangan sumber terbuka bukan sebagai tindakan altruisme tetapi sebagai keputusan perniagaan strategik yang mengejar keuntungan ekonomi melalui manfaat bersama dan pertumbuhan ekosistem.

Nilai Praktikal Berkongsi Pengetahuan berbanding Kod

Satu perspektif menarik muncul mengenai nilai berkongsi pengetahuan walaupun kod yang lengkap dan boleh dijalankan tidak tersedia. Beberapa pembangun menunjukkan bahawa kod yang tidak boleh dijalankan atau penerangan teknikal boleh sangat berharga untuk memahami butiran pelaksanaan yang tidak sepenuhnya disampaikan oleh kertas penyelidikan sahaja. Ini menunjukkan bahawa pendekatan DeepSeek untuk berkongsi pengoptimuman dan penambahbaikan reka bentuk, walaupun bukan dalam bentuk enjin inferens yang lengkap, masih boleh memberi manfaat yang ketara kepada komuniti.

Kesimpulannya, keputusan DeepSeek mewakili pendekatan pragmatik terhadap sumbangan sumber terbuka yang mengakui kedua-dua nilai berkongsi inovasi dan cabaran praktikal mengekalkan kod sumber yang kompleks. Ketika pembangunan AI terus mempercepatkan, mencari model yang mampan untuk perkongsian pengetahuan yang memberi manfaat kepada syarikat dan komuniti yang lebih luas akan kekal penting. Penerimaan positif terhadap ketelusan DeepSeek mengenai cabaran-cabaran ini menunjukkan bahawa komuniti teknologi menghargai komunikasi jujur mengenai realiti penyelenggaraan sumber terbuka sama seperti sumbangan itu sendiri.

Rujukan: The Path to Open-Sourcing the DeepSeek Inference Engine