DeepSeek telah memperkenalkan Janus Pro, model AI multimodal baharu yang mencetuskan perbincangan hangat dalam komuniti teknologi kerana pendekatannya yang cekap dalam penjanaan dan pemahaman imej AI. Dinamakan sempena dewa Rom yang mempunyai dua wajah - mewakili keupayaan dualnya dalam memahami dan menjana kandungan visual - model parameter 7B ini menandakan satu lagi pencapaian penting dalam kemajuan pesat DeepSeek dalam bidang AI.
Seni Bina yang Cekap
Model ini menunjukkan kecekapan yang luar biasa dalam seni binanya, memerlukan sumber pengkomputeran yang jauh lebih rendah berbanding pesaingnya. Latihan telah diselesaikan dalam masa 7-14 hari menggunakan kelompok 16-32 nod, setiap satunya dilengkapi dengan 8 GPU NVIDIA A100. Ini diterjemahkan kepada anggaran kos latihan kira-kira Ringgit Malaysia 517,000 - sebahagian kecil daripada kos latihan yang dilaporkan sebanyak Ringgit Malaysia 4.7 juta untuk model terdahulu seperti DALL-E 2.
Spesifikasi Teknikal:
- Saiz Model: 7B parameter
- Infrastruktur Latihan: 16-32 nod dengan 8 GPU NVIDIA A100 (40GB) setiap satu
- Tempoh Latihan: 7-14 hari
- Resolusi Imej: 384x384
- Anggaran Kos Latihan: ~USD 110,000
Ciri-ciri Utama:
- Keupayaan multimodal (teks-ke-imej dan pemahaman imej)
- Penggunaan komersial dibenarkan
- Penggunaan ketenteraan dihadkan
- Penempatan setempat boleh dilaksanakan
Batasan dan Keupayaan Teknikal
Walaupun Janus Pro menunjukkan potensi dalam penanda aras, ia mempunyai beberapa batasan yang ketara. Model ini kini terhad kepada penjanaan imej pada resolusi 384x384, jauh lebih rendah daripada resolusi 1024x1024 yang ditawarkan oleh beberapa pesaing. Walau bagaimanapun, perbincangan komuniti mencadangkan batasan ini mungkin disengajakan, dengan memberi tumpuan kepada pemahaman arahan dan kualiti penjanaan berbanding resolusi kasar, yang boleh ditangani melalui peningkatan skala.
Masih belum ada mekanisme dalam GenAI yang menguatkuasakan kekangan deduktif (dan kebolehkomposisian), iaitu, situasi di mana apabila satu output diperoleh, ruang carian untuk output masa depan semestinya terbatas (dan di mana kekangan tersebut digabungkan).
Kesan Pasaran
Pengumuman ini telah memberi kesan besar dalam pasaran teknologi, menyumbang kepada pergerakan saham yang ketara dalam kalangan syarikat yang memfokuskan AI. Peningkatan kecekapan model ini telah memberi kesan khususnya kepada persepsi pasaran terhadap keperluan perkakasan untuk pembangunan AI, mencabar andaian tentang skala infrastruktur yang diperlukan untuk keupayaan AI yang kompetitif.
Pelesenan dan Kebolehcapaian
DeepSeek telah mengeluarkan Janus Pro di bawah lesen mereka sendiri, yang membenarkan penggunaan komersial sambil menyekat aplikasi ketenteraan. Pendekatan yang agak terbuka ini, digabungkan dengan seni bina yang cekap, berpotensi menurunkan halangan kemasukan bagi organisasi yang ingin melaksanakan keupayaan pengimejan AI yang canggih.
Pembangunan Janus Pro mewakili langkah penting dalam pendemokrasian teknologi penjanaan imej AI, walaupun masih terdapat persoalan tentang prestasi sebenarnya berbanding penyelesaian sedia ada. Seiring dengan evolusi teknologi, fokus terhadap kecekapan dan kebolehcapaian boleh mengubah cara kita mendekati pembangunan dan penggunaan model AI.
Rujukan: Laporan Teknikal Janus Pro