OpenAI Memperkenalkan Model Penaakulan Termaju O3 dan O4-mini dengan Keupayaan Pemprosesan Visual

BigGo Editorial Team

OpenAI Memperkenalkan Model Penaakulan Termaju O3 dan O4-mini dengan Keupayaan Pemprosesan Visual

Kecerdasan buatan terus berkembang dengan pesat ketika syarikat teknologi menolak sempadan kemungkinan. Dalam kemajuan yang signifikan untuk keupayaan penaakulan AI, OpenAI telah memperkenalkan dua model baharu yang direka untuk berfikir dengan lebih teliti sebelum memberi respons kepada pertanyaan pengguna.

Model Penaakulan Baharu Dilancarkan

OpenAI telah secara rasmi melancarkan dua model penaakulan AI baharu: o3, yang digambarkan oleh syarikat itu sebagai model penaakulan paling berkuasa setakat ini, dan o4-mini, alternatif yang lebih kecil dan lebih pantas yang memberikan prestasi mengesankan berbanding saiz dan kosnya. Model-model ini mengikuti pengenalan terbaru OpenAI terhadap model utama GPT-4.1 dan mewakili evolusi seterusnya dalam sistem AI yang berfokus pada penaakulan syarikat itu. Tidak seperti model standard, model penaakulan ini dilatih khusus untuk berfikir sebelum bercakap, mengambil masa pemprosesan tambahan untuk memberikan respons berkualiti lebih tinggi.

Gambaran Keseluruhan Model-model Baharu OpenAI

Model	Penerangan	Ciri-ciri Utama
o3	Model penaakulan paling berkuasa	Penaakulan visual, integrasi alat, prestasi dipertingkatkan
o4-mini	Lebih kecil, lebih pantas, kos efektif	Penaakulan visual, integrasi alat, dioptimumkan untuk kelajuan
o4-mini-high	Varian berprestasi lebih tinggi	Keupayaan dipertingkatkan sambil mengekalkan kecekapan

Integrasi Alat

Pelayaran web
Pengkodan Python
Pemahaman imej
Penjanaan imej

Integrasi Pemahaman Visual

Mungkin kemajuan paling penting dalam model baharu ini adalah keupayaan mereka untuk berfikir dengan imej. Kedua-dua o3 dan o4-mini kini boleh mengintegrasikan maklumat visual secara langsung ke dalam proses penaakulan mereka, dan bukannya hanya menerangkan apa yang mereka lihat. Keupayaan ini membolehkan model-model tersebut bekerja dengan lakaran, papan putih, dan bahkan imej berkualiti rendah atau kabur. Model-model ini boleh memanipulasi imej sebagai sebahagian daripada analisis mereka, termasuk mengezum pada elemen tertentu atau memutar imej untuk lebih memahami kandungannya. Penaakulan visual ini mewakili langkah besar ke hadapan dalam keupayaan AI untuk memproses dan menggunakan maklumat merentasi format yang berbeza.

Penggunaan Alat Agentik

Satu lagi kemajuan utama adalah keupayaan model untuk menggunakan secara bebas semua alat ChatGPT semasa proses penaakulan mereka. Ini termasuk penjelajahan web, pengkodan Python, pemahaman imej, dan keupayaan penjanaan imej. OpenAI menggambarkan ini sebagai langkah ke arah ChatGPT yang lebih agentik yang boleh melaksanakan tugas secara bebas bagi pihak anda. Dalam terma praktikal, ini bermakna model-model tersebut boleh secara autonomi memutuskan alat mana yang akan digunakan untuk menyelesaikan masalah kompleks, berbilang langkah—serupa dengan bagaimana seseorang mungkin menggunakan kalkulator apabila diperlukan. Semasa demonstrasi, penyelidik menunjukkan bagaimana o3 boleh menganalisis poster penyelidikan saintifik, melayari internet untuk maklumat tambahan, dan mengezum ke elemen berbeza pada imej untuk menjana jawapan komprehensif.

Peningkatan Prestasi

Menurut OpenAI, kedua-dua o3 dan o4-mini mengatasi prestasi pendahulu mereka merentasi pelbagai penanda aras, walaupun tanpa menggunakan keupayaan akses alat baharu mereka. Model-model ini menunjukkan peningkatan dalam mengikuti arahan dan memberikan respons yang lebih berguna dan boleh disahkan. Walaupun o3 mewakili tawaran premium dengan keupayaan maksimum, o4-mini telah dioptimumkan untuk memberikan prestasi yang kuat pada kos yang lebih rendah dan kelajuan yang lebih tinggi, menjadikan penaakulan termaju lebih mudah diakses.

Ketersediaan dan Akses

Model baharu ini tersedia serta-merta kepada pelanggan ChatGPT Plus, Pro, dan Team, muncul dalam pemilih model sebagai o3, o4-mini, dan o4-mini-high. Mereka akan menggantikan model penaakulan sebelumnya o1, o3-mini, dan o3-mini-high. Pengguna Pro akan mendapat akses kepada o3-pro dalam beberapa minggu akan datang, tetapi sehingga itu akan terus mempunyai akses kepada o1-pro. Pembangun juga boleh mengakses model-model ini melalui API OpenAI.

Pengumuman Tambahan

Selain model-model baharu ini, OpenAI telah melancarkan Codex CLI, agen pengkodan sumber terbuka yang berjalan secara tempatan di terminal pengguna. Alat ini menyediakan cara yang mudah untuk menghubungkan model AI, termasuk o3 dan o4-mini, kepada kod dan tugas pengguna sendiri. Sokongan untuk GPT-4.1 dijangka akan datang tidak lama lagi. Syarikat itu juga telah mengumumkan inisiatif bernilai $1 juta untuk menyokong projek awal yang menggunakan teknologi ini, menawarkan geran dalam bentuk kredit API bernilai $25,000.

Pertimbangan Keselamatan

OpenAI telah menekankan bahawa kedua-dua model baharu menjalani ujian keselamatan yang menyeluruh sebelum dilancarkan. Model-model ini telah diuji tekanan di bawah program keselamatan syarikat dan dinilai mengikut Rangka Kerja Kesediaan yang dikemas kini, dengan hasil terperinci tersedia dalam kad sistem lengkap.