Dalam langkah berani ke arah ketelusan dalam industri AI, Anthropic telah membuka tirai tentang cara kerja dalaman model AI Claude. Syarikat ini telah mengeluarkan maklumat terperinci mengenai arahan sistem yang membimbing tingkah laku dan keupayaan Claude 3.5 Sonnet, Claude 3 Opus, dan Claude 3 Haiku.
Pendedahan yang belum pernah berlaku ini memberikan pandangan menarik tentang bagaimana model bahasa besar diarahkan untuk berinteraksi dengan pengguna:
Saat pencerahan dalam ketelusan AI: Anthropic mendedahkan cara kerja dalaman Claude |
Pandangan Utama dari Arahan Sistem Claude
-
Kejujuran Tentang Batasan: Claude diarahkan untuk berterus terang tentang ketidakmampuannya membuka pautan atau video, dan untuk memberi amaran kepada pengguna apabila ia mungkin berhalusinasi tentang topik yang kurang diketahui.
-
Menangani Topik Kontroversi: AI ini dibimbing untuk memberikan maklumat yang berhati-hati dan objektif mengenai subjek sensitif tanpa meremehkan potensi bahaya.
-
Ciri-ciri Personaliti: Claude diarahkan untuk mengelakkan bahasa meminta maaf dan frasa pengisi tertentu, membentuk gaya perbualan tersendiri.
-
Berhati-hati dalam Analisis Imej: Apabila menggambarkan imej, Claude bertindak seolah-olah buta wajah untuk melindungi privasi, tidak mengenal pasti individu tertentu.
-
Panjang Jawapan yang Boleh Disesuaikan: AI ini bertujuan untuk memberikan jawapan ringkas untuk pertanyaan mudah, dengan jawapan yang lebih terperinci untuk topik kompleks.
Pendekatan berstruktur Claude: Pandangan utama tentang pengurusan respons AI |
Arahan Khusus untuk Setiap Model
Setiap varian Claude mempunyai arahan yang sedikit berbeza disesuaikan dengan penggunaan yang dimaksudkan:
- Sonnet: Model yang paling berkemampuan, dengan set arahan yang paling luas.
- Opus: Termasuk arahan mengenai menangani pelbagai sudut pandangan dan mengelakkan stereotaip.
- Haiku: Fokus pada jawapan ringkas dan pelbagai tugas yang lebih terhad.
Implikasi untuk Ketelusan AI
Keputusan Anthropic untuk menerbitkan arahan sistem ini adalah langkah penting ke arah menyingkap misteri tingkah laku AI. Ia membolehkan pengguna dan penyelidik untuk lebih memahami prinsip-prinsip yang membimbing respons dan proses membuat keputusan Claude.
Alex Albert, ketua hubungan pembangun Anthropic, telah menyatakan bahawa syarikat itu merancang untuk meneruskan inisiatif ketelusan ini, dengan kerap mengemas kini orang ramai mengenai perubahan pada arahan sistem Claude.
Artifacts: Sempadan Baru dalam Interaksi AI
Dalam berita berkaitan, Anthropic telah menjadikan ciri inovatif Artifacts tersedia secara percuma kepada semua pengguna Claude, termasuk mereka yang menggunakan platform mudah alih. Alat ini membolehkan pengguna mencipta elemen interaktif seperti kalkulator, permainan, dan aplikasi melukis secara langsung dalam antara muka sembang.
Gabungan ketelusan arahan sistem dan alat penciptaan berkuasa seperti Artifacts menunjukkan komitmen Anthropic terhadap keterbukaan dan menolak sempadan keupayaan AI. Ketika bidang kecerdasan buatan terus berkembang pesat, inisiatif seperti ini mungkin menetapkan standard baru untuk cara syarikat AI berkomunikasi dengan dan memperkasakan pengguna mereka.
Berinteraksi dengan AI: Meneroka interaktiviti melalui ciri Artifacts baharu |