Projek "Neural Graffiti" Menimbulkan Keraguan: Komuniti Mempersoalkan Keaslian dan Keberkesanannya

BigGo Editorial Team
Projek "Neural Graffiti" Menimbulkan Keraguan: Komuniti Mempersoalkan Keaslian dan Keberkesanannya

Komuniti penyelidikan AI telah memberikan reaksi skeptikal yang ketara terhadap projek yang baru diumumkan bernama Neural Graffiti, yang mendakwa membolehkan pengubahsuaian tingkah laku model bahasa besar secara masa nyata melalui pendekatan yang digambarkan oleh penciptanya sebagai pendekatan neuroplastik. Projek tersebut, yang dikatakan membolehkan pembengkokan model asas secara langsung pada tahap rangkaian neural, telah menerima kritikan kerana berkemungkinan membesar-besarkan keaslian dan keberkesanannya.

Penciptaan Semula Bukannya Inovasi

Ramai pengulas telah menunjukkan bahawa konsep teras di sebalik Neural Graffiti kelihatan seperti penjenamaan semula teknik-teknik yang sedia ada. Pendekatan ini, yang melibatkan penyuntikan vektor ke dalam lapisan tersembunyi terakhir model transformer untuk mempengaruhi output, mempunyai persamaan yang kuat dengan kaedah yang sudah diketahui seperti vektor kawalan. Ini telah menimbulkan kekecewaan di kalangan pengamal AI yang melihat ini sebagai sebahagian daripada trend yang membimbangkan dalam bidang tersebut.

Bagus, seseorang telah mencipta semula vektor kawalan. Industri ini perlu berhenti mencipta semula perkara yang sama setiap 6 bulan.

Projek ini menggambarkan dirinya sebagai diilhamkan oleh seni graffiti dan sifat neuroplastik otak hidup, bahasa yang dianggap oleh sesetengah ahli komuniti sebagai terlalu berbunga-bunga dan berpotensi mengelirukan. Para pengkritik mencadangkan bahawa penggunaan istilah sedemikian menyembunyikan kesederhanaan teknikal apa yang dicadangkan – pada asasnya purata bergerak eksponen ke atas urutan vektor yang digunakan pada lapisan terakhir model.

Pelaksanaan Teknikal yang Diragui

Analisis teknikal daripada komuniti menimbulkan keraguan tentang butiran pelaksanaan. Menurut pengulas yang mengkaji kod tersebut, pemetaan linear yang digunakan dalam pendekatan ini dimulakan secara rawak tanpa latihan yang betul, yang berkemungkinan menghalangnya daripada berfungsi seperti yang dihuraikan. Pemerhatian ini disokong oleh laporan daripada pengguna yang menguji demo dan mendapati sedikit bukti bahawa sistem itu sebenarnya mengekalkan konsep seperti yang didakwa.

Seorang pengguna melaporkan bahawa selepas berulang kali memberitahu model bahawa mereka suka kucing, apabila ditanya tentang haiwan kegemarannya, model itu terus menjawab lebah madu dan gurita, tidak menunjukkan tanda kesan ingatan yang dijanjikan. Ini menunjukkan bahawa kesan sebenar Lapisan Semburan mungkin minimum atau tidak wujud dalam praktik.

Skop dan Potensi yang Terhad

Walaupun jika pendekatan ini berfungsi seperti yang dihuraikan, sesetengah pakar mempersoalkan sama ada pengubahsuaian hanya pada lapisan tersembunyi terakhir akan mengubah cara model berfikir secara bermakna. Projek ini mendakwa dapat mengubah cara ia melihat dunia dan mempengaruhi bagaimana ia menghubungkan konsep, tetapi pelaksanaan teknikal kelihatan terlalu terhad untuk mencapai matlamat yang begitu bercita-cita tinggi.

Perbincangan komuniti juga menekankan bahawa jika sistem itu berfungsi, ia pada asasnya akan berfungsi sebagai versi rudimentari dan kurang terlatih daripada teknik seperti LoRA (Low-Rank Adaptation), tetapi dengan kecanggihan dan keberkesanan yang jauh lebih rendah. Ini menimbulkan persoalan tentang kegunaan praktikal pendekatan tersebut di luar penerokaan konseptual.

Kritikan Utama terhadap Neural Graffiti

  • Kekurangan inovasi: Kelihatan seperti mencipta semula teknik sedia ada seperti vektor kawalan
  • Kebimbangan pelaksanaan: Penginisialan rawak pemberat tanpa latihan yang sewajarnya
  • Bukti terhad: Pengguna melaporkan tiada kesan ingatan yang dapat diperhatikan dalam ujian
  • Batasan teknikal: Pengubahsuaian hanya pada lapisan tersembunyi terakhir tidak mungkin menghasilkan kesan yang didakwa
  • Bahasa pemasaran: Penggunaan istilah seperti "neuroplastik" dan "graffiti" dilihat sebagai hiasan yang tidak perlu
  • Penanda aras yang hilang: Tiada data perbandingan atau metrik prestasi yang disediakan

Konteks Lebih Luas: Kebimbangan Terhadap Hype AI

Projek Neural Graffiti muncul dalam konteks kebimbangan yang semakin meningkat tentang hype dan bahasa pemasaran dalam penyelidikan AI. Ahli komuniti menyatakan keletihan dengan apa yang mereka anggap sebagai penjenamaan semula teknik yang sedia ada dengan nama dan grafik yang menarik, disertai dengan dakwaan besar yang tidak disokong oleh bukti empirikal.

Perbincangan ini berkait dengan pemerhatian yang lebih luas tentang perubahan dalam sistem AI komersial. Beberapa pengguna menyatakan perubahan terkini dalam tingkah laku ChatGPT ke arah respons yang lebih mengampu, mengandaikan sama ada teknik yang serupa untuk mengubah tingkah laku model mungkin digunakan oleh syarikat AI utama untuk membentuk pengalaman pengguna, sering dalam cara yang mengutamakan penglibatan berbanding kegunaan.

Ketika bidang AI terus berkembang dengan pesat, respons komuniti terhadap Neural Graffiti menekankan kepentingan untuk mengesahkan dakwaan dengan bukti, mengakui kerja terdahulu, dan mengekalkan ketepatan teknikal dalam komunikasi – nilai-nilai yang kelihatan semakin bertentangan dengan ekonomi perhatian yang mendorong sebahagian besar pembangunan AI.

Rujukan: neuralgraffiti