Alat Automasi Web AI Cerebellum Mencetuskan Perbincangan Mengenai Latihan Model Tempatan dan Kebimbangan PII

BigGo Editorial Team
Alat Automasi Web AI Cerebellum Mencetuskan Perbincangan Mengenai Latihan Model Tempatan dan Kebimbangan PII

Komuniti sumber terbuka sedang giat membincangkan Cerebellum, sistem automasi web baharu yang dipacu AI yang menggunakan Claude 3.5 Sonnet untuk interaksi pelayar. Walaupun alat ini menunjukkan potensi, ahli komuniti telah membangkitkan persoalan penting mengenai pengumpulan data, privasi, dan sokongan model tempatan.

Kebimbangan Pengumpulan Data dan Privasi

Satu perbincangan penting dalam komuniti berkisar tentang perancangan masa depan Cerebellum untuk mengumpul sesi pelayar secara crowdsourcing. Menurut jawapan Han Wang di GitHub, projek ini bertujuan untuk melaksanakan fungsi penukaran BrowserStep[] kepada format fail mudah alih dan mencipta fail .jsonl yang serasi dengan perpustakaan transformers. Walau bagaimanapun, ahli komuniti telah membangkitkan kebimbangan yang sah mengenai maklumat peribadi (PII) dalam kes penggunaan yang disahkan, memandangkan projek ini masih belum mempunyai ciri-ciri anonymization terbina.

Cabaran Integrasi Model Tempatan

Kemungkinan menggunakan model tempatan dengan Cerebellum telah muncul sebagai topik hangat yang lain. Penyelia projek menjelaskan bahawa model tempatan semasa tidak mempunyai keupayaan segmentasi yang kukuh untuk koordinat x dan y, menjadikannya tidak sesuai untuk tugas tersebut. Walaupun beberapa ahli komuniti mencadangkan penyelesaian alternatif menggunakan protokol Selenium WebDriver dan pengubahsuaian DOM, penyelesaian ini masih dalam peringkat eksperimen dan memerlukan pembangunan lanjut.

Pelaksanaan Teknikal

Cerebellum kini bergantung pada Selenium WebDriver v4 untuk interaksi pelayar, dengan tangkapan skrin dipindahkan sebagai imej melalui protokol WebDriver. Seorang ahli komuniti mencadangkan pendekatan yang berpotensi melibatkan pengubahsuaian DOM sebelum tangkapan skrin, walaupun ini memerlukan pelaksanaan yang teliti untuk mengekalkan fungsi.

Hala Tuju Pembangunan Masa Depan

Pelan tindakan projek menunjukkan rancangan untuk menangani kebimbangan komuniti ini, dengan matlamat termasuk:

  • Mewujudkan fungsi untuk menyimpan sesi pelayaran sebagai set data latihan
  • Membangun dan mengintegrasikan model tempatan dengan keupayaan yang diperlukan
  • Meningkatkan prestasi sistem dan pengalaman pengguna
  • Memperluaskan sokongan LLM melampaui Claude 3.5 Sonnet

Kesimpulan

Walaupun Cerebellum mewakili pendekatan inovatif dalam automasi web yang dipacu AI, perbincangan komuniti menyoroti pertimbangan penting mengenai privasi data dan sokongan model tempatan yang perlu ditangani semasa projek ini berkembang. Penglibatan aktif antara pembangun dan pengguna menunjukkan laluan kerjasama ke hadapan dalam menyelesaikan cabaran-cabaran ini.