Dalam perkembangan yang mengejutkan, ByteDance, syarikat induk TikTok, telah melancarkan bot pengikis web yang dengan pantas mengatasi pesaingnya dalam perlumbaan pengumpulan data. Bot tersebut, yang diberi nama Bytespider, dilaporkan mengikis internet pada kadar 25 kali lebih pantas daripada GPTbot OpenAI dan 3,000 kali lebih pantas daripada ClaudeBot Anthropic.
Kebangkitan Bytespider
Dilancarkan pada April 2024, Bytespider dengan cepat menjadi salah satu alat pengumpulan data yang paling agresif di internet. Menurut penyelidikan dari syarikat pengurusan bot Kasada dan perkhidmatan pemantauan Dark Visitors, pengikis ByteDance ini beroperasi pada kelajuan yang belum pernah terjadi sebelumnya berbanding dengan alat serupa yang digunakan oleh gergasi teknologi seperti Google, Meta, Amazon, OpenAI, dan Anthropic.
Implikasi untuk Pembangunan AI
Strategi pengumpulan data yang agresif ini menunjukkan bahawa ByteDance sedang berusaha keras untuk mengejar ketinggalan dalam perlumbaan AI. Syarikat ini, yang dilaporkan menggunakan teknologi OpenAI untuk membina model bahasa besar (LLM) sendiri tahun lalu, kelihatan bertekad untuk mengumpulkan sejumlah besar data latihan untuk inisiatif AI mereka.
Amalan Kontroversi
Pendekatan Bytespider telah menimbulkan beberapa persoalan dalam komuniti teknologi. Seperti beberapa pesaingnya, bot ini dilaporkan mengabaikan fail robots.txt, yang digunakan oleh pemilik laman web untuk menandakan bahagian laman web mereka yang tidak sepatutnya diikis. Amalan ini, walaupun tidak menyalahi undang-undang, dianggap kontroversi dalam perbahasan berterusan mengenai hak data dan latihan AI.
Potensi Aplikasi
Sumber yang mengetahui tentang aspirasi ByteDance mencadangkan bahawa syarikat itu mungkin sedang membangunkan LLM baru, berpotensi untuk meningkatkan fungsi carian TikTok. Persekitaran carian yang dipertingkatkan dengan AI boleh menjadikan TikTok lebih menarik kepada pengiklan yang kini membelanjakan banyak wang di platform seperti Google.
Implikasi Masa Depan
Seiring dengan ByteDance terus meningkatkan usaha pengumpulan datanya, timbul persoalan tentang masa depan pembangunan AI dan penggunaan data. Pendekatan agresif syarikat ini mungkin akan mencetuskan perbincangan lanjut mengenai hak data, etika AI, dan keperluan rangka kerja pengawalseliaan dalam bidang kecerdasan buatan yang berkembang pesat.
Walaupun Bytespider ByteDance menunjukkan komitmen syarikat untuk memajukan keupayaan AI mereka, ia juga menyerlahkan persaingan yang semakin sengit dalam industri teknologi dan kepentingan data yang semakin meningkat dalam perlumbaan senjata AI.