Model AI terbaru dari OpenAI telah menunjukkan kebolehan luar biasa untuk mengenal pasti lokasi dari foto-foto dengan petunjuk visual yang minimal, mencetuskan rasa kagum dan kebimbangan dalam kalangan pengguna dan pejuang hak privasi. Keupayaan baharu ini mewakili kemajuan yang ketara dalam penaakulan visual AI tetapi juga membawa risiko yang berpotensi terhadap privasi peribadi dalam era digital.
Trend GeoGuessr Baharu
Model o3 dan o4-mini yang baru dikeluarkan oleh OpenAI telah mencetuskan trend viral di mana pengguna mencabar AI untuk mengenal pasti lokasi dari foto yang dimuat naik, serupa dengan permainan dalam talian GeoGuessr. Pengguna telah memuat naik pelbagai imej, dari menu restoran hingga rak perpustakaan, dan meminta AI untuk menentukan di mana foto itu diambil. Hasilnya sangat tepat, dengan model-model tersebut berjaya mengenal pasti lokasi tertentu berdasarkan butiran yang kelihatan tidak penting yang kebanyakan manusia tidak akan perasan.
Model-model OpenAI dengan Keupayaan Penaakulan Imej:
- model o3
- model o4-mini
Keupayaan Teknikal Di Sebalik Ketepatan
Model-model baharu ini mempunyai keupayaan penaakulan imej yang dipertingkatkan yang membolehkan mereka menganalisis imej secara komprehensif. Mereka boleh memotong, memutar, dan mengezum pada foto, walaupun yang berkualiti rendah. Lebih menakjubkan, mereka boleh mengintegrasikan imej secara langsung ke dalam rantaian pemikiran mereka, berfikir secara berkesan dengan maklumat visual dan bukannya sekadar memprosesnya. Ini membolehkan gabungan canggih antara penaakulan visual dan tekstual yang membolehkan model-model tersebut mengesan petunjuk halus tentang lokasi.
Keupayaan Utama Penaakulan Imej:
- Memotong, memutar, dan mengezum foto
- Menganalisis imej berkualiti rendah
- Mengintegrasikan imej dalam penaakulan rantaian pemikiran
- Mengenal pasti lokasi berdasarkan petunjuk visual yang halus
Implikasi Privasi dan Kebimbangan Doxxing
Walaupun ramai pengguna mendapati fungsi carian lokasi terbalik ini menghiburkan, ia menimbulkan kebimbangan privasi yang serius, terutamanya berkaitan dengan doxxing—pendedahan awam lokasi atau maklumat peribadi seseorang. Keupayaan untuk menentukan lokasi tepat dari foto-foto kasual yang diposkan di media sosial berpotensi dieksploitasi untuk mengesan individu tanpa pengetahuan atau persetujuan mereka. Satu swafoto ringkas dengan butiran latar belakang yang minimal atau siaran media sosial yang tidak berbahaya boleh mendedahkan lebih banyak maklumat daripada yang dimaksudkan oleh pemuat naik.
Contoh Ketepatan Dalam Dunia Nyata
Ketepatan model-model ini telah ditunjukkan dalam banyak contoh yang dikongsi di seluruh media sosial. Dalam satu kes, ChatGPT dengan tepat mengenal pasti perpustakaan University of Melbourne dari imej buku di rak yang dipotong rapat. Dalam kes lain, ia menyimpulkan bahawa foto itu diambil di Suriname berdasarkan pemerhatian bahawa kereta mempunyai stereng di sebelah kiri tetapi memandu di sebelah kiri jalan—kombinasi yang hanya terdapat di beberapa negara di seluruh dunia. Model tersebut juga dapat mengenal pasti speakeasy tertentu di Williamsburg berdasarkan hanya kepala badak ungu yang dipasang di bar.
Respons OpenAI Terhadap Kebimbangan
OpenAI telah mengakui isu-isu privasi yang berkaitan dengan keupayaan ini. Seorang jurucakap menyatakan bahawa syarikat itu telah melaksanakan perlindungan yang bertujuan untuk melarang model-model daripada mengenal pasti individu persendirian dalam imej dan telah melatih mereka untuk menolak permintaan untuk maklumat peribadi atau sensitif. Syarikat itu menekankan bahawa teknologi penaakulan visual mempunyai aplikasi yang bermanfaat dalam bidang seperti kebolehcapaian, penyelidikan, dan tindak balas kecemasan.
Langkah-langkah Perlindungan Privasi yang Dinyatakan oleh OpenAI:
- Model dilatih untuk menolak permintaan maklumat peribadi/sensitif
- Perlindungan untuk melarang pengenalpastian individu persendirian dalam imej
- Pemantauan aktif terhadap pelanggaran dasar
Batasan Teknologi
Walaupun prestasinya yang mengagumkan, teknologi ini tidak sempurna. Kedua-dua artikel mencatat bahawa model-model tersebut tidak selalu tepat dalam tekaan mereka, dan kadangkala model o3 boleh terperangkap dalam gelung semasa cuba menentukan lokasi. Menariknya, TechCrunch melaporkan bahawa model GPT-4o yang lebih awal, yang tidak mempunyai keupayaan penaakulan imej khusus, dapat memberikan jawapan lokasi yang serupa dalam banyak kes dan kadangkala melakukannya dengan lebih cepat daripada o3.
Implikasi untuk Pengguna Media Sosial
Perkembangan ini menjadi peringatan yang jelas bagi pengguna media sosial untuk lebih berhati-hati tentang imej yang mereka kongsi secara terbuka. Walaupun butiran yang kelihatan tidak berbahaya di latar belakang foto berpotensi mendedahkan maklumat lokasi apabila dianalisis oleh model AI yang semakin canggih ini. Bagi mereka yang bimbang tentang privasi, mengehadkan jumlah maklumat visual yang dikongsi dalam talian mungkin menjadi semakin penting apabila teknologi ini terus berkembang.