Perlumbaan bot perbualan AI terus memanas apabila xAI milik Elon Musk memperkenalkan keupayaan baharu yang signifikan pada platform Grok. Dalam langkah yang mendekatkannya dengan pesaing seperti ChatGPT dari OpenAI dan Gemini dari Google, Grok kini menawarkan keupayaan penglihatan dan ciri suara yang dipertingkatkan, menandakan satu lagi langkah ke arah pembantu AI yang lebih interaktif dan responsif.
Grok Vision Memasuki Arena AI Visual
Grok telah menyertai barisan sistem AI yang boleh melihat melalui kamera peranti anda. Grok Vision yang baru diperkenalkan membolehkan bot perbualan ini menganalisis dan bertindak balas terhadap maklumat visual yang ditangkap melalui kamera telefon pintar secara masa nyata. Ciri ini, yang diumumkan oleh pembangun xAI Ebby Amir pada 22 April 2025, membolehkan pengguna hanya perlu mengarahkan kamera mereka pada objek atau pemandangan dan bertanya soalan kepada Grok tentang apa yang dilihatnya. Keupayaan visual ini mencerminkan fungsi serupa yang sudah terdapat dalam Gemini dari Google dan ChatGPT dari OpenAI, menunjukkan bahawa penglihatan masa nyata sedang menjadi ciri standard dalam bot perbualan AI yang canggih.
Sokongan Suara Pelbagai Bahasa Memperluaskan Kebolehcapaian
Selain keupayaan visual, kemas kini ini membawa sokongan suara yang diperluaskan kepada Grok. Bot perbualan ini kini boleh terlibat dalam perbualan suara dalam pelbagai bahasa, termasuk Sepanyol, Perancis, Turki, Jepun, dan Hindi. Keupayaan pelbagai bahasa ini memperluaskan kebolehcapaian Grok kepada penutur bukan Bahasa Inggeris dan menjadikannya pembantu AI yang lebih relevan secara global. Mod suara membolehkan perbualan semula jadi dengan AI, walaupun seperti bot perbualan berkemampuan suara lain, sifat sintetik suara itu masih dapat dikesan oleh kebanyakan pengguna.
Ketersediaan Platform dan Ciri Premium
Pada masa ini, ciri-ciri baharu ini eksklusif untuk pengguna iOS pada pelan Grok standard, mengikuti corak xAI yang melancarkan kemas kini kepada pengguna iPhone terlebih dahulu. Pengguna Android boleh mengakses keupayaan baharu ini hanya jika mereka melanggan pelan SuperGrok premium, yang berharga 30 dolar Amerika sebulan. Peringkat premium juga termasuk ciri tambahan seperti carian masa nyata dalam Mod Suara, memberikan pelanggan berbayar fungsi yang dipertingkatkan berbanding tawaran standard.
Ciri-ciri Baharu Grok:
- Grok Vision: Analisis visual berasaskan kamera masa nyata
- Sokongan suara pelbagai bahasa: Sepanyol, Perancis, Turki, Jepun, Hindi
- Carian suara masa nyata (hanya untuk pelanggan SuperGrok)
Ketersediaan Platform:
- iOS: Semua ciri tersedia pada pelan standard
- Android: Ciri-ciri memerlukan langganan SuperGrok USD $30/bulan
Kemas Kini xAI Terkini:
- Alat penciptaan dokumen dan aplikasi
- Ciri ingatan untuk pengekalan konteks perbualan
Trend Lebih Luas Ke Arah AI Agensi
Kemas kini terbaru Grok sejajar dengan pergerakan industri ke arah apa yang dikenali sebagai AI agensi – sistem yang boleh mengesan persekitaran mereka, menetapkan matlamat, merancang tindakan, dan membuat keputusan dengan panduan manusia yang minimum. Ini mewakili evolusi yang signifikan daripada model AI sebelumnya yang hanya bertindak balas terhadap arahan tertentu atau menjana kandungan berdasarkan data latihan. Gemini 2.0 dari Google dan ChatGPT dari OpenAI dengan ciri Tasks menggambarkan trend ini, menawarkan keupayaan yang mengubah maklumat mentah kepada pandangan yang boleh diambil tindakan dan membolehkan pengguna menetapkan peringatan dan menjadualkan tugas berulang.
Pembangunan Ciri Pantas xAI
Kadar pembangunan di xAI telah ketara cepat dalam beberapa bulan kebelakangan ini. Sebelum kemas kini penglihatan dan suara, Grok menerima alat untuk mencipta dokumen dan aplikasi, serta ciri memori yang membolehkan bot perbualan mengingati butiran dari perbualan sebelumnya. Keupayaan memori ini membolehkan respons yang lebih kontekstual dan relevan dari masa ke masa, kerana AI membina sejarah interaksi dengan pengguna individu.
Masa Depan AI Perbualan
Apabila bot perbualan seperti Grok, ChatGPT, dan Gemini terus mendapat keupayaan deria dan agensi, mereka semakin menghampiri visi fiksyen sains tentang pembantu AI yang digambarkan dalam media seperti filem 2013 Her. Walaupun pelaksanaan semasa masih jelas menunjukkan sifat buatan mereka, trajektori menunjukkan teman AI yang semakin semula jadi dan membantu yang boleh memahami bukan sahaja apa yang kita katakan, tetapi apa yang kita lihat dan konteks di mana kita beroperasi. Bagi pengguna, ini bermakna bantuan AI yang lebih intuitif dan membantu yang memerlukan arahan eksplisit yang kurang dan menyediakan sokongan yang lebih relevan.