Acara Google I/O 2024 baru-baru ini mempamerkan pelbagai kemajuan dalam platform AI Gemini mereka, dengan janji-janji keupayaan revolusioner dalam penyuntingan imej, penjanaan video, dan banyak lagi. Apabila ciri-ciri ini mula dilancarkan kepada pengguna, ramai yang tertanya-tanya sama ada langganan premium Gemini Pro dapat memenuhi janji-janji bercita-cita tinggi ini atau masih tidak mencapai jangkaan.
Pengalaman Percubaan Percuma
Apabila mempertimbangkan untuk menaik taraf ke Gemini Pro, sesetengah pengguna telah mendapati mereka boleh mencuba beberapa ciri premium hanya dengan meminta dengan sopan. Seorang wartawan teknologi mendapati bahawa dengan menyatakan mereka sedang mempertimbangkan untuk menaik taraf dan meminta untuk mencuba ciri-ciri terlebih dahulu, Gemini membenarkan akses terhad kepada keupayaan tahap Pro. Percubaan tidak rasmi ini memberikan gambaran tentang apa yang mungkin diharapkan oleh pelanggan berbayar, walaupun dengan sekatan seperti had tiga percubaan bagi setiap jenis ciri.
Keupayaan Penyuntingan Imej
Salah satu ciri Gemini yang paling dibanggakan adalah keupayaannya untuk menyunting dan memanipulasi imej. Dalam praktiknya, hasilnya agak bercampur-campur. Apabila diminta untuk melakukan tugas yang kelihatan mudah seperti membuka kotak tertutup dalam imej atau mengeluarkan objek dari sesuatu pemandangan, Gemini sering menjana imej yang sama sekali baru dan bukannya menyunting yang asal. Ciptaan baru ini sering kali terlepas pandang butiran penting dari bahan sumber, menunjukkan salah faham asas tentang apa yang sebenarnya dikehendaki oleh pengguna.
![]() |
---|
Robotik berasaskan AI Gemini menunjukkan potensi aplikasi dalam manipulasi imej |
Cabaran Peniruan Gaya
Percubaan untuk mendapatkan Gemini meniru gaya artistik tertentu mendedahkan batasan yang ketara. Apabila diberikan imej rujukan dari artis terkenal seperti Mike Mignola (pencipta Hellboy) dan diminta untuk menjana karya seni yang serupa, hasilnya hanya menangkap elemen-elemen permukaan sambil terlepas kualiti estetik yang lebih mendalam yang menentukan karya artis tersebut. Ini menyoroti isu berterusan dengan sistem AI: mereka boleh meniru ciri-ciri luaran tetapi menghadapi kesukaran untuk memahami intipati gaya artistik.
Peningkatan Imej HD
Satu lagi ciri yang diiklankan membolehkan pengguna mengubah imej resolusi rendah kepada kertas dinding definisi tinggi. Ujian mendedahkan bahawa walaupun Gemini boleh menjana imej resolusi tinggi yang diilhamkan oleh yang asal, ia sering meninggalkan kandungan sebenar dan lebih cenderung untuk mencipta sesuatu yang sama sekali baru yang hanya berkongsi suasana atau tema. Bagi pengguna yang berharap untuk meningkatkan foto-foto tersayang, pendekatan ini jauh dari memenuhi jangkaan.
Batasan Utama:
- Sering menghasilkan imej baru dan bukannya menyunting imej sedia ada
- Hanya menangkap elemen permukaan gaya artistik
- Tidak dapat mengeksport dengan betul ke Google Docs atau Sheets
- Ketersediaan ciri berbeza mengikut kawasan
- Tiada keupayaan memori dalam aplikasi robotik
Aplikasi Praktikal yang Berfungsi
Walaupun terdapat kekurangan ini, Gemini memang cemerlang dalam beberapa bidang praktikal. AI ini menunjukkan prestasi yang mengagumkan apabila membantu pengguna mencetuskan idea, memberikan maklum balas penulisan, atau menerangkan proses teknikal yang kompleks. Tugas-tugas berasaskan maklumat yang lebih mudah ini memainkan kekuatan AI tanpa memerlukan pemahaman yang lebih mendalam seperti yang diperlukan oleh tugas-tugas kreatif.
Aplikasi Demo yang Menarik
Di Google I/O, beberapa demonstrasi yang mengagumkan mempamerkan potensi Gemini di luar penjanaan teks dan imej asas. Para peserta mengalami robot kawalan suara yang boleh memanipulasi objek, teknologi percubaan pakaian maya yang menggambarkan pakaian secara realistik pada badan pengguna, dan penjanaan muzik berkuasa AI yang bertindak balas terhadap pelarasan masa nyata. Aplikasi-aplikasi ini memberi petunjuk kepada masa depan di mana AI membantu dengan tugas-tugas praktikal harian dan bukannya cuba menggantikan kreativiti manusia.
Ciri-ciri Gemini Pro yang Diuji:
- Pengeditan imej (penyingkiran objek, pengubahsuaian)
- Peniruan gaya dari imej rujukan
- Peningkatan imej HD
- Bantuan dan maklum balas penulisan
- Keupayaan penjelasan teknikal
Aplikasi Gemini yang Menjanjikan yang Ditunjukkan:
- Robotik kawalan suara
- Percubaan pakaian maya dengan AI
- Penjanaan muzik adaptif masa nyata dengan Lyria 2
- Penciptaan Bot Android khas
- Penjanaan video AI dengan Flow dan Veo
![]() |
---|
Menunjukkan ciri percubaan maya yang dipamerkan di Google I/O 2024 |
Batasan Ketersediaan Serantau
Bakal pelanggan harus ambil perhatian bahawa tidak semua ciri Gemini Pro yang diiklankan tersedia di setiap kawasan. AI itu sendiri mengakui batasan ini, menjelaskan bahawa ciri-ciri yang diumumkan pada acara seperti Google I/O sering dilancarkan secara beransur-ansur dan mungkin pada mulanya terhad kepada pasaran tertentu atau wujud dalam fasa eksperimen.
Kekurangan Integrasi
Satu kelemahan ketara bagi pengguna yang fokus pada produktiviti adalah integrasi terhad Gemini dengan perkhidmatan Google yang lain. Walaupun menjadi sebahagian daripada ekosistem Google, Gemini tidak dapat mengeksport hasil dengan betul ke Google Docs atau Sheets—satu ciri asas yang mengejutkan yang masih tidak tersedia tanpa mengira tahap langganan. Batasan ini mengurangkan kegunaannya secara ketara untuk persekitaran kerja kolaboratif.
Masa Depan Gemini
Google telah memposisikan Gemini sebagai pembantu AI universal dengan cita-cita yang melangkaui keupayaan semasa. Projek-projek seperti Gemini Robotics dan Flow (untuk penciptaan video AI) menunjukkan visi jangka panjang syarikat untuk AI yang boleh memahami dan berinteraksi dengan dunia fizikal. Apabila teknologi ini matang, ia mungkin menangani jurang pemahaman semasa yang menghalang AI daripada benar-benar memahami niat pengguna dan bukannya hanya mengikut arahan secara harfiah.
Berbaloi untuk Dinaik Taraf?
Buat masa ini, keputusan untuk menaik taraf ke Gemini Pro bergantung sebahagian besarnya pada kes penggunaan tertentu. Mereka yang mencari alat kreatif untuk manipulasi imej atau peniruan gaya mungkin mendapati tawaran semasa mengecewakan. Walau bagaimanapun, pengguna yang memerlukan bantuan dengan penyelidikan, penulisan, atau pembelajaran topik kompleks mungkin mendapati nilai yang mencukupi untuk menjustifikasikan langganan tersebut. Apabila Google terus menyempurnakan ciri-ciri ini dan melancarkan keupayaan baru, cadangan nilai mungkin menjadi lebih menarik untuk khalayak yang lebih luas.