Pembantu AI Google Gemini terus berkembang dengan pesat dengan keupayaan baharu yang penting ditemui dan dilancarkan. Penemuan terkini mendedahkan keupayaan analisis video yang akan datang dan fungsi carian sejarah perbualan, sementara model terbaru Gemini 2.5 Pro telah mengagumkan pengguna sehingga menyertai barisan alat AI berbayar yang berbaloi untuk dilanggan.
Analisis Video Bakal Hadir ke Gemini
Penelitian APK Gemini untuk Android (versi 16.15.38.sa.arm64 beta) telah mendedahkan bahawa Google sedang menyediakan untuk menambah keupayaan analisis video kepada pembantu AI-nya. Pembangun telah berjaya mengaktifkan ciri yang belum dilancarkan ini, membolehkan pengguna memuat naik video dan bertanya soalan kepada Gemini tentang kandungannya. Pelaksanaannya kelihatan dapat mengendalikan kandungan video sehingga lima minit, dengan AI menganalisis elemen visual dengan tepat, mengenal pasti lokasi berdasarkan petunjuk seni bina, dan memberikan maklumat kontekstual tentang rakaman tersebut.
Fungsi ini boleh terbukti berguna untuk meringkaskan mesyuarat yang dirakam, menyelesaikan masalah teknikal melalui rakaman skrin, atau menganalisis kandungan visual untuk pelbagai tujuan. Ciri ini kelihatan berada dalam peringkat pengujian akhir, mencadangkan pengumuman rasmi mungkin akan datang tidak lama lagi, berkemungkinan pada acara Google I/O yang akan datang.
Ciri-ciri Gemini yang Akan Datang
- Analisis video dengan had muat naik 5 minit
- Fungsi carian sejarah perbualan
- Keupayaan analisis dokumen yang dipertingkatkan
Fungsi Carian untuk Sejarah Perbualan
Satu lagi penambahbaikan penting yang ditemui dalam versi beta yang sama menangani jurang kebolehgunaan yang ketara dalam Gemini. Pada masa ini, walaupun AI mengekalkan sejarah komprehensif perbualan lepas, tiada cara yang efisien untuk mencari melaluinya. Kekurangan ini telah menjadi sangat mengecewakan bagi pengguna berat yang cuba mencari maklumat tertentu dari interaksi sebelumnya.
Penelitian APK mendedahkan rentetan yang berkaitan dengan SEARCH_CHAT_HISTORY, menunjukkan Google sedang membangunkan penyelesaian untuk masalah ini. Walaupun ciri ini kelihatan berada dalam peringkat pembangunan awal dengan tiada pelaksanaan berfungsi yang kelihatan lagi, ia mewakili peningkatan kualiti hidup yang penting yang sejajar dengan kecekapan teras Google dalam teknologi carian.
Gemini 2.5 Pro Mengagumkan Pengguna
Di luar ciri-ciri yang akan datang ini, pelancaran terbaru Google iaitu Gemini 2.5 Pro telah membuat kejutan di kalangan peminat AI. Model ini mewakili kemajuan yang ketara berbanding versi sebelumnya, dengan keupayaan yang termasuk penaakulan kompleks, pengkodan, dan menganalisis dokumen besar. Tetingkap konteksnya yang besar sehingga 1 juta token (dengan rancangan untuk berkembang kepada 2 juta) membolehkannya memproses dan memahami lebih banyak maklumat sekaligus berbanding versi sebelumnya.
Bersama dengan Gemini 2.5 Pro, Google juga memperkenalkan Gemini 2.5 Flash, yang dioptimumkan untuk kelajuan dan kecekapan kos dalam aplikasi bervolum tinggi seperti perkhidmatan pelanggan. Kedua-dua model menyokong input multimodal merentasi teks, imej, audio, dan video, dengan ciri-ciri seperti Manual Reasoning Control untuk menyesuaikan bagaimana model berfikir melalui masalah secara menyeluruh.
Penambahbaikan telah menjadi cukup besar sehingga pengguna AI yang selektif yang biasanya mengehadkan langganan berbayar mereka turut menambah Gemini ke dalam alat mereka. Kunci untuk mendapatkan yang terbaik daripada model-model canggih ini kelihatan dalam cara pengguna mendekatinya—dengan komunikasi yang jelas, arahan yang khusus, dan jangkaan yang realistik tentang keupayaan dan batasan mereka.
Ciri-ciri Gemini 2.5 Pro
- Tetingkap konteks sehingga 1 juta token (2 juta akan datang tidak lama lagi)
- Sokongan input multimodal (teks, imej, audio, video)
- Kawalan Penaakulan Manual untuk melaraskan pemikiran model
- Canvas: ruang interaktif untuk pengeditan dokumen dan kod
- API Langsung untuk penstriman masa nyata merentasi pelbagai modaliti
Landskap AI yang Berkembang
Walaupun Gemini 2.5 Pro mewakili langkah besar ke hadapan untuk tawaran AI Google, pengguna menyatakan bahawa integrasi dalam ekosistem Google masih terasa agak tidak bersambung apabila beralih antara fungsi yang berbeza. Model ini juga terus menghadapi cabaran dengan penulisan bernuansa, pemikiran yang lebih mendalam, dan halusinasi sesekali—isu yang biasa di kalangan model bahasa besar.
Ketika alat AI terus matang, perbezaan antara mereka menjadi kurang tentang keupayaan asas dan lebih tentang bagaimana pengguna boleh memanfaatkannya dengan berkesan untuk aliran kerja tertentu. Dengan ciri-ciri yang akan datang dan penambahbaikan terkini ini, Google sedang memposisikan Gemini sebagai pesaing serius dalam ruang pembantu AI yang semakin kompetitif, terutamanya bagi pengguna yang menghargai keupayaan analisis multimodal dan integrasi mendalam dengan ekosistem Google.