Inovasi cip terbaru Google menandakan perubahan ketara dalam pendekatan syarikat terhadap pengkomputeran kecerdasan buatan, dengan fokus kepada permintaan yang semakin meningkat untuk inferens AI dan bukan hanya latihan. Gergasi teknologi ini telah menyedari bahawa apabila model AI berkembang ke arah keupayaan penaakulan, kos pengkomputeran semakin beralih daripada pembangunan kepada penempatan.
Peralihan kepada Pengkomputeran Inferens
Pada acara Google Cloud Next 25, Google telah memperkenalkan Ironwood, Tensor Processing Unit (TPU) generasi ke-7. Tidak seperti generasi sebelumnya yang diposisikan terutamanya untuk beban kerja latihan AI, Ironwood mewakili peralihan strategik ke arah inferens - proses membuat ramalan daripada model AI yang telah dilatih sebagai tindak balas kepada permintaan pengguna. Peralihan ini mengiktiraf titik perubahan ekonomi dalam kecerdasan buatan, di mana industri beralih daripada projek penyelidikan eksperimen kepada pelaksanaan praktikal dan meluas model AI oleh perniagaan.
Kemajuan Teknikal
Ironwood memberikan peningkatan teknikal yang mengagumkan berbanding pendahulunya, TPU Trillium generasi ke-6. Google mendakwa cip baru ini mencapai prestasi dua kali ganda bagi setiap watt, menghasilkan 29.3 trilion operasi titik terapung sesaat. Kapasiti memori telah ditingkatkan secara dramatik kepada 192GB memori jalur lebar tinggi (HBM) bagi setiap cip - enam kali lebih banyak daripada Trillium. Selain itu, jalur lebar memori telah dipertingkatkan 4.5 kali ganda untuk mencapai 7.2 terabit sesaat, membolehkan pergerakan data yang lebih besar di dalam cip dan antara sistem.
Spesifikasi TPU Ironwood Berbanding Generasi Sebelumnya (Trillium)
Ciri | Ironwood (Generasi ke-7) | Trillium (Generasi ke-6) | Peningkatan |
---|---|---|---|
Prestasi per watt | 29.3 TFLOPS | ~14.65 TFLOPS | 2x |
Kapasiti memori HBM | 192GB setiap cip | 32GB setiap cip | 6x |
Jalur lebar memori | 7.2 TBps | 1.6 TBps | 4.5x |
Pengiraan puncak setiap cip | 4,614 TFLOPs | Tidak dinyatakan | - |
Penskalaan maksimum | 9,216 cip setiap pod | "beratus-ratus ribu" | - |
Jumlah pengiraan pada skala penuh | 42.5 exaflops | Tidak dinyatakan | - |
Keupayaan Penskalaan
Mungkin yang paling mengagumkan adalah keupayaan penskalaan Ironwood. TPU ini boleh meningkat sehingga 9,216 cip setiap pod, menghasilkan kuasa pengkomputeran yang mengagumkan sebanyak 42.5 exaflops. Untuk memberi perspektif, Google menyatakan ini adalah lebih daripada 24 kali ganda kuasa pengkomputeran El Capitan, yang kini merupakan superkomputer terbesar di dunia. Potensi penskalaan yang besar ini dipertingkatkan lagi oleh tindanan perisian Pathways yang direka oleh Google DeepMind, yang membolehkan pembangun memanfaatkan berpuluh ribu TPU Ironwood yang bekerja secara bersama.
Implikasi Ekonomi
Masa pelancaran Ironwood adalah sangat penting memandangkan kos infrastruktur AI yang semakin meningkat. Penganalisis Wall Street semakin memberi tumpuan kepada perbelanjaan besar yang berkaitan dengan pembinaan dan penempatan sistem AI, terutamanya apabila model seperti Gemini dari Google beralih ke arah keupayaan penaakulan yang secara dramatik meningkatkan permintaan pengkomputeran. Dengan membangunkan cip inferens berprestasi tinggi sendiri, Google mungkin dapat mengurangkan kebergantungannya pada vendor seperti Nvidia, AMD, dan Intel, berpotensi menjimatkan berbilion dalam kos infrastruktur.
Kedudukan Pasaran
Walaupun Google telah membangunkan TPU selama lebih sedekad melalui enam generasi sebelumnya, penempatan eksplisit Ironwood sebagai cip inferens-pertama mewakili perubahan daripada pendekatan masa lalu. Sebelum ini, Google telah menggambarkan TPU sebagai pelaburan yang diperlukan untuk penyelidikan terkini tetapi bukan alternatif kepada cip daripada vendor terkenal. Pasaran inferens dianggap bervolum tinggi dalam dunia cip, kerana ia harus memenuhi keperluan ribuan atau jutaan pelanggan yang memerlukan ramalan harian daripada rangkaian neural yang terlatih.
Perkembangan Perisian
Selain pengumuman perkakasan, Google juga mendedahkan bahawa ia menjadikan perisian Pathways tersedia kepada orang ramai melalui Pathways on Cloud. Perisian ini mengagihkan beban kerja pengkomputeran AI merentasi komputer yang berbeza, berpotensi membolehkan pelanggan mencapai kecekapan dan penggunaan yang lebih baik untuk sumber AI mereka.
Masa Depan Pengkomputeran AI
Dengan Ironwood, Google memposisikan dirinya di barisan hadapan apa yang dilihatnya sebagai generasi seterusnya pengkomputeran AI - beralih daripada model responsif yang hanya menyampaikan maklumat kepada sistem proaktif yang mampu mentafsir dan membuat inferens. Seperti yang dinyatakan oleh Amin Vahdat, VP/GM of ML, Systems & Cloud AI di Google, Ironwood dibina khusus untuk memperkasakan model AI pemikiran dan inferens pada skala besar, menandakan visi Google untuk aplikasi AI yang lebih canggih yang boleh menaakul melalui masalah kompleks dan bukan sekadar bertindak balas terhadap arahan.