Alat Pengkodan AI Menunjukkan Hasil Bercampur: Revolusioner dalam Syarikat Permulaan tetapi Memberi Impak Minimum terhadap Produktiviti di Tempat Kerja

BigGo Editorial Team
Alat Pengkodan AI Menunjukkan Hasil Bercampur: Revolusioner dalam Syarikat Permulaan tetapi Memberi Impak Minimum terhadap Produktiviti di Tempat Kerja

Penggunaan alat AI seperti ChatGPT yang pesat telah mencetuskan perbahasan tentang potensi transformasi di tempat kerja. Walaupun golongan evangelis teknologi mengumumkan era baharu produktiviti, kajian terkini mendedahkan realiti yang lebih kompleks di mana kesan AI berbeza-beza mengikut konteks dan pendekatan pelaksanaan yang berbeza.

Kebangkitan Vibe Coding dalam Syarikat Permulaan

Fenomena baru yang dipanggil vibe coding semakin mendapat perhatian dalam ekosistem syarikat permulaan, terutamanya di kalangan syarikat yang disokong oleh Y Combinator. Pendekatan ini melibatkan penggunaan model bahasa besar seperti ChatGPT untuk menjana kod daripada arahan bahasa semula jadi, secara efektif menterjemahkan niat kepada perisian berfungsi dengan pengetahuan pengaturcaraan tradisional yang minimum. Menurut Garry Tan, CEO Y Combinator, kira-kira 25% syarikat dalam kumpulan terbaru mereka menggunakan AI untuk menjana 95% atau lebih kod mereka, dengan beberapa syarikat permulaan mengalami kadar pertumbuhan 10% seminggu. Kumpulan terbaru pemecut ini sangat cenderung kepada usaha berasaskan AI, dengan kira-kira 80% daripada mereka bertaruh bahawa LLM boleh mengendalikan sebahagian besar beban kerja pembangunan mereka.

Penggunaan AI oleh Y Combinator

  • 25% daripada syarikat kumpulan terkini menggunakan AI untuk menghasilkan 95%+ kod mereka
  • 80% daripada kohort tertumpu pada usaha berasaskan AI
  • Beberapa syarikat permulaan berkembang pada kadar 10% setiap minggu

Semakan Realiti: Penanda Aras Menunjukkan Batasan

Walaupun terdapat semangat yang tinggi, penanda aras memberikan cerita yang lebih terukur tentang keupayaan pengkodan AI. Alat seperti SWE-Bench dan SWE-PolyBench menguji model AI dalam ratusan tugas pengaturcaraan dan senario pembetulan pepijat. Walaupun prestasi telah meningkat secara dramatik—daripada lulus kira-kira 5% cabaran SWE-Bench pada 2023 kepada lebih 60% hari ini—keputusan berbeza-beza mengikut rangka kerja pengujian yang berbeza. Pada SWE-PolyBench Amazon, model teratas menyelesaikan hanya 22.6% masalah, dan pada Coding Index Artificial Analysis, model terbaik mendapat skor 63 berbanding 96 pada Math Index. Ini menunjukkan AI masih lebih baik dalam formulasi matematik berbanding pembangunan kod berfungsi.

Prestasi Penanda Aras Pengkodan AI

  • SWE-Bench: Model terbaik kini lulus lebih 60% cabaran (meningkat daripada 5% pada 2023)
  • SWE-PolyBench dari Amazon: Model terbaik hanya menyelesaikan 22.6% masalah
  • Indeks Pengkodan Artificial Analysis: Model terbaik mencatat skor 63 (berbanding 96 pada Indeks Matematik)

Impak Minimum terhadap Produktiviti di Tempat Kerja

Kajian penting dari National Bureau of Economic Research yang mengkaji penggunaan chatbot AI di 7,000 tempat kerja di Denmark mendapati peningkatan produktiviti yang sangat sederhana. Ahli ekonomi Anders Humlum dan Emilie Vestergaard menganalisis 25,000 pekerja merentasi pekerjaan yang dipercayai terdedah kepada gangguan AI, termasuk akauntan, pembangun perisian, dan profesional pemasaran. Penemuan mereka mendedahkan bahawa pengguna AI hanya menjimatkan kira-kira 3% masa mereka secara purata, dengan hanya 3%-7% daripada peningkatan produktiviti ini diterjemahkan kepada gaji yang lebih tinggi. Kajian ini menyimpulkan bahawa chatbot AI tidak mempunyai kesan signifikan terhadap pendapatan atau jam kerja yang direkodkan dalam mana-mana pekerjaan.

Kesan Produktiviti AI (Kajian NBER)

  • Purata penjimatan masa: 3%
  • Peningkatan produktiviti yang diberikan kepada pekerja sebagai kenaikan gaji: 3-7%
  • Peruntukan masa yang dijimatkan oleh pekerja: >80% untuk tugas kerja lain, <10% untuk rehat/masa lapang

Pendemokrasian Pengkodan

Walaupun terdapat batasan ini, alat pengkodan AI sedang mendemokrasikan pembangunan perisian dengan membolehkan bukan pengaturcara membina aplikasi yang berfungsi. Pengaturcara amatur kini boleh menggunakan ChatGPT untuk mencipta permainan asas atau simulasi, dengan AI menghasilkan kod yang berfungsi pada percubaan pertama dan melaksanakan peningkatan yang diminta. Kebolehcapaian ini boleh membuka permintaan terpendam yang besar untuk penciptaan perisian di kalangan artis, usahawan, dan lain-lain yang sebelum ini tidak mempunyai latihan pengaturcaraan formal.

Penyahpepijatan Kekal sebagai Kekangan Kritikal

Satu cabaran penting dengan kod yang dihasilkan oleh AI adalah penyahpepijatan. Apabila kod yang dihasilkan oleh AI rosak, penyelesaiannya tidak sentiasa jelas—walaupun kepada AI itu sendiri. Microsoft sedang menangani masalah ini melalui Debug-Gym, sistem latihan yang direka untuk membantu LLM mempelajari pendekatan penyahpepijatan yang serupa dengan pembangun manusia, menggunakan penaakulan pelbagai langkah berbanding pemadanan corak. Walaupun ujian awal menunjukkan peningkatan, pakar berpendapat bahawa penyahpepijatan yang mantap masih memerlukan pengawasan manusia. Penjanaan kod yang lebih mudah juga mewujudkan masalah jumlah, dengan lebih banyak kod dihasilkan tanpa dokumentasi atau semakan yang teliti.

Pelaksanaan Lebih Penting daripada Teknologi

Kajian NBER menekankan bahawa faktor organisasi mempengaruhi kesan AI secara signifikan. Di tempat kerja di mana majikan secara aktif menggalakkan penggunaan AI dan melatih pekerja dalam penggunaannya, peningkatan produktiviti adalah lebih ketara. Ramai pekerja menggunakan alat AI tanpa sokongan jelas daripada pihak pengurusan, menyekat peluang untuk memanfaatkan peningkatan produktiviti untuk kemajuan kerjaya atau rundingan pampasan. Selain itu, pekerja mungkin teragak-agak untuk mengiklankan produktiviti mereka yang dipertingkatkan oleh AI kerana takut hanya diberi lebih banyak kerja tanpa pampasan tambahan.

Penggunaan Korporat Didorong oleh FOMO

Tinjauan IBM terhadap 2,000 CEO mendedahkan bahawa hanya 25% projek AI memberikan pulangan pelaburan yang dijanjikan. Walaupun begitu, hampir dua pertiga CEO mengakui bahawa risiko ketinggalan mendorong mereka untuk melabur dalam beberapa teknologi sebelum mereka mempunyai pemahaman yang jelas tentang nilai yang dibawa kepada organisasi. Ini menunjukkan bahawa penggunaan AI korporat sering didorong lebih oleh ketakutan ketinggalan daripada nilai yang telah dibuktikan.

Jalan Panjang ke Arah Transformasi

Pemenang Hadiah Nobel, Daron Acemoglu, menganggarkan peningkatan produktiviti AI pada kira-kira 1.1% hingga 1.6% daripada KDNK dalam dekad akan datang—signifikan bagi ekonomi maju seperti A.S., tetapi jauh daripada penggandaan KDNK yang transformatif seperti yang diramalkan oleh sesetengah ahli teknologi. Seperti revolusi teknologi sebelumnya, merealisasikan potensi penuh AI akan memerlukan pelarasan organisasi, pelaburan pelengkap, dan peningkatan kemahiran pekerja melalui latihan dan pembelajaran di tempat kerja. Revolusi Perindustrian mengubah masyarakat selama beberapa dekad, bukan semalaman, dan kesan AI mungkin mengikuti trajektori yang serupa.