Konsep arahan LLM rekursif, yang bermula sekurang-kurangnya sejak April 2023, telah berkembang daripada penerokaan akademik kepada teknik asas di sebalik beberapa produk AI komersial. Seperti yang dibincangkan oleh komuniti, kita sedang menyaksikan transformasi idea teoretikal kepada aplikasi praktikal pada kadar yang luar biasa.
Daripada Teori kepada Praktik
Apa yang bermula sebagai pendekatan eksperimental untuk melaksanakan rekursi menggunakan Bahasa Inggeris sebagai bahasa pengaturcaraan dan LLM sebagai persekitaran masa larian kini telah menjadi penting dalam sistem AI moden. Teknik ini melibatkan penciptaan arahan yang menghasilkan versi yang sedikit dikemas kini daripada diri mereka sendiri, secara efektif mengekalkan keadaan antara lelaran sambil bekerja ke arah penyelesaian. Seperti yang dinyatakan oleh seorang pengulas:
Saya melihat ini sama seperti gelung penaakulan. Ini adalah pendekatan yang saya gunakan untuk mengekod gelung penaakulan pseudo dengan cepat dalam projek tempatan. Seseorang telah bertanya dalam thread lain bagaimana saya boleh mendapatkan LLM untuk menghasilkan buku lengkap, ya, seperti ini sahaja.
Aplikasi praktikal ini menunjukkan bagaimana arahan rekursif telah berkembang melampaui minat teoretikal untuk menjadi teknik pembangunan yang sebenar.
![]() |
---|
Antara muka ini menunjukkan bagaimana pendekatan soalan berulang dapat menyelesaikan masalah matematik secara berkesan melalui penaakulan berstruktur |
Penggunaan Komersial dan Ekonomi Token
Perbincangan komuniti mendedahkan dimensi ekonomi yang menarik tentang arahan rekursif. Beberapa pengulas menunjukkan bahawa syarikat AI mempunyai insentif kewangan yang kuat untuk mempromosikan pendekatan berasaskan agen dan alat yang memanfaatkan arahan rekursif, kerana mereka meningkatkan penggunaan token dengan ketara. Apa yang boleh dicapai dalam satu arahan dan beberapa ratus token sering menjadi berpuluh-puluh arahan dan beribu-ribu token apabila dilaksanakan sebagai sistem rekursif.
Pemerhatian ini datang pada masa yang sangat relevan, dengan pengulas menyatakan bahawa OpenAI hanya melancarkan o1 (sistem berasaskan agen mereka) pada September 2024, walaupun idea-idea ini telah diterokai selama bertahun-tahun. Jurang antara pembangunan konsep dan pelaksanaan komersial menunjukkan betapa cepatnya bidang ini berkembang.
Konsep Utama dalam Pempromptan Rekursif LLM
- Mekanisme Asas: Prompt yang menghasilkan versi yang dikemas kini daripada dirinya sendiri
- Pengurusan Keadaan: Mengekalkan pemboleh ubah merentasi iterasi
- Aplikasi: Penyelesaian masalah, penghasilan kandungan (buku, dan lain-lain)
- Contoh Komersial: Alat seperti Cursor, o1 daripada OpenAI (dilancarkan September 2024)
- Konteks Sejarah: Implementasi pertama yang didokumentasikan sekurang-kurangnya sejak April 2023
- Faktor Ekonomi: Meningkatkan penggunaan token berbanding pendekatan prompt tunggal
Batasan dan Alternatif
Walaupun terdapat semangat, komuniti tetap pragmatik tentang batasan penggunaan LLM untuk tugas-tugas tertentu. Masalah matematik dan kerja petikan, sebagai contoh, sering ditonjolkan sebagai bidang di mana perisian yang dibina khusus mungkin lebih cekap daripada pendekatan berasaskan LLM. Perspektif praktikal ini menunjukkan bahawa walaupun arahan rekursif membuka kemungkinan baru, ia tidak selalu menjadi penyelesaian yang optimum.
Perbincangan juga menyentuh konsep yang lebih eksperimental, seperti mencipta LLM quines (program yang mereplikasi diri) dan membuktikan bahawa LLM berulang adalah Turing complete, menunjukkan bahawa penerokaan teoretikal teknik-teknik ini berterusan seiring dengan aplikasi komersial mereka.
Apabila teknik arahan rekursif berkembang daripada keingintahuan akademik kepada produk komersial, kita menyaksikan pelaksanaan praktikal idea-idea yang kelihatan hanya teoretikal dua tahun lalu. Kelajuan evolusi ini menggambarkan betapa cepatnya keupayaan AI maju dan dimonetisasi, walaupun penyelidik terus meneroka had teoretikal dan aplikasi praktikal mereka.
Rujukan: Recursive LLM prompts
![]() |
---|
Output terminal ini memaparkan hasil berangka yang mungkin timbul dalam eksperimen dengan LLM, menyoroti had praktikal model tersebut dalam tugas matematik |