Penyelesaian masalah telah menjadi salah satu keupayaan semula jadi manusia. Sejak zaman primitif kita, apabila cabaran utama dalam hidup kita tidak dimakan oleh binatang pemangsa pada zaman kontemporari untuk mendapatkan sesuatu yang dihantar pulang dengan cepat, kita telah menggabungkan kreativiti, penaakulan logik dan kecerdasan kita untuk menghasilkan resolusi bagi konflik .
Kini, ketika kita menyaksikan asal usul makhluk AI, kita berhadapan dengan cabaran baharu berkenaan dengan keupayaan membuat keputusan mereka. Walaupun dekad sebelumnya adalah tentang meraikan kemungkinan dan potensi model dan aplikasi AI, dekad ini adalah tentang melangkah lebih jauh - untuk mempersoalkan kesahihan keputusan yang diambil oleh model sedemikian dan untuk menyimpulkan alasan di sebaliknya.
Memandangkan kecerdasan buatan (XAI) yang boleh dijelaskan semakin menonjol, inilah masanya untuk membincangkan konsep utama dalam membangunkan model AI yang kami panggil Rangkaian-Pemikiran Mendorong. Dalam artikel ini, kami akan menyahkod dan menyahmistifikasi secara meluas maksud ini dan istilah mudah.
Apakah Rangkaian Pemikiran yang Mendorong?
Apabila minda manusia bersedia dengan cabaran atau masalah yang kompleks, ia secara semula jadi cuba memecahkannya kepada serpihan langkah berurutan yang lebih kecil. Didorong oleh logik, minda mewujudkan perkaitan dan mensimulasikan senario sebab-akibat untuk menyusun strategi penyelesaian terbaik bagi cabaran itu.
Proses mereplikasi ini dalam model atau sistem AI ialah Rangkaian-Pemikiran dorongan.
Seperti namanya, model AI menjana satu siri atau rangkaian pemikiran logik (atau langkah) untuk mendekati pertanyaan atau konflik. Bayangkan ini sebagai memberi arahan belokan demi belokan kepada seseorang yang meminta laluan ke destinasi.
Ini adalah teknik utama yang digunakan dalam model penaakulan OpenAI. Memandangkan mereka direka untuk berfikir sebelum mereka menjana respons atau jawapan, mereka telah dapat memecahkan peperiksaan kompetitif yang diambil oleh manusia.
[Baca juga: Semua yang anda perlu tahu tentang LLM]
Faedah Rangkaian Pemikiran
Apa-apa sahaja yang didorong oleh logik menghasilkan kelebihan yang ketara. Begitu juga, model yang dilatih mengenai dorongan rantaian pemikiran menawarkan bukan sahaja ketepatan dan kaitan tetapi pelbagai manfaat termasuk:
Meningkatkan penyelesaian masalah keupayaan, di mana kepentingannya adalah kritikal dalam bidang seperti penjagaan kesihatan dan kewangan. LLM yang menggunakan rantaian pemikiran yang mendorong lebih memahami cabaran yang jelas dan asas serta menjana respons selepas mempertimbangkan kebarangkalian yang berbeza dan senario terburuk.
Mengurangkan andaian dan keputusan yang dihasilkan daripada andaian kerana model menggunakan pemikiran dan pemprosesan logik dan berurutan untuk membuat kesimpulan dan bukannya membuat kesimpulan.
Peningkatan serba boleh kerana model tidak perlu dilatih dengan ketat pada kes penggunaan baru kerana ia mengikut logik dan bukan tujuan.
Dioptimumkan kepaduan dalam tugasan yang melibatkan jawapan berlipat ganda/berbilang bahagian.
Anatomi Fungsi Teknik Mendorong Rantaian Pemikiran
Jika anda biasa dengan seni bina perisian monolitik, anda akan tahu bahawa keseluruhan aplikasi perisian dibangunkan sebagai satu unit koheren tunggal. Memudahkan cukai kompleks sedemikian tiba dengan kaedah seni bina perkhidmatan mikro yang melibatkan pemecahan perisian kepada perkhidmatan bebas. Ini menghasilkan pembangunan produk yang lebih pantas dan kefungsian yang lancar juga.
Gesaan CoT dalam AI adalah serupa, di mana LLM dibimbing melalui satu siri proses penaakulan berurutan untuk menghasilkan tindak balas. Ini dilakukan melalui:
- Arahan eksplisit, di mana model diarahkan secara langsung untuk mendekati masalah secara berurutan melalui arahan mudah.
- Arahan tersirat lebih halus dan bernuansa pendekatannya. Dalam hal ini, model diambil melalui logik tugas yang sama dan memanfaatkan keupayaan inferens dan pemahamannya untuk meniru logik untuk masalah yang dibentangkan.
- Contoh tunjuk cara, di mana model akan meletakkan penaakulan langkah demi langkah dan menjana cerapan tambahan untuk menyelesaikan masalah.
3 Kejadian Dunia Nyata Di mana CoT Prompting Digunakan
Model Keputusan Kewangan
| Multimodal CoT Dalam Bot
| Perkhidmatan Penjagaan Kesihatan
|
---|---|---|
Dalam sektor yang sangat tidak menentu ini, dorongan CoT boleh digunakan untuk memahami trajektori kewangan yang berpotensi bagi sesebuah syarikat, menjalankan penilaian risiko bagi pencari kredit dan banyak lagi. | Chatbots yang dibangunkan dan digunakan untuk perusahaan memerlukan fungsi khusus. Mereka perlu mempamerkan kebolehan dalam memahami pelbagai format input. Gesaan CoT berfungsi paling baik dalam kes sedemikian, di mana bot perlu menggabungkan gesaan teks dan imej untuk menjana respons bagi pertanyaan. | Daripada mendiagnosis pesakit daripada data penjagaan kesihatan kepada menjana pelan rawatan yang diperibadikan untuk pesakit, dorongan CoT boleh melengkapkan matlamat penjagaan kesihatan untuk klinik dan hospital. |
Contoh
Pertanyaan Pelanggan: Saya perhatikan transaksi pada akaun saya yang saya tidak kenali, kad debit saya telah hilang dan saya ingin menyediakan makluman untuk transaksi akaun saya. Bolehkah anda membantu saya dengan isu-isu ini?
Langkah 1: Kenal pasti dan Kategorikan Isu
- Transaksi yang tidak diiktiraf.
- Kad debit hilang.
- Menyediakan makluman transaksi.
Langkah 2: Atasi Transaksi Tidak Diiktiraf
Minta Butiran: Bolehkah anda memberikan tarikh dan jumlah transaksi?
- Cawangan 1: Jika butiran diberikan:
- Semak urus niaga. Jika menipu, tanya sama ada pelanggan ingin mempertikaikannya.
- Cawangan 2: Jika tiada butiran:
- Tawarkan untuk menyediakan senarai transaksi terkini.
Langkah 3: Atasi Kad Debit yang Hilang
Pegunkan Kad: Syorkan pembekuan segera.
- Cawangan 1: Jika pelanggan bersetuju:
- Bekukan kad dan tanya sama ada mereka mahukan pengganti. Sahkan alamat penghantaran.
- Cawangan 2: Jika pelanggan menolak:
- Nasihatkan memantau akaun untuk transaksi yang tidak dibenarkan.
Langkah 4: Sediakan Makluman Transaksi
Pilih Kaedah Makluman: SMS, e-mel, atau kedua-duanya?
- Cawangan 1: Jika pelanggan memilih:
- Tetapkan makluman untuk urus niaga melebihi jumlah yang ditentukan. Minta jumlahnya.
- Cawangan 2: Jika tidak pasti:
- Cadangkan jumlah lalai (cth, $50) dan sahkan.
Langkah 5: Sediakan Ringkasan dan Langkah Seterusnya
- Menyiasat transaksi yang tidak diiktiraf.
- Membekukan kad debit dan mungkin mengeluarkan penggantian.
- Menyediakan makluman transaksi seperti yang diminta.
Rasional:
Proses ini dengan cekap menangani pelbagai pertanyaan pelanggan melalui langkah yang jelas dan cabang keputusan, memastikan penyelesaian yang komprehensif.
Had dorongan CoT
Rangkaian pemikiran sememangnya berkesan tetapi ia juga tertakluk kepada kes penggunaan yang digunakan dan beberapa faktor lain. Terdapat cabaran khusus yang berkaitan dengan Gesaan CoT dalam AI yang menghalang pihak berkepentingan daripada memanfaatkan sepenuhnya potensinya. Mari kita lihat kesesakan biasa:
Tugas Mudah Terlalu Rumit
Walaupun gesaan CoT berfungsi paling baik untuk tugas yang kompleks, ia boleh merumitkan tugas mudah dan menjana respons yang salah. Untuk tugasan yang tidak memerlukan alasan, model jawapan langsung berfungsi dengan baik.
Peningkatan Beban Pengiraan
Pemprosesan gesaan CoT memerlukan beban pengiraan yang ketara dan jika teknik itu digunakan pada model yang lebih kecil yang dibina dengan kebolehan pemprosesan terhad, ia mungkin mengatasi mereka. Akibat daripada penggunaan sedemikian mungkin termasuk masa tindak balas yang lebih perlahan, kecekapan yang lemah, ketidakselarasan dan banyak lagi.
Kualiti Kejuruteraan Segera AI
Gesaan CoT dalam AI berfungsi di bawah andaian (atau prinsip) bahawa gesaan tertentu dinyatakan dengan baik, berstruktur dan jelas. Jika gesaan tidak mempunyai faktor ini, gesaan CoT kehilangan keupayaan untuk memahami keperluan, mengakibatkan penjanaan langkah berurutan yang tidak relevan dan akhirnya tindak balas.
Mengurangkan Keupayaan Pada Skala
Pihak berkepentingan boleh mengalami model mereka bergelut jika mereka perlu memanfaatkan dorongan rantaian pemikiran untuk volum besar set data atau kerumitan masalah. Untuk tugasan yang melibatkan langkah penaakulan yang lebih besar, teknik ini mungkin memperlahankan masa tindak balas, menjadikannya tidak sesuai untuk aplikasi atau kes penggunaan yang menuntut penjanaan respons masa nyata.
Gesaan CoT ialah teknik fenomenal untuk mengoptimumkan prestasi Model Bahasa Besar. Jika kelemahan tersebut boleh ditangani dan diselesaikan melalui teknik pengoptimuman atau penyelesaian, ia boleh membuahkan hasil yang luar biasa. Seiring dengan kemajuan teknologi, ia akan menjadi menarik untuk melihat bagaimana dorongan Rantaian Pemikiran berkembang dan menjadi lebih ringkas lagi lebih khusus juga.