Dengan Teknologi OpenAI o1, ChatGPT Kini Bisa ‘Menalar’ Layaknya Pakar!


Chatbot daring seperti ChatGPT dari OpenAI dan Gemini dari Google kerap mengalami kesulitan dalam menyelesaikan masalah matematika sederhana. Kode komputer yang mereka hasilkan seringkali bermasalah atau tidak lengkap, dan terkadang mereka bahkan memberikan informasi yang keliru.

Pada Kamis (12/9/2024), OpenAI meluncurkan versi terbaru ChatGPT ‘ yang diharapkan dapat mengatasi kelemahan tersebut. Perusahaan yang bermarkas di San Francisco, California tersebut mengumumkan bahwa chatbot ini, yang didukung oleh teknologi kecerdasan buatan baru bernama OpenAI o1, mampu “menalar” melalui tugas-tugas yang melibatkan matematika, pemrograman, dan sains.

“Dengan model sebelumnya seperti ChatGPT, Anda menanyakan pertanyaan dan mereka langsung merespons,” kata Jakub Pachocki, Kepala Ilmuwan OpenAI. 

“Model ini bisa mengambil waktu lebih lama. Ia bisa memikirkan masalah—dalam bahasa Inggris—dan mencoba memecahnya serta mencari sudut pandang untuk memberikan jawaban terbaik.”

Dalam demonstrasi kepada The New York Times, Dr. Pachocki dan Szymon Sidor, rekan teknis di OpenAI, menunjukkan bagaimana chatbot ini menyelesaikan acrostic, sejenis teka-teki kata yang jauh lebih kompleks daripada teka-teki silang biasa. 

Chatbot tersebut juga berhasil menjawab pertanyaan kimia setingkat Ph.D. dan mendiagnosis penyakit berdasarkan laporan rinci tentang gejala dan riwayat pasien.

Upaya Meningkatkan Penalaran AI

Teknologi baru ini merupakan bagian dari upaya yang lebih luas untuk mengembangkan kecerdasan buatan yang dapat menalar melalui tugas-tugas kompleks. 

Perusahaan seperti Google dan Meta juga tengah mengembangkan teknologi serupa, sementara Microsoft dan anak perusahaannya, GitHub, bekerja untuk mengintegrasikan sistem baru OpenAI ke dalam produk mereka.

Tujuannya adalah membangun sistem yang dapat memecahkan masalah secara hati-hati dan logis melalui serangkaian langkah terpisah, mirip dengan cara manusia berpikir. 

Teknologi ini berpotensi sangat berguna bagi pemrogram komputer yang menggunakan AI untuk menulis kode. Selain itu, teknologi ini dapat meningkatkan kualitas tutor otomatis dalam bidang matematika dan subjek lainnya.

OpenAI juga menyatakan bahwa teknologi baru ini dapat membantu fisikawan dalam menghasilkan formula matematika yang rumit dan mendukung peneliti kesehatan dalam eksperimen mereka.

Mengatasi Keterbatasan Sebelumnya

Sejak peluncuran ChatGPT pada akhir 2022, OpenAI telah menunjukkan bahwa mesin dapat menangani permintaan dengan cara yang lebih mirip manusia—menjawab pertanyaan, menulis makalah, bahkan menghasilkan kode komputer. Namun, respons yang diberikan seringkali memiliki kekurangan, seperti kesalahan dalam matematika sederhana, kode yang bermasalah, atau informasi yang tidak akurat.

ChatGPT belajar melalui analisis sejumlah besar teks dari internet, termasuk artikel Wikipedia, buku, dan log obrolan. Dengan mengidentifikasi pola dalam teks tersebut, ia belajar untuk menghasilkan teks sendiri. Namun, karena internet dipenuhi dengan informasi yang tidak akurat, teknologi ini cenderung mengulangi ketidakbenaran tersebut dan terkadang membuat informasi yang salah.

Dr. Pachocki, Mr. Sidor, dan tim mereka berusaha mengurangi kelemahan ini dengan menggunakan metode reinforcement learning atau pembelajaran penguatan. 

Melalui proses ini—yang dapat berlangsung selama berminggu-minggu atau berbulan-bulan—sistem belajar berperilaku melalui percobaan dan kesalahan yang ekstensif.

Dengan menyelesaikan berbagai masalah matematika, misalnya, sistem dapat belajar metode mana yang menghasilkan jawaban benar dan mana yang tidak. Jika proses ini diulang dengan jumlah masalah yang sangat besar, sistem dapat mengidentifikasi pola. Namun, meskipun demikian, sistem ini tidak serta merta dapat menalar seperti manusia dan masih bisa membuat kesalahan atau memberikan informasi yang keliru.

“Itu tidak akan sempurna,” kata Mr. Sidor. “Tetapi Anda dapat mempercayai bahwa ia akan bekerja lebih keras dan lebih mungkin menghasilkan jawaban yang benar.”

Ketersediaan untuk Publik

Akses ke teknologi baru ini mulai dibuka pada hari Kamis untuk konsumen dan bisnis yang berlangganan layanan ChatGPT Plus dan ChatGPT Teams. OpenAI juga menawarkan teknologi ini kepada pengembang perangkat lunak dan bisnis yang membangun aplikasi AI mereka sendiri.

OpenAI menyatakan bahwa teknologi baru ini menunjukkan peningkatan kinerja dalam beberapa tes standar dibandingkan dengan teknologi sebelumnya. Pada ujian kualifikasi untuk International Mathematical Olympiad (IMO)—kompetisi matematika terkemuka untuk siswa sekolah menengah—teknologi sebelumnya hanya mencapai skor 13 persen. OpenAI o1, menurut perusahaan, mencapai skor 83 persen.

Namun, tes standar tidak selalu menjadi indikator yang baik tentang bagaimana teknologi akan berperforma dalam situasi nyata. Meskipun sistem mungkin unggul dalam menjawab pertanyaan tes matematika, ia masih bisa kesulitan dalam mengajarkan matematika.

“Ada perbedaan antara pemecahan masalah dan memberikan bantuan,” kata Angela Fan, ilmuwan riset di Meta. “Model baru yang mampu menalar dapat memecahkan masalah. Namun, itu sangat berbeda dengan membantu seseorang menyelesaikan pekerjaan rumah mereka.”