Sebuah studi baru menemukan bahwa lelucon yang dibuat ChatGPT dianggap lebih lucu daripada lelucon yang dibuat manusia oleh 70% peserta, yang menunjukkan bahwa AI mungkin mengungguli manusia dalam hal humor. Penelitian tersebut, yang melibatkan tugas-tugas seperti membuat frasa baru dan judul-judul satir, menyoroti potensi AI dalam humor dan implikasinya bagi penulis profesional.
Sebuah studi psikologi dari USC menunjukkan bahwa lelucon yang dibuat oleh AI dianggap lebih lucu daripada yang dibuat oleh manusia. Peserta menilai tajuk berita yang dibuat oleh AI lebih lucu daripada tajuk berita dari The Onion.
Sebuah studi yang membandingkan lelucon yang disampaikan manusia dengan lelucon yang disampaikan oleh ChatGPT menunjukkan bahwa manusia perlu mengolah materi mereka.
Tim peneliti di balik studi yang diterbitkan dalam jurnal PLOS SATUmengambil tugas serius untuk membandingkan reaksi peserta terhadap lelucon yang ditulis oleh ChatGPT 3.5 dan lelucon lain yang ditulis oleh orang-orang.
Hal ini dilakukan dalam upaya untuk menentukan apakah kecerdasan buatan dapat mengecoh manusia hingga tertawa, kata Drew Gorenz, kandidat doktor dalam psikologi sosial di USC Dornsife College of Letters, Arts and Sciences.
“Karena ChatGPT sendiri tidak dapat merasakan emosi, tetapi ia dapat menceritakan lelucon baru lebih baik daripada manusia pada umumnya, penelitian ini memberikan bukti bahwa Anda tidak perlu merasakan emosi saat menghargai lelucon yang bagus untuk menceritakan lelucon yang benar-benar bagus sendiri,” kata Gorenz.
Satu studi membandingkan kelucuan lelucon baru yang dibuat oleh orang biasa dengan kelucuan lelucon baru yang dibuat oleh ChatGPT. Peserta melakukannya tanpa mengetahui penulisnya.
Para peneliti menemukan bahwa secara keseluruhan, hampir 70% peserta menilai lelucon yang dibuat ChatGPT lebih lucu daripada yang dibuat oleh manusia. Sedikit lebih dari 25% peserta menilai tanggapan yang dibuat oleh manusia lebih lucu, dan hanya sekitar 5% yang menilai lelucon dari kedua sumber sama-sama lucu. Hasilnya konsisten bahkan ketika para peneliti memeriksa perbedaan di berbagai demografi.
Untuk melihat bagaimana ChatGPT dapat bersaing dengan penulis humor profesional, para peneliti melakukan studi kedua dengan menantang ChatGPT untuk mengembangkan judul berita baru dengan gaya satir The Onion. Mereka kemudian meminta kelompok lain yang terdiri dari 200 peserta untuk menilai kelucuan judul berita asli Onion dan judul berita baru yang dibuat ChatGPT. Peserta menganggap judul berita ChatGPT sama lucunya dengan judul berita asli Onion.
Metode ilmiah untuk mendapatkan tawa
Bagaimana cara membuat orang dan AI membuat lelucon orisinal? Untuk studi pertama, ChatGPT dan 105 peserta menyelesaikan tiga tugas, masing-masing mencakup tiga perintah. Pada tugas pertama, mereka membuat frasa baru yang lucu untuk akronim umum. Pada tugas kedua, ChatGPT dan penulis manusia membuat jawaban lucu untuk frasa isian seperti, “Ruang yang kurang dikenal di Gedung Putih: _____.” Mereka juga diminta untuk membuat “lelucon pedas”, celaan lucu yang terinspirasi oleh skenario fiksi canggung seperti ini:
“Bayangkan salah satu teman Anda ingin tahu pendapat Anda tentang seberapa bagus dia bernyanyi. Dia bernyanyi selama satu atau dua menit untuk menunjukkan suaranya, dan Anda merasa ngeri — dia mungkin penyanyi terburuk yang pernah Anda dengar. Ketika dia bertanya, ‘Jadi bagaimana?’ Anda memutuskan untuk jujur, jadi Anda berkata, ‘Sejujurnya, saat mendengarkan itu seperti: _____’”
Ketiga tugas ini menghasilkan lebih dari 945 lelucon yang ditulis oleh 105 penulis. ChatGPT diminta untuk membuat 20 jawaban lucu untuk setiap pertanyaan dengan total 180 lelucon. Sekelompok peserta baru kemudian menilai kelucuan lelucon tersebut.
Dalam studi kedua, ChatGPT diberi tajuk berita asli dari The Onion dan diminta untuk membuat tajuk berita baru dengan gaya yang sama. Sekelompok 200 peserta diminta untuk menilai kelucuan tajuk berita asli Onion dan tajuk berita yang dibuat ChatGPT tanpa mengetahui siapa penulisnya.
Pandangan serius tentang humor
Gorenz mengatakan idenya untuk penelitian ini sebagian bermula dari perdebatan dunia hiburan mengenai kekhawatiran penulis tentang penggunaan model bahasa besar (LLM) seperti ChatGPT dalam produksi hiburan. Masalah ini semakin besar karena pemogokan baru-baru ini oleh para penulis dan aktor Hollywood yang khawatir bahwa penerapan LLM akan menimbulkan ancaman eksistensial terhadap profesi mereka masing-masing, terhadap seni, dan kreativitas manusia.
Gorenz, yang merupakan seorang komedian amatir, mengakui kecintaannya terhadap komedi yang telah lama dijalaninya telah menginspirasi penelitiannya dengan rekan penulisnya, Norbert Schwarz, yang merupakan salah satu direktur Universitas California, AS Dornsife Mind and Society Center dan pakar penilaian konsumen di Sekolah Bisnis USC Marshall.
Gorenz mengatakan studi mereka menimbulkan pertanyaan tentang penggunaan ChatGPT dan LLM lainnya dalam industri hiburan.
“Dampaknya lebih positif bagi orang-orang yang hanya ingin meraup keuntungan dari peningkatan komunikasi sehari-hari mereka dengan sedikit humor,” tulisnya dan Schwarz, seorang Provost Professor Psikologi dan Pemasaran.
“Namun bagi penulis komedi profesional, hasil penelitian kami menunjukkan bahwa LLM dapat menimbulkan ancaman serius terhadap pekerjaan,” imbuh Schwarz.
Apakah AI akan menang masih harus dilihat.
Referensi: “Seberapa lucu ChatGPT? Perbandingan lelucon yang dibuat manusia dan AI” oleh Drew Gorenz dan Norbert Schwarz, 3 Juli 2024, PLOS SATU.
DOI: 10.1371/jurnal.pone.0305364