Kandungan
- 1 Pengenalan
- 2 Metodologi
- 3 Pelaksanaan Teknikal
- 4 Keputusan dan Analisis
- 5 Kerangka Kajian Kes
- 6 Aplikasi Masa Depan
- 7 Analisis Kritikal
- 8 Rujukan
1 Pengenalan
Pencerita yang tidak boleh dipercayai merupakan cabaran signifikan dalam linguistik pengiraan, terutamanya apabila akaun orang pertama berkembang pesat merentas platform digital. Kajian ini menghubungkan teori sastera dari naratologi dengan teknik pemprosesan bahasa moden untuk membangunkan sistem pengelasan automatik untuk kebolehpercayaan pencerita. Kerja ini menangani jurang kritikal dalam penilaian kepercayaan untuk naratif peribadi merentas domain termasuk media sosial, ulasan, dan komunikasi profesional.
2 Metodologi
2.1 Dataset TUN A
Dataset TUN A (Taksonomi Anotasi Pencerita Tidak Boleh Dipercayai) merangkumi naratif beranotasi pakar dari pelbagai domain: catatan blog, perbincangan subreddit, ulasan hotel, dan karya sastera. Dataset ini termasuk 1,200 contoh beranotasi dengan label kebolehpercayaan multidimensi.
2.2 Kerangka Klasifikasi Ketidakbolehpercayaan
Tiga jenis ketidakbolehpercayaan berbeza ditakrifkan: Intra-naratif (ketidakselarasan dalaman dan ciri verbal), Inter-naratif (percanggahan antara pencerita utama dan sekunder), dan Inter-teks (konflik dengan pengetahuan faktual luaran).
2.3 Persediaan Eksperimen
Eksperimen menggunakan kedua-dua LLM berat terbuka (Llama-2, Mistral) dan proprietari (GPT-4, Claude-2) dalam konfigurasi few-shot, fine-tuning, dan pembelajaran kurikulum. Pendekatan pembelajaran kurikulum secara progresif mendedahkan model kepada corak kebolehpercayaan yang semakin kompleks.
3 Pelaksanaan Teknikal
3.1 Kerangka Matematik
Masalah klasifikasi kebolehpercayaan diformalkan sebagai: $P(R|T) = \frac{P(T|R)P(R)}{P(T)}$ di mana $R$ mewakili label kebolehpercayaan dan $T$ mewakili ciri teks. Pengekstrakan ciri menggunakan mekanisme perhatian transformer: $Attention(Q,K,V) = softmax(\frac{QK^T}{\sqrt{d_k}})V$
3.2 Seni Bina Model
Seni bina penyelit dual memproses kandungan naratif dan isyarat kontekstual secara berasingan sebelum lapisan gabungan. Model-model ini menggabungkan objektif pembelajaran pelbagai tugas untuk mengoptimumkan ketiga-tiga jenis ketidakbolehpercayaan secara bersama.
4 Keputusan dan Analisis
4.1 Metrik Prestasi
Prestasi terbaik mencapai skor F1 0.68 untuk intra-naratif, 0.59 untuk inter-naratif, dan 0.52 untuk klasifikasi inter-teks. Keputusan menunjukkan kesukaran progresif merentas jenis ketidakbolehpercayaan, dengan inter-teks terbukti paling mencabar kerana memerlukan pengetahuan luaran.
4.2 Analisis Perbandingan
Model berat terbuka yang ditala halus mengatasi model proprietari few-shot pada tugas intra-naratif, manakala model proprietari mengekalkan kelebihan pada klasifikasi inter-teks yang memerlukan pengetahuan dunia yang lebih luas.
5 Kerangka Kajian Kes
Skenario: Analisis ulasan hotel
Teks: "Bilik itu sempurna sepenuhnya, walaupun saya rasa katil itu boleh jadi lebih selesa dan pemandangannya tidak seperti yang saya jangkakan. Kakitangannya membantu, saya rasa."
Analisis: Ini mempamerkan ketidakbolehpercayaan intra-naratif melalui frasa berhati-hati ("saya rasa") dan penilaian bercanggah, mengurangkan kredibiliti pencerita walaupun dengan nada keseluruhan positif.
6 Aplikasi Masa Depan
Aplikasi potensi termasuk penilaian kredibiliti automatik untuk penyederhanaan kandungan dalam talian, alat pendidikan untuk penambahbaikan penulisan, linguistik forensik untuk analisis keterangan undang-undang, dan sistem AI perbualan yang dipertingkatkan mampu mengesan ketidakpastian atau penipuan pengguna.
7 Analisis Kritikal
Inti Pati: Kajian ini mewakili percubaan berani tetapi pada asasnya cacat untuk mengkuantifikasi teori sastera melalui kaedah pengiraan. Cita-cita penulis untuk menghubungkan naratologi dan NLP dipuji, tetapi pendekatan mereka mengalami penyederhanaan berlebihan terhadap fenomena psikologi kompleks.
Aliran Logik: Kertas ini mengikut struktur penyelidikan ML konvensional—definisi masalah, penciptaan dataset, eksperimen, keputusan. Walau bagaimanapun, lompatan logik dari teori sastera ke label pengiraan kekurangan pengesahan yang ketat. Seperti percubaan awal analisis sentimen yang mengurangkan emosi kompleks kepada binari positif/negatif, kerja ini berisiko mencipta katil Procrustes di mana peranti naratif bernuansa dipaksa ke dalam kategori tegar.
Kekuatan & Kelemahan: Dataset TUN A adalah permata kertas ini—beranotasi pakar, pelbagai domain, dan tersedia secara umum. Ini menangani jurang kritikal dalam sumber analisis naratif. Walau bagaimanapun, prestasi klasifikasi (skor F1 0.52-0.68) mendedahkan batasan asas. Model-model terutamanya bergelut dengan ketidakbolehpercayaan inter-teks, menggema cabaran yang dinyatakan dalam kertas CycleGAN di mana penyesuaian domain berfungsi lebih baik untuk ciri cetek daripada ciri semantik. Pendekatan pembelajaran kurikulum menunjukkan janji tetapi terasa kurang berkembang berbanding teknik latihan progresif yang digunakan dalam model visi-bahasa seperti CLIP.
Wawasan Boleh Tindak: Kerja masa depan harus menggabungkan ciri psikolinguistik di luar corak teks—isyarat prosodik untuk naratif lisan, analisis irama penulisan, dan konvensyen naratif silang budaya. Bidang ini harus melihat kepada kerangka psikologi kognitif seperti Teori Minda untuk pemodelan kesengajaan pencerita. Yang paling kritikal, penyelidik mesti menangani implikasi etika: penilaian kebolehpercayaan automatik boleh menjadi alat berbahaya untuk mendiskreditkan suara terpinggir jika tidak dibangunkan dengan pertimbangan teliti faktor budaya dan kontekstual.
8 Rujukan
- Booth, W.C. (1961). The Rhetoric of Fiction.
- Nünning, A. (2015). Handbook of Narratology.
- Hansen, P.K. (2007). Reconsidering the Unreliable Narrator.
- Zhu et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks.
- Radford et al. (2021). Learning Transferable Visual Models From Natural Language Supervision.