Bisakah Anda tahu perbedaan antara kebangkitan orang Finlandia dan omong kosong total?

Jika Anda tidak terbiasa dengan rantai Markov, maka jangan menyalahkan diri sendiri. Kesimpulan sederhana mereka sangat sederhana ("kasus yang dapat segera dihapus dari keadaan semula, terima kasih kepada Wikipedia!), Tetapi pada saat yang sama, sangat sulit untuk diterapkan dalam kehidupan nyata. Tidak banyak di antara keduanya. Mereka telah ada untuk sementara waktu, tetapi baru-baru ini menemukan pengakuan utama karena kekuatan komputasi akhirnya menjadi lebih murah daripada data "stateless" untuk menghitung kasus-kasus besar yang benar-benar menarik.

Salah satu cara luar biasa untuk menghitung Markov State adalah mesin catur "Pink Pink": mesin itu telah dilatih hanya dengan "melacak" miliaran pergerakan catur. Menggunakan ini untuk memprediksi "keadaan selanjutnya" yang kuat dari catur, ia telah menjadi pemain catur yang sangat baik, tidak pernah terprogram untuk memahami bagaimana setiap bagian catur bergerak. Secara teknis tidak tahu apa itu catur, ada baiknya mengetahui seperti apa papan catur selanjutnya.

Penggunaan lain dari rantai Markov adalah penciptaan bahasa alami. Anda dapat mengumpankan beberapa teks ke generator bahasa yang diilhami Markov (sebaik itu), dan itu "memprediksi" sejumlah kata, kalimat, atau paragraf yang mungkin "muncul berikutnya." t tidak dapat diprediksi karena pembuat teks sekarang hanya dapat menganalisis sintaks, tata bahasa dan kosa kata; artinya benar-benar hilang ke komputer, sehingga muncul dalam film yang terdengar seperti bahasa manusia tetapi kebanyakan marah. Ini menuntun saya ke Finnegans Wake ...

Jika Anda tidak terbiasa dengan Finnegans Wake, jangan menyalahkan diri sendiri. Itu ditulis oleh novelis terkenal dunia James Joyce pada tahun 1922-1939, dan spesialis Inggris masih kehilangan tidur malam dan berusaha mencari tahu apakah itu benar-benar berarti apa-apa. Dan maksud saya, dalam beberapa subjektivis, "Apakah ini ada artinya?" Inilah saat para profesor universitas membawa teko yang tenggelam di siku mereka tanpa alas kaki; Saya harus mengatakan bahwa masih belum ada konsensus antara akademik atau sebaliknya tentang apakah ini adalah omong kosong setebal 600 halaman.

Sepotong khas dari Finnegans Wake

Joyce mungkin telah memainkan lelucon di komunitas sastra, atau dia mungkin telah mengubah definisi yang tepat dari novel itu. Kami tidak tahu. Dan jika kita memblokir wahyu pribadi baru, kita tidak akan pernah bisa. Secara pribadi saya mengandalkan Joyce: Membaca beberapa ayat Wake selalu membuat saya kesal, tetapi melaluinya saya menemukan stabilitas yang tidak dapat diperbaiki. Paragraf itu mungkin memiliki dua kata yang terpisah, tetapi selalu tampak bahwa setiap halaman harus mengatakan sesuatu yang lebih dalam, dan saya siap memberi si penulis manfaat dari keraguan itu.

Sampai saya mulai menggunakan generator teks Markov.

Ketika saya menemukan generator teks Markov sederhana ini beberapa hari yang lalu, saya hampir tahu saya harus melatihnya di Finnegans Wake. Ketika menganalisis Wake, orang-orang tetap berpegang pada hal-hal seperti mencoba menulis salah satu dari empat puluh lima huruf Joyce dengan delapan belas Zs. Namun, generator teks Markov hanya merekam dan memindahkan, yang berarti bahwa kata-kata panjang dengan terlalu banyak kata Z lebih mungkin terjadi. Saya mulai membaca "Renaisans" Markov, menganalisis hasilnya, dan kemudian memprediksi lebih banyak teksnya berdasarkan seluruh tata bahasa, sintaksis, dan kosa katanya. Butuh beberapa menit untuk analisis seperti itu jika tidak mungkin.

Dan ketika saya melihat hasilnya, saya hampir tidak percaya. Cobalah untuk membedakannya:

Dalam kebanyakan kasus, generator bahasa memiliki makna lebih dari teks aslinya. Outputnya tampaknya cocok dengan teks asli dan gaya, yang tidak masuk akal sama sekali. Saya telah melihat hasil - saya tidak bisa membedakan antara aslinya dan output saya selama lebih dari 80% - dalam keadaan tidak aman. Anda dapat dengan mudah menempatkan komputer Anda bekerja di 600 halaman Wake, dan hampir tidak ada orang di dunia yang dapat mengatakan itu.

Bisakah Anda tahu yang mana dari situs Wake dan mana yang komputer?

Jadi, apakah itu terpecahkan? Apakah Joyce seorang penipu? Sekarang teksnya tidak dapat dipisahkan dari omong kosong (bagi saya), apakah ini cerita seperti kode program saya? Tidak secepat itu.

Saya bukan ahli bahasa Inggris, tetapi saya tahu beberapa hal yang saya tidak bisa lakukan dari Wake. Pertama, kamus eksplorasi yang menarik sepenuhnya dimiliki oleh Joyce. Tentu saja, program saya bisa menduplikasinya, tetapi tidak pernah menemukannya. Bahkan jika novel itu sendiri tidak ada artinya, jika Anda menemukan arti sebuah kata, kehormatan itu sepenuhnya berada di tangan Joyce.

Kedua, bahkan jika niat artis itu entah bagaimana terbukti diduplikasi dalam mesin, itu mengurangi kekuatannya. Kita dapat membangun mesin lukisan untuk Van Gogh (atau seperti Pollock), tetapi itu tidak mengurangi pengaruh setiap karya seni. Mungkin bagian dari niat artis adalah untuk menyampaikan kekacauan atau bahkan duplikasi mesin! Saya tahu bahwa jika Joyce bangkit dari makam dan melihat hasil aplikasi Markov saya, dia bisa tersenyum, mengedit topik itu dengan ringan, dan menerbitkannya sebagai bagian dari Renaissance Finlandia: Bahkan Wakier. Dan apakah itu mengejutkan semua orang?

Biarkan saya jelas: bagian apa yang mana; Saya tidak benar-benar tahu untuk apa Joyce dan Markov diciptakan.

Ketiga, hanya karena saya tidak bisa mengatakan sekitar 80% dari waktu, tidak berarti tidak ada yang bisa. Sering ada siswa sastra yang dapat membedakannya. Dan sementara ini tidak mempengaruhi pendapat pribadi saya tentang kasus ini, itu berarti bahwa akademisi yang lebih berpendidikan dapat mencapai kesimpulan yang sama sekali berbeda, bahkan jika saya memiliki informasi yang sama.

Pada akhirnya, saya harus mengakui bahwa pandangan saya tentang Wake telah berubah karena alasan itu. Saya sepenuhnya menerima bahwa kerukunan batinnya tidak kalah sulit untuk diciptakan daripada omong kosong. Tapi aku sangat mengaguminya dan, tentu saja, Joyce.

Jika tidak ada yang lain, dia adalah generator dari bahasa Markov 80 tahun sebelum penemuannya.

[Artikel ini awalnya muncul di Union.io]