Tampilkan postingan dengan label Dokumentasi. Tampilkan semua postingan
Tampilkan postingan dengan label Dokumentasi. Tampilkan semua postingan

Metode Pemodelan Topik yang Bagus untuk Teks Pendek seperti Tweet

Add Comment
Metode Pemodelan Topik yang Bagus untuk Teks Pendek seperti Tweet - Selamat pagi teman-teman para pengunjung Semangat27.com, kali ini penulis akan memberikan informasi dalam artikel sekarang mengenai pemodelan topik. Berhubung tugas akhir penulis tentang metode yang satu ini jadi penulis sekalia saja menuliskan dalam blog ini untuk membantu mengingatnya.

Baca juga artikel sebelumnya Pengalaman Terkena Herpes Parah sampai Sembuh Total

Dua minggu yang lalu tepatnya penulis telah menjalani sidang proposal, mungkin ditempat lain menyebutnya seminar proposal atau sempro, jadi satu tahap sebelum skripsi atau tugas akhir. Penulis sudah dinyatakan lulus akan tetapi dari apa yang disampaikan penguji dan pembimbing pada saat sidang, terdapat banyak sekali revisi dalam berkas proposal yang penulis ajukan. So sekarang penulis sedang menjalani masa revisi sekitar satu bulan dan sekarang tersisa dua minggu. Di dua minggu ini penulis mungkin akan sering menuliskan terkait revisi penulis semangat27.com ini. Semoga semuanya dapat bermanfaat ya, baik bagi penulis sebagai dokumentasi pribadi maupun bagi kalian semua pembaca setia semangat27.com


Baiklah langsung saja untuk jawaban dari judul artikel ini yakni pemodelan topik yang pas untuk teks pendek semcam tweet pada twitter atau komentar-komentar pada web, review apps digoogle play dan lain sebagainya yang memiliki kriteria dokumen yang pendek.

Sebelumnya penulis sudah mencarinya dan mendapatkan jawabannya disuatu forum tanya jawab yakni Quora, dimana didalamnya terdapat seseorang yang bertanya tentang paper atau jurnal yang bagus yang membahas tentang pemodelan topik untuk teks pendek semacam tweet, jika teman-teman ingin melihat halamannya silakan lihat dibagian referensi yang ada dibawah ya.

Nah dalam forum tanya jawab tersebut didapatkan beberapa jawaban alternatif pemodelan topik untuk teks pendek seperti  :

  • Menggunakan Latent Feature Word Representations untuk mengimprove pemodelan topik yang terdapat dalam jurnal TACL, Volume 3, Tahun 2015. [Paper/Jurnal] [Koding Java nya]
  • Menggunakan Dirichlet Multinomial Mixture Model untuk Clustering Teks Pendek. Jurnal KDD, Tahun 2014 [Paper/Jurnal] [Koding Java nya]
  • Menggunakan Biterm Topic Model untuk Pemodelan Topik. Jurnal WWW, Tahun 2013 [Paper/Jurnal] [Koding Python nya]
  • Menggunakan Latent Dirichlet Allocation untuk Pemodelan Topic Jurnal ECIR, Tahun 2011. [Paper/Jurnal] [Koding Python nya]
  • Menggunakan Dynamic Multi-Faceted Topic untuk Pemodelan Topic. Sumber Paper/Jurnal
  • Dengan Mentransfer Pengetahuan dari Auxiliary Teks Panjang untuk Teks Pendek. Jurnal CIKM, tahun 2011 Sumber Paper/Jurnal
  • Ada juga yang menggunakan LSI Latent Semantic Index
Jika diatas menggunakan solusi metode yang berbeda-beda untuk pemodelan topik pada teks pendek, maka dalam forum tanya jawab dituliskan solusi lain dengan menggabungkan terlebih dahulu teks pendek tersebut kedalam pseudo-teks sebelum akhirnya dilakukan training dengan menggunakan model LDA


Untuk lebih jelasnya silakan teman teman bisa mengunjungi langsung referensi dari tulisan kali ini. Dan untuk penjelasan detail masing-masing metode Insya Allah akan penulis tuliskan pada artikel selanjutnya akan tetapi hanya untuk metode yang penulis ambil untuk skrip si yak, metode yang lain paling hanya sekedar intinya saja. Baiklah demikian untuk artikel kali ini semoga bermanfaat.

silakan untuk lebih lengkapnya teman-teman lihat sumber berikut ini