Dalam aktivitas content mining, data mining, social network analysis dan sebagai bagian dari pekerjaan data science, maka melakukan mining terhadap media sosial merupakan hal yang ‘wajib’. Dalam entri blog kali ini saya akan menuliskan mengenai crawling percakapan dan konten dari media sosial Twitter menggunakan bahasa R. Penjelasan mengenai R ada di halaman wikipedia ini. R dibangun secara crowdsourcing dimana banyak saintis dan programmer membuat modul modul khusus untuk meningkatkan fungsi fungsi dari bahasa R.
Salah satu package / library / modul yang menarik adalah twitteR, modul ini dibuat untuk mengakses API dari Twitter, sehingga kita bisa melakukan operasi operasi seperti melihat profile, melihat daftar teman, daftar followers, pencarian kata kunci dan lain lainnya. Operasi yang sering saya lakukan adalah pencarian kata kunci untuk kemudian saya lakukan data mining, sentiment analysis atau social network analysis.
Langkah langkah yang perlu dilakukan adalah yang pertama kali membuat aplikasi di Twitter, setelah membuat aplikasi kita akan memperoleh 4 jenis kunci (consumer key, consumer secret, access token dan access token secret). 4 kunci tersebut kita gunakan pada modul twitteR untuk terhubung dengan API Twitter. Setelah terhubung baru kita bisa ikutin dokumentasi twitteR ini untuk melakukan operasi yang kita inginkan.
Pada contoh gambar di bawah, saya perlihatkan pencarian kata kunci “Telkom University” sebanyak 100 tweet, pada lokasi bandung (geocode=longitude dan latitude, dengan radius 20 mil). Hasil yang diperoleh adalah table csv dengan total 16 variabel seperti teks, tanggal tweet, penulis tweet, dan yang lain lainnya yang bisa dilihat pada gambar di bawah.
Selain modul twitteR, banyak sekali cara lain untuk crawling data Twitter, diantaranya adalah modul streamR untuk akses stream data pada Twitter (forward search). Di luar R, ada juga cara lain menggunakan Java, .ASP C/C++, Perl, PHP Javascript, Python, Ruby dan lain lainnya. Klik untuk daftar lengkap aplikasi untuk crawling twitter – Twitter Libraries
Selamat Mencoba !!
tampilan R pada pencarian tweet dengan kata kunci “Telkom University”. Hasil bisa dilihat pada kanan atas dan beberapa perintah ada di kanan bawah
data hasil crawling dengan perintah search keyword ‘Telkom University”, terdiri dari 16 variabel.
Reblogged this on canuckish's Blog.
LikeLike
Menarik untuk dipelajari nih 🙂
LikeLike
mangga dipelajari ..
LikeLiked by 1 person
Halo, Aku mau nanya dong buat tugas akhir kuliah tentang web crawler menggunakan python gimana sih caranya? Misalnya untuk mau menarik data” yang ada di Twitter, dengan menulis kata “Saya lagi makan” atau hanya satu kata, misalnya “pinter” dari tweet yang ada di twitter untuk mengetahui siapa yang mempostingnya.. Kalo kamu tau caranya dan pernah belajar, bisa tolong kasih tau aku ya. aku biasanya memakai aplikasi Python versi 2.7.9.
Terima kasih..
LikeLike
[…] besar?”. Saat ini dengan mudah kita mendapatkan data jutaan tweet tentang suatu produk (lihat cara ini untuk mengambil tweet). Kemudian bisnis / perusahaan berkeinginan untuk membaca apa yang […]
LikeLike