Statistik vs Data Mining

Selama bertahun tahun statistik merupakan alat bantu yang ‘handal’ bagi para ilmuwan. Statistik sudah ada sejak abad 19 dan berdasarkan formulasi dasar matematika untuk menguji generalisasi dari hipotesa ‘sedikit’ data sample terhadap populasi yang diteliti. Selama bertahun tahun pula statistik berhadapan dengan isu mengenai terlalu sedikitnya data yang tersedia, sehingga kita harus mampu mengambil kesimpulan global dari sedikit data tersebut dengan tingkat kepercayaan yang tinggi, isu ini juga diakibatkan karena jaman dahulu mencari data ukuran besar itu mahal. Statistik mempunyai ciri khas mengkonfirmasi dugaan, data numerik, dan hanya menyelesaikan masalah terstruktur. Demikian juga dibidang bisnis dan ilmu sosial, pada umumnya masalah disederhanakan sedemikian rupa sehingga bisa diukur secara statistik.

Data Mining merupakan alat untuk menemukan pengetahuan di dalam data berdasarkan pola yang ada di dalam data tersebut. Data Mining muncul baru akhir akhir ini, seiring dengan tersedianya data berukuran besar di internet dan sosial media. Data Mining dalam skala besar disebut juga sebagai Big Data, karena fungsinya sama yaitu memperoleh pengetahuan dari data, kemudian dibuat modelnya untuk memprediksi, mengoptimasi dan membantu pengambilan keputusan bisnis. Data Mining menyediakan banyak algoritma untuk menangani data komples dalam menyelesaikan persoalan kompleks (contohnya jumlah variabel data yang banyak).

Jelas, Data Mining mempunyai sedikit keunggulan karena mampu melakukan ‘prediksi’ dibandingkan dengan statistik yang hanya melakukan ‘konfirmasi’ hipotesa. Sayangnya di Indonesia, Data Mining merupakan ‘domain’ dari orang orang IT. Rekan rekan dari ilmu sosial/bisnis jarang sekali menggunakan alat ini, padahal data data dari sosial media sungguh berlimpah dan sangat banyak pertanyaan pertanyaan dalam bisnis yang bisa dibantu dengan alat ini.

Ringkasan lengkap Statistik vs Data Mining saya lampirkan dalam slide di http://www.slideshare.net/andrybrewok/data-mining-vs-statistics

konten lokal

pernahkah anda merasa susahnya mencari konten indonesia ( dalam artian berbahasa indonesia, produk/jasa yang dibuat atau ada di indonesia ). konten lokal memang sesuatu hal yang kita rasakan sangat penting, selain sebagai pemberdayaan akses internet biar tidak banyak akses situs situs luar negeri (hemat biaya dan lebih cepat aksesnya) dan juga supaya informasi yang kita dapatkan relevan dengan apa yang ada disekitar kita.

sebagai contoh saya ketik kata kunci “review suzuki apv” di google.co.id kita akan mendapatkan hasil pencarian yang tidak banyak membantu kita untuk mendapatkan review yang berkualitas dan akurat tentang produk ini. padahal mobil ini adalah salah satu mobil yang populer dan banyak kita temui di jalanan, bagaimana bisa kita tidak menemukan hasil yang komprehensif dan memuaskan dari hasil pencarian kita ?

disini kita mulai merasakan kurangnya konten lokal, dari hasil pencarian diatas kita hampir semua hasil adalah review dari situs jual beli mobil, yang notabene bukan merupakan review obyektif dari pengguna dan lebih banyak menulis ulang spek mobil dari brosur. hal seperti ini yang sering membuat saya dan beberapa rekan frustasi dalam mencari informasi lokal di web. beberapa contoh yang lainnya adalah pencarian info sekolah, tempat pariwisata, sejarah indonesia, transportasi, dan lain lainnya.

“but things get any better” — situasi konten lokal bertambah baik akhir akhir ini, twitter dengan zillions practical information seperti @infobdg @TMCPoldaMetro @AdaDiskon maupun hashtag #lalulintas dan yang lainnya. review produk baik peorangan maupun komunitas, games lokal, geotagging commerce (jualan berdasarkan lokasi pembeli/market), blog dan juga komunitas komunitas baru lainnya (terutama komunitas hobi) yang terbentuk dari internet.

situasi yang sangat menyenangkan tentunya jika semua informasi apapun tentang sekitar kita bisa kita cari dengan mudah, mari ngeblog, mari perkaya wikipedia, mari kita isi twitter dengan info info yang berguna. dalam hal konten more is much better than less . tentunya yang saya tuliskan diatas adalah konten positif bukan konten negatif apalagi konten konten kreatif-curang yang sempet heboh beberapa saat yang lalu diprotes oleh banyak pengguna mobile phone.