Narasumber Big Data

Semenjak lulus sidang terbuka (ujian promosi doktor) bulan januari 2018 kemarin, saya merasa jauh lebih bebas memikirkan riset, memikirkan keilmuan, dan memikirkan hal hal lain termasuk topik Big Data. Dulu boro boro mau mikirin banyak hal, kalo urusan disertasi belum beres rasanya ga mau mikirin yang lain. Ini lebih karena takut yang dikerjakan di disertasi jadi lupa ..hehe. Karena lagi masa “tenang”, eh Ndilalah (ini basa jawa artinya tiba tiba) kok banyak datang tawaran jadi narasumber topik Big Data. Berhubung kebebasan mencari ide dan bercerita soal Big Data lagi banyak, maka saya iyain tawaran tersebut, lagian tawarannya deket, cuman di bandung dan jakarta, sebenernya ada satu tawaran lagi di jogja, terpaksa saya tolak, karena bentrok dengan acara yang di bandung. 

Narasumber pertama adalah di SBM-ITB dalam rangka pembukaan (Kick-Off) Seminar Lab. Big Data Analysis dan Social Simulation. Kebetulan nama lab nya mirip dengan lab saya (Social Computing dan Big Data). Ternyata memang ruang lingkupnya pun mirip, jadi asyiknya sekarang saya punya rujukan untuk kolaborasi riset tentang studi manusia / sosial menggunakan Big Data. Kebetulan ketua lab tersebut adalah teman waktu sama sama kuliah S1 di Matematika ITB. Jadi memang networking itu benar adanya. Saya yakin dengan kemampuan rekan saya (yang sealmamater ini) dalam membawa lab ini menjadi sukses. Sekali lagi selamat SBM ITB. 

Topik seminar SBM adalah “Big Data Development in Education and Business Practice”, dari topik besar tersebut saya jadi memikirkan kembali kenapa edukasi Big Data di Indonesia belum kedengaran gaungnya, padahal industri / bisnis lagi banyak mencari info dan talenta. Dari pemikiran tersebut maka muncul pemetaan kelimuan dan profesi Data Scientist yang saya tulis di blog ini. Dipikir pikir semakin sering jadi narasumber dan disodorin topik topik tertentu berkaitan dengan keahlian kita, maka semakin kita menguasai topik yang kita “rasa” kuasai dari berbagai sudut pandangan. 

Narasumber kedua adalah menjadi pembicara di acara BMKG (Badan Meterologi, Klimatologi, dan Geofisika). BMKG sedang menyambut hari jadi ke 68 hari meteorologi dunia. Untuk menyambut hari tersebut, mereka mengadakan seminar ilmiah dengan tema “Implementasi Big Data dan Artificial Intelligence untuk Peningkatan Layanan Kecepatan dan Akurasi Layanan Informasi BMKG”. Pembicara yang diundang adalah dari LIPI, UI, ITS, Grab, Solusi247, Telkom Indonesia, Schumberger, dan saya sendiri mewakili Telkom University. Materi yang saya bawakan berkaitan dengan peran Big Data dalam memahami perilaku manusia. Sepertinya topik saya tidak bersinggungan langsung dengan BMKG, akan tetapi ternyata misi dari BMKG sendiri adalah melihat kemajuan terkini terkait penelitian Big Data dalam segala bidang. 

Menjadi narasumber dalam suatu acara merupakan kesempatan bagus untuk menjalin jaringan dengan orang orang yang satu rumpun keilmuan dengan kita, atau bisa juga yang keilmuan tidak sama tapi mempunyai minat yang sama. Oh ya ngomong ngomong kenapa saya yang dipilih jadi narasumber di BMKG, rupanya alasannya sama dengan yang SBM, lagi lagi di BMKG ada rekan sesama almamater di S1 Matematika dulu.  ternyata oh ternyata .. eh tapi bukan hanya karena pertemanan lho saya diundang, tapi pertemanan bisa membantu menemukan siapa teman kita yang punya kemampuan seperti yang kita inginkan

Next Narasumber ? .. ada deh bulan bulan depan, nanti diupdate lagi beritanya.

Foto fotonya …

 

IMG 9170IMG 9284IMG 91636f520024 7198 43f1 80a6 ac297618d74e

 

 

Pemetaan Profesi Data Scientist

Big Data

Saking seringnya ngobrol tentang Big Data dengan beberapa kalangan, lama lama saya mulai bisa memetakan kebingungan, kegalauan, dan pemahaman masyarakat mengenai topik ini. Kebanyakan masyarakat yang awam dengan Big Data, sering tidak bisa mendefinisikan dengan tepat apa itu Big Data. Mereka hanya tahu bagian input dan output saja ..  proses di tengahnya gelap seperti blackbox. Bahkan beberapa rekan dosen yang masih awam bilang, coba selesaikan masalah penelitian dengan Big Data (maksudnya sih mengambil data dari media sosial), sementara yang lain menggangap bahwa Big Data itu metode pengganti statistik yang lebih canggih. Tentu saja anggapan anggapan tersebut tidak benar, kita semua mengenal istilah Big Data ini, karena ada peluang tersedianya data dalam jumlah besar, sehingga muncul peluang untuk memanfaatkannya. Perkara apakah hasil riset menggunakan Big Data akan lebih baik dari hasil metode konvensional (statistik), yah belum tentu juga.

Jadi Big Data itu apa ?, metode, alat, media atau yang hal lainnya yang kompleks,  tidak masuk dalam kategori yang bisa dipahami (rumit), maka dimasukkan ke dalam Big Data. Lucunya ini kenyataan lho, bahkan misalkan proses optimasi, simulasi, dan model matematika yang sudah ada sejak dulu, sering dianggap sebagai bagian Big Data juga, hanya karena metode itu saat ini sering digunakan (untuk menyelesaikan masalah kompleks) karena ketersediaan data yang semakin mudah. Sisi bagusnya adalah metode metode seperti artificial neural network, simulasi monte carlo, simulated annealing, dan lain lainnya semakin sering dipergunakan dan semakin dikenal.

Data Science

Supaya tidak terjebak istilah Big Data yang ambigu, maka saya sarankan kita bicaranya dari sisi Data Science saja. Data Science adalah suatu ilmu yang berpusat pada data sebagai komoditi utamanya. Beberapa metode dan kepentingan dari latar belakang kelimuan yang berbeda digunakan. Ilmu ilmu tersebut antara lain adalah ilmu komputer, matematika / statistika, bisnis, dan domain / konteks permasalahan.  Orang / talentanya disebut sebagai Data Scientist, dalam bahasa Indonesia adalah Ilmuwan Data. Kebetulan saya dan beberapa rekan ilmuwan serta praktisi membuat wadah Asosiasi Ilmuwan Data Indonesia (AIDI) (silahkan dicek,  boleh kok bergabung). Masih ingat postingan saya beberapa tahun yang lalu tentang tulisan Davenport dan DJ Patil di HBR bahwa “Data Scientist is the most sexiest job in 21th century” pada tahun 2012. Ternyata 5 – 6  tahun kemudian tetap sexy lho, cek disini dan disini.

Karena begitu sexy nya profesi ini, maka saya mulai melakukan riset kecil kecilan, kenapa profesi ini begitu dicari. Industri begitu kesulitan, dan bahkan putus asa mencari talenta yang bisa melakukan analisa, menceritakan pola dari data, dan membuat prediksi. Karena latar belakang pendidikan lulusan universitas pada umumnya sering terkotak kotak pada kelompok keilmuan tertentu, dan belum bisa berkomunikasi dengan bidang lain. Sebagai gambaran, daripada memberi gaji 1x ke programmer, 1x ke modeler, dan 1x ke orang bisnis (total 3x gaji), lebih baik perusahaan memberikan gaji 5x ke 1 orang yang menguasai ketiga domain tersebut. Nah talenta / orang ini yang disebut sebagai Data Scientist.

Pemetaan Data Scientist

Data Analytics Body of Knowledge

Data Science Knowledge Area

 

Data Engineering Body of Knowledge

 

Hasil baca sana sini, diperolah bahwa seorang Data Scientist itu harus mempunyai Knowledge Area (area pengetahuan) di bidang Data Analytics, Data Engineering, Data Management, Research Methodology, Project Management, Business Analytics, dan Domain Knowledge. Masing masing dari area pengetahuan diatas dibagi lagi menjadi keilmuan keilmuan kecil yang disebut sebagai Body of Knowledge (BoK) yang diselaraskan dengan cabang keilmuan, sehingga kita bisa identifikasi keilmuan besarnya masuk ke dalam ilmu apa. Peta sementara dari 3 gambar diatas, menunjukkan betapa kompleksnya keilmuan data tersebut, tidak salah kalo memang pekerjaan ini disebut pekerjaan sexy.

Oh ya sebagai penutup blog singkat ini.  Dari segitu banyak “maunya” industri mencari talenta Data Scientist yang canggih, sampai saat ini belum terlihat adanya daftar / framework kompetensi dari seorang Data Scientist yang diinginkan oleh industri, atau bahkan kompetensi secara global. Ini menjadi PR penting dalam rangka mengurangi gap antara lulusan universitas dan industri.

Menembus Kemacetan Bandung (Acara sharing BPS dan Konferensi ICoDIS)

Kemarin saya mendapatkan undangan untuk mengisi dua buah acara di bandung yang lokasinya berjauhan. Satu lokasi di ujung utara , di hotel grand mercure, jalan setiabudhi (di sekitaran area rumah sosis) dan satu lagi di ujung selatan, di kampus universitas telkom, jalan terusan buah batu. Acara di grand mercure adalah menjadi narasumber materi “Big Data Analytics Implementation” untuk Badan Pusat Statistik jam 8 pagi, sedangkan di universitas telkom adalah menjadi moderator plenary session pada International Conference on Data and Information Science (ICoDIS) jam 13 siang.

Bagi yang tinggal di Bandung tentu bisa membayangkan perjuangan menembus kemacetan yang makin hari makin tidak bisa diprediksi. Terutama dengan ada perbaikan jalan layang pasupati, kondisi pintu masuk GT pasteur yang menyempit, kemacetan luar biasa daerah terusan buah batu, belum lagi kemacetan daerah lain yang tidak terduga.

Akhirnya saya membujuk panitia acara BPS untuk memperbolehkan saya selesai jam 11 (dari rencana jam 12). Alhamdulilah perjalanan turun dari setiabudhi sampai GT pasteur lumayan lancar, hanya memakan waktu 30 menit, dari GT pasteur ke GT buah batu juga memakan waktu 30 menit. Tapi dari GT buah batu ke kampus telkom siang kemarin macetnya melebihi ekspektasi. Saya menghabiskan waktu 50 menit sampai ke gedung acara konferensi. Untungnya acaranya yang jam 13 dimulai agak telat, sehingga saya masih sempat sholat dan makan siang dulu. Total waktu dari setiabudi ke kampus univ telkom adalah 1 jam 50 menit.

Kesimpulannya jangan lagi lagi memenuhi undangan acara dalam sehari dalam jarak yang berjauhan seperti yang saya lakukan. kemarin saya termasuk beruntung karena hanya menemui satu titik kemacetan saja. Next time it could be worse

berikut foto acara sharing BPS dan konferensi ICoDIS

National Data Days 2017

kegiatan tahunan data days diluncurkan pertama kali bulan november tahun lalu oleh fakultas eknomi dan bisnis (FEB), universitas telkom. tahun 2017 ini, data days 2017 diberi nama lengkap sebagai national data days 2017 (NDD17). NDD17 terdiri dari kegiatan seminar, workshop, kompetisi, dan eksibisi. tema NDD17 ini adalah “data for better indonesia”.

seminar akan menghadirkan pembicara seperti pak gadang ramantoko (ekonomi digital), pak setia pramana (data di bidang kesehatan), pak mahmoud syaltout (data bidang politik dan bisnis), dan mas kamal hasan (praktisi data). workshop menghadirkan pemateri pemateri handal dari akademisi seperti pak taufik sutanto, dari industri data seperti midtrans, i-811, mediawave, presentasi beberapa hasil riset mhs FEB dan mahasiswa sekolah tinggi ilmu statistika.

silahkan datang tanggal 21-22 november 2017

Dinamika Pilkada DKI 2017 menggunakan Jejaring Sosial

Pilkada DKI 2017 merupakan event yang menjadi magnet bagi bangsa Indonesia, bukan hanya ekslusif untuk warga DKI saja. Event ini sangat menarik untuk dianalisa, terutama buat saya yang selama ini mendalami keilmuan jejaring sosial, dimana konsentrasi pergerakan sosial atas isu isu tertentu bisa menjadi bahan untuk memahami perilaku sosial bangsa kita. Perilaku pada media sosial menunjukkan bagaimana opini nyata tiap individu, pembentukan kelompok sosial, dan juga rekayasa opini (termasuk hoax dan lain lainnya). Pada entri kali ini saya melihat dinamika percakapan masyarakat Indonesia di media sosial membahas berbagai topik berkaitan dengan Pilgub DKI 2017. Sebagai disclaimer saya tegaskan politik bukan merupakan domain yang saya pahami sepenuhnya. Pada entri blog ini tidak ada tendensi untuk mendukung calon manapun, dan lagian saya bukan warga DKI juga 😛

 

Saya mengambil data di Twitter sebagai sample, karena di media sosial ini perilaku sosial terkait pilkada terlihat jelas. Facebook juga menunjukkan kecenderungan serupa dengan Twitter, tetapi karena di Facebook tidak mungkin bagi kita untuk mengambil semesta data, dan hanya mungkin mengambil data dari lingkungan pertemanan kita, maka Twitter merupakan media yang tepat dari sisi pencapaian pengambilan data dan keterwakilan sample.

 

Profil Data :

Data percakapan di Twitter diambil mulai dari tanggal 8-11 februari 2017, tepat selama 60 jam. Durasi ini melewati acara debatcagub ke 3 yang diadakan pada tanggal 10 februari malam.  Sebelum acara debat yang dilaksanakan tweet yang terkumpul adalah sebanyak 18077 tweet (nomer1), 23656 tweet (nomer2), dan 41053 tweet(nomer3). Setelah acara debat terlihat lonjakan jumlah tweet menjadi 35380 tweet (nomer1), 49028 tweet(nomer2), dan 82185 tweet(nomer3). Total keseluruhan tweet yang diambil adalah sebanyak 166593 tweet dengan total data space mendekati 1 GB. Keyword / Hashtag disesuaikan untuk tiap tiap paslon, sesuai dengan hashtag yang paling banyak diadopsi oleh publik dan pendukungnya. Hashtag hashtag tersebut antara lain 

 

nomer 1 : #jakartauntukrakyat #ahyfordki1 #MuslimberSatupilihno1 #AgusSylviKonsisten #SATUkanjakarta #JakartaForAll

nomer 2 : #perjuanganbelumselesai #coblosbadjanomor2 #FreeAhok #BadjaMelaju #SekuatBadja #Gue2 #Badjajuara #salamduajari

nomer 3 : #salambersama #TerbuktiOkOce #majubersama #CoblosPecinya #AniesSandiCintaUlama

 

Nomer1


Dari paslon nomer 1 saya memperoleh 35380 tweet, dimana didalamnya terdapat 8505 aktor yang terlibat percakapan, dengan sejumlah 29836 percakapan antar aktor tersebut. Pola percakapan dari gambar dibawah memperlihatkan bahwa terdapat 3 kelompok besar  (ungu, hijau, biru) yang mendominasi 60% percakapan. Aktor aktor utama jaringan ini adalah @AgusYudhoyono @Abaaah @SBYudhoyono. Terdapat beberapa situs berita yang dominan yaitu @Metro_TV @kompscom @detikcom dll. keseluruhan top 50 aktor bisa dilihat di gambar dibawah. Kelompok terbesar adalah kelompok berwarna ungu dengan ukuran 27% (cukup besar) dari keseluruhan jaringan.  Kelompok terbesar ini berisi tokoh tokoh utama dari paslon 1, kelompok kedua sebesar 13% berisi akun akun pendukung utama seperi @AhyCenter @agusylviDKI @ZaraZettiraZZ @Umar_Hasibuan @panca66. 

 

 

1

 

1detail

 

1top

 

11

Nomer2

 

Dari paslon nomer 2 diperoleh 49028 tweet, dimana percakapan tersebut melibatkan 15745 aktor dan 44834 percakapan antar aktor aktor tersebut. DI jejaring nomer 2 ini kelompok terlihat lebih menyebar dengan kelompok terbesar berwarna ungu mempunyai ukuran hanya 10,9%, dilanjutkan dengan kelompok warna hijau tua (9,5%), dan disusul warna biru (8,39%). Aktor aktor utama nya bisa dilihat pada gambar dibawah (top-50), terlihat bahwa aktor aktor dominan tersebut berada pada kelompok yang berbeda (terlihat dari warna node yang berbeda). 

 

 

2

 

2detail

 

2top

 

21

 

 Nomer3

 

Paslon 3 mempunyai data tweet yang paling banyak dibandingkan paslon lainnya. 82185 tweet terambil dalam periode pengambilan, yang melibatkan 12744 aktor dan 22565 interaksi percakapan. Dengan sejumlah 22565 tweet interaksi dibandingkan dengan total 82185 tweet yang terambil, maka rasio percakapan / diskusi dalam jaringan ini sangat kecil dibandingkan paslon lain. Sebagian besar tweet adalah indivdual tweet atau tweet yang tidak mengenerate percakapan.Seperti paslon 1, kelompok di jaringan ini didominasi oleh 3 kelompok utama yaitu kelompok ungu (26,76%), hijau (23,67%), dan biru (18,51%). Total tiga kelompok tersebut sudah sangat mendominasi dengan mencakup 69% percakapan. 

 

 

3

 

3detail

 

3top

 

31

Analisa

 

Dari pengukuran average degree (rata rata koneksi dari seorang aktor) dan network diameter (besar jaringan)  ketiga jejaring sosial tidak mempunyai perbedaan yang signifikan. Pada pengukuran .graph density (kepadatan percakapan), Nomor 1 dan 2 lebih baik dari Nomor 3, kepadatan yang baik lebih disukai, ini mengindikasikan bagaimana banyaknya interaksi dalam suatu jejaring sosial. Perbedaan yang signifikan terlihat dari dinamika terbentuknya kelompok dan pengukuran kecenderungan pengelompokan dengan menggunakan metric modularity. Nomer 1 dan nomer 3 mempunyai nilai modularity yang lebih tinggi dari Nomer 2, yang artinya kelompok yang terbentuk benar benar terpisah dengan jelas. Kelompok kelompok pada paslon nomor  2, masih berhubungan erat dengan keompok lain dalam jejaring sosialnya.  Bisa disimpulkan bahwa percakapan paslon nomor 2 lebih di generate oleh massa, sehingga kelompok percakapan yang terbentuk terlihat lebih natural, sedangkan kelompok pada nomor 1 dan nomor 3 dikendalikan secara sistematik oleh aktor aktor utama.

 

Analisa jejaring sosial adalah analisa cepat untuk melihat dinamika struktur jaringan. Untuk supaya bisa memodelkan dan membuat prediksi siapa pemenang pilkada, tentunya butuh analisa faktor lain, contohnya seperti analisa konten tweet (sentiment analysis atau opinion mining). Saya pernah mengusulkan analsia konten dengan cara cepat menggunakan network text analysis seperti yang saya tulis di paper saya ini dan paper saya yang ini. Untuk analisa konten tersebut, dibutuhkan data raw twitter, berhubung data tersebut berukuran sangat besar 1 GB dan berada di komputer lab., plus  sayanya sedang mobile (weekendan), maka saya hanya mengambil ekstrak data jejaring sosial yang hasilnya saya jabarkan dalam blog ini.

 

Bila ada yang tertarik untuk menganalisa topik ini lebih mendalam, terutama yang ahli dibidang politik, silahkan kontak saya untuk berdiskusi atau bahkan mungkin mendapatkan datanya. 

 

 

 

Fenomena #SayaBertanya

Hashtag #SayaBertanya muncul pertama kali pada 6 Februari 2017 setelah mantan presiden SBY memposting tweet yang ditujukan kepada Presiden dan Kapolri. Saya tidak menyoal tweet pak SBY tersebut, tapi saya lebih tertarik viralitas hashtag ini yang ternyata sangat populer. Viralitas tersebut disebabkan kreativitas warga twitter sendiri yang membuat guyonan menggunakan hashtag tersebut, terlepas itu sindiran atau hanya sekedar guyonan. Meme dan variasi kata pendek ini diaplikasikan ke dalam permasalahan pacaran, gebetan, harga bahan pokok, kemacetan, dan hal hal keseharian masing masing orang. Viralitas ini juga menyebar sampai ke facebook, instagram, dan path.

Sayangnya saya baru sempat ambil data sejak tanggal 7 Februari, jadi lumayan telat sehari dari puncak masa populer hashtag tersebut. Akan tetapi walaupun telat, dimana saya mengambil tweets antara tanggal 7-9 februari (selama kurang lebih 50 jam). Saya mendapatkan 25 ribu tweet yang memuat hashtag #SayaBertanya. Menurut saya termasuk lumayanlah, sebenarnya proses crawling sampai saat ini masih tetap berjalan, tapi saya sudah ga sabar untuk segera analisa dan nunggu hasilnya :P. Dari 25 ribu tweet tersebut, saya memperoleh 8613 aktor dan 15898 relasi, cukup lumayan ramai / padat percakapan yang terjadi disana baik dalam bentuk retweet maupun reply / mention.  

Viralitas hashtag ini menunjukan bagaimana dinamisnya bangsa kita di media sosial. Bagaimana kreativitas merubah hal hal yang biasa menjadi suatu hiburan dan menjadi topik pembicaraan serius maupun santai. Fenomena yang asyik untuk diteliti dan dijadikan percobaan perilaku manusia di internet.

Berikut ini pola interaksi hashtag #SayaBertanya

Sayabertanya1

Sayabertanya2

Berikut ini ini adalah aktor aktor dominan dalam percakapan tersebut. @SBYudhoyono paling banyak dimention, diteruskan oleh @jokowi dan @basuki_btp. 3 kelompok terbesar adalah kelompok (modularity class) no 11, 544, dan 540. @jokowi @basuki_btp tidak termasuk ke dalam kelompok dominan. 

Screen Shot 2017 02 09 at 9 14 00 PM  2

Berikut ini contoh contoh tweet tweet dari hashtag ini yang lucu lucu (menurut saya lho)

Screen Shot 2017 02 09 at 8 43 47 PM

Screen Shot 2017 02 09 at 8 43 52 PMScreen Shot 2017 02 09 at 8 44 10 PM

Contoh contoh lain bisa dilihat di artikel (di detik) berikut ini : 

https://inet.detik.com/cyberlife/d-3415131/netizen-heboh-sayabertanya-kepada-presiden

Terpaksa Ngoding, Tapi Seneng …

Beberapa saat yang lalu saya diajak riset bersama oleh peneliti dari Inggris. Topik riset sendiri meneliti bisnis otomotif dengan mengambil data dari media sosial. Karena kesibukan saya yang “super” saat itu, maka saya serahkan proses data collection dan pre-processing ke asisten (mahasiswa). ekspektasi saya proses ini akan berjalan dalam waktu seminggu. Seminggu, dua minggu saya tunggu ternyata belum beres juga. Saya selidiki ternyata ada permasalahan dalam langkah pre-process data yang  saya baru tahu masih menggunakan beberapa langkah manual  … :(. Makanya asisten saya seperti kewalahan mengurusi data ratusan ribu tweet, kalau dibiarkan bisa bisa dia stress, plus saya sendiri udah tidak sabar nungguin hasil crawl dan analisa

Jadinya saya otak atik python supaya proses transformasi data mentah dari twitter ke format social network menjadi lebih cepat dan otomatis. Setelah setengah hari ngoding akhirnya problem pre-process yang berlangsung lama bisa diselesaikan dengan koding saya tersebut. Senengnya dari data twitter sebesar 500mb (200 ribu tweets) bisa saya konvert dalam kurun waktu kurang dari 10 menit. Wah tahu gini proses yang seminggu kemarin bisa diselesaikan dalam 10 menit. Memang kalo ga kepentok problem, sepertinya saya juga ga akan turun tangan ngoding sendiri …:D

Seneng juga kalo koding yang kita bikin bener bener menyelesaikan masalah .. nah akhirnya karena lagi seneng, maka saya teruskan menggambar visualisasi jejaring sosial 3 merk mobil dari data 200 ribu tweet yang saya sebutkan diatas … 

Merk A

merk A

Merk B

merk B

Merk C

merk C

Sharing Big Data ke ITERA

Pada tanggal 31 Januari 2017, Saya memberikan materi tentang Data Science Business Perspective pada acara meetup komunitas idBigData dan Asosiasi Ilmuwan Data Indonesia (AIDI) di Institut Teknologi Sumatra (ITERA) – Lampung. Kesempatan ini adalah pertama kalinya saya mengunjungi ITERA. Saya sudah mendengar mengenai kampus ini sejak 2-3 tahun yang lalu, yang mana pada saat itu mereka sedang gencar gencarnya membuka lowongan dosen. Acara di ITERA ini adalah juga acara Big Data pertama kali yang saya ikuti di luar jawa. Hal ini sangat menarik karena kita juga perlu memeratakan pengetahuan mengenai Big Data di kampus kampus di luar pulau jawa.

Acara idBigData meetup ini sudah diadakan 12 kali, setiap bulan rutin diadakan dengan bersafari ke kampus kampus di seluruh Indonesia. Kali ini acara cukup istimewa karena AIDI yang baru dibentuk bulan november 2016 ikut berperan serta. Sebagai info idBigData berkonsentrasi kepada metodologi komputasi Big Data sedangkan AIDI berkonsetrasi kepada aktivitas analytics Big Data.

Selain saya yang mewakili AIDI, pemateri lainnya adalah Ibu Masayu (ITB / ITERA) yang membawakan materi peringkasan text bahasa indonesia, Pak Beno (Solusi247) mengenai kedaulatan data Indonesia, Pak Sigit (idBigData) mengenai engine Big Data Yava. Peserta yang hadir adalah mahasiswa dan dosen ITERA, dan juga industri, pemerintah, dan mahasiswa lampung di luar ITERA. Ini sangat menarik melihat keragaman peserta yang ikut hadir pada acara ini.

Streaming video materi saya dan foto fotonya bisa dilihat berikut ini :

FullSizeRender 3

IMG 0777

Asosiasi Ilmuwan Data Indonesia (AIDI)

Pada acara Data Science Days bulan November 2016 yang diselenggarakan oleh Fakultas Ekonomi dan Bisnis, Universitas Telkom, telah dideklarasikan terbentuknya Asosiasi Ilmuwan Data Indonesia (disingkat AIDI). Latar belakang pembentukan AIDI adalah perlunya membangun suatu ekosistem Data Science (+Big Data) yang aman, bermanfaat sejahtera, berdaya saing, berkelanjutan untuk mendukung pembangunan bangsa dan kedaulatan data Indonesia. Perlunya perkumpulan / gerakan ini, kami rasakan sejak bermunculannya layanan berbasis internet (dari luar negeri) yang mengumpulkan data data dari pengguna internet Indonesia. Kita mengenal penyedia layanan tersebut dengan sebutan Over The Top content (OTT), contohnya yah penyedia layanan jejaring sosial yang populer di Indonesia (Facebook, Twitter, Instagram, Path, dll), layanan terintegrasi seperti Google (email, maps, search engine..), layanan pengetahuan (wikipedia, imdb), layanan berita, layanan perjodohan, layanan chatting, dan lain lain

Kurang mampu bersaingnya aplikasi nasional / OTT lokal (atau mungkin kurang populernya) membuat data data yang diproduksi dari aktivitas online terkirim ke penyedia layanan di luar negeri. Walaupun saat ini sudah mulai banyak penyedia layanan seperti forum diskusi (kaskus), ecommerce (tokopedia, bukalapak, blibli, dll), akan tetapi sebagian besar pengguna internet indonesia masih menggunakan aplikasi buatan luar dalam mendukung aktivitas sehari hari. Kondisi ini mendorong pentingnya suatu asosiasi yang turut berperan aktif dalam memberikan edukasi baik dari sisi pengembang maupun pengguna sehingga data data yang dihasilkan bisa digunakan untuk mendukung perekonomian dan pembangunan bangsa.

Inisiator dari AIDI terdiri dari para akademisi, pelaku industri, pemerintahan, dan komunitas. Tercatat dari akademisi adalah wakil dari Universitas Telkom, ITB, UNPAD, UNS, UGM, STIS. Dari Industri ada beberapa perusahaan seperti Solusi 247, Mediawave, NoLimit, Bahasa Kita, Zamrud Technology, PasarLaut. Dari pemerintahan diwakili oleh Kemenkominfo dan BPPT. Dari komunitas adalah dua komunitas besar di bidang Data Science + Big Data yaitu Komunitas Data Science Indonesia dan Komunitas IdBigData.

Banyak sekali permasalahan data-related yang membutuhkan aturan dan kebijaksanaan yang terintegrasi, contohnya Open Data dan Smart City. AIDI diharapkan akan berperan aktif dalam pembuatan draft regulasi yang berkaitan dengan data sebagai komoditas strategis. Dorongan perkembangan ICT dan keilmuan Data Mining, Machine Learning, dan Keseluruhan aktivitas Data Analytics membuat data menjadi komoditas yang sangat penting. Produksi data melimpah seiring dengan masifnya pengguna internet Indonesia membuat aktivitas disekitar data harus segera diatur dan dibuatkan roadmapnya.

Saat ini AIDI sedang melakukan konsolidasi organisasi dan menyusun program kerja, diharapkan dalam waktu tidak terlalu lama AIDI akan segera aktif berkontribusi untuk perkembangan Data Science + Big Data di Indonesia. Untuk informasi lebih lanjut dan update terkini bisa akses website AIDI yaitu www.aidi.id

IMG 2017 01 12 00 20 30

Para inisiator AIDI berfoto bersama, setelah penandatanganan deklarasi