Workshop Data Engineering untuk Auditor Kementrian Keuangan

Departemen Keuangan akhir akhir ini meningkatkan fokus dalam membekali sumber daya manusianya dengan pengetahuan mengenai Data Science. Beberapa pekerjaan harian dari kemenkeu seperti Auditor pajak bekerja dengan data dengan skala besar dan struktur data yang kompleks. Auditor dari berbagai inspektorat jendral dalam lingkungan kemenkeu, sering mengalami kesulitan dalam ekstrasi informasi dari data untuk mendukung pekerjaan mereka, dikarenakan belum mempunyai bekal pengetahuan yang cukup untuk melakukan proses analitik.  Saya dan tim RC DBE diminta untuk memberikan workshop yang terdiri dari 3 rangkaian kegiatan, yaitu data engineering (persiapan dan transformasi data), machine learning berbasis data terstruktur, dan capstone project.  Workshop ini diadakan dalam waktu 5 hari (22-26 April 2019). Dalam capstone project, para peserta diminta menyelesaikan masalah keseharian mereka menggunakan data yang ada dan berdasarkan storytelling yang sesuai dengan permintaan kemenkeu. Berikut ini adalah foto foto kegiatan tersebut

 

58917015 10156908069325202 8568533805051150336 o

58461017 10156908069370202 1867644237785333760 o58543927 10156908069630202 2895275533413646336 o58719879 10156908069805202 5674843153224433664 o58380912 10156908069740202 8737763969009188864 o

R Academy

Bahasa R merupakan komponen penting dalam mendukung keahlian profesi Data Scientist dalam melakukan aktivitas Data Analytics. Untuk itu kami dari Research Center Digital Business Ecosystem (RC DBE) Telkom University, merasa perlu mengadakan pelatihan R. Kebetulan bahasa R merupakan bahasa yang kami pergunakan untuk mendukung kegiatan riset kami sehari hari di lab. Maka dari itu kami rumuskan gagasan untuk menggelar event R Academy. dalam gelaran batch pertama ini, R Academy terdiri dari dua pertemuan (dua topik). Topik pertama pada tanggal 13 April membahas Pengenalan Bahasa R, dan Topik kedua pada tanggal 27 April membahas topik Visualisasi Data menggunakan R. 

Berikut foto foto dari gelaran event R Academy

57113071 10156877630710202 7481840313896534016 n56536201 10156858601960202 2421766126447886336 n56513087 10156858601905202 1281678576826974208 n56825564 10156877631790202 7375295369422307328 n56968259 10156877634190202 2938855252306165760 n57101634 10156877631200202 1830059575978491904 n57155503 10156877630910202 4407912884206567424 n57199437 10156877631110202 1795653872870490112 n

Workshop Open Source Intelligence untuk Para Diplomat

Dalam mendukung fungsi menjadi wakil urusan pemerintah RI di luar negeri, Kemenlu perlu membekali para diplomatnya dengan ilmu pencarian informasi terkini. Mulai dari ekstraksi informasi, peringkasan, sampai dengan mencari hubungan antar data atau pola dari Big Data, Oleh karena itu Kemenlu mengadakan pelatihan untuk keahlian tersebut. Saya (dan tim RC DBE bekerja sama dengan TPCC) mengisi pelatihan tersebut pada tanggal 29-30 April 2019 di Pusdiklat Kemenlu di Jakarta. Materi pelatihannya adalah mengenai OSINT (Open Source Intelligence).

Definisi  OSINT menurut wikipedia

Open-source intelligence (OSINT) is data collected from publicly available sources to be used in an intelligence context. In the intelligence community, the term “open” refers to overt, publicly available sources (as opposed to covert or clandestine sources). It is not related to open-source software or collective intelligence.

OSINT under one name or another has been around for hundreds of years. With the advent of instant communications and rapid information transfer, a great deal of actionable and predictive intelligence can now be obtained from public, unclassified sources.

Melihat definisi diatas, maka materi yang kami berikan adalah pengolahan data tidak terstruktur menggunakan pendekatan analisa topologi / jaringan dan analisa konten. Untuk analisa jaringan kami gunakan metodologi SNA, sedangkan untuk analisa konten, kami gunakan metodology analisa sentimen, jaringan kata, dan pencarian topik. Materi ini disambut cukup baik oleh para peserta, walaupun bagi sebagian besar dari mereka materi ini baru pertama kali mereka dengar. Untuk itu mereka membutuhkan waktu lebih untuk berlatih sebelum terbiasa menggunakan metode metode tersebut.

Para peserta adalah para diplomat yang sedang berada di Indonesia, hasil chit chat dengan peserta saya baru tahu kalau penempatan mereka diputar tiap 3 tahun sekali. Ilustrasinya 3 tahun di negara A, kemudian 3 tahun di Indonesia, baru dilanjutkan lagi 3 tahun di negara B, dan seterusnya.
Berikut ini adalah foto foto event tersebut.

 

58701354 10156916913510202 2654951613323542528 n58961755 10156917831080202 3835078170927693824 n59286209 10156916913345202 6220184651265212416 n57420717 10156916914030202 8657118905690488832 n58543647 10156916913555202 9011473327021096960 n58599071 10156916913280202 7948282094478688256 n58673996 10156916913660202 4369038293396881408 n59295328 10156916913420202 8270174740669267968 n

Workshop Claim Data Behaviour Analysis untuk Aktuaris

Tanggal 12 dan 13 Februari 2019, saya diundang oleh Persatuan Aktuaris Indonesia untuk memberikan materi dalam workshop dengan tema “Claim Data Behavior Analysis”. Materi yang saya berikan adalah seputar Data Analytics dengan menggunakan R. Informasi acaranya bisa dilihat di link ini. Acara ini sangat menarik bagi saya pribadi karena saya belum begitu paham dengan pekerjaan profesi aktuaris ini, walaupun secara garis besar saya paham bahwa pekerjaan utamanya adalah perhitungan resiko berdasarkan profile pelanggan. Dari perhitungan profile resiko tersebut baru deh ditentukan premi asuransi yang harus dibayarkan pelanggan. Baik asuransi jiwa maupun asuransi kerugian lainnya. Namun data dan model apa yang digunakan, bagaimana konstruksi model dan informasi lain lainnya masih merupakan tanda tanya besar bagi saya. 

Aktuaris mempunyai pengetahuan yang mumpuni dalam bidang matematika dan statistik, namun masih perlu belajar mengenai prinsip kerja data analytics dan machine learning. Dengan latar belakang cukup mumpuni, oleh karenanya materi yang saya berikan bisa dicerna dengan mudah oleh para peserta. 

Saya sendiri masih belajar bagaimana membuat model resiko dan rekan rekan aktuaris membutuhkan pembelajaran metode metode baru untuk melengkapi model model yang mereka punyai. Nah klop khan, semoga kolaborasi risetnya lekas terwujud, amin

berikut ini foto foto dokumentasi kegiatan tersebut. 

 

51675113 10156739161625202 5371719136160251904 n52464375 10156739161680202 8982137214330732544 o51699188 10156739161860202 3065142572302204928 o51795584 10156739161930202 324344449746337792 o51833953 10156739161795202 3808156461217873920 o51982105 10156739162010202 315653076616740864 o52020673 10156739162110202 1696963440033136640 o52053758 10156739161740202 8232804530874482688 o52328353 10156739162405202 5456512334728003584 n52513939 10156739162170202 9189932916136738816 o

 

Math & Big Data

Suatu hari saya dikontak oleh himpunan mahasiswa matematika (Himatika) dari salah satu perguruan tinggi swasta (PTS) di Bandung Utara, yaitu Universitas Islam Bandung (Unisba). Mereka berencana mengadakan seminar yang idenya adalah bertanya belajar matematika itu untuk apa, atau dipermudah dengan bahasan peran matematika dalam dunia kerja. Karena saya lulusan matematika dan kebetulan menggeluti bidang yang lagi hype yaitu Big Data, maka saya diminta tolong untuk mengisi acara seminar tersebut.

Biasanya permintaan mengisi acara seminar tidak serta merta saya terima, tetapi kali ini karena temanya Math & Big Data maka saya tertarik untuk mengisinya dan share beberapa pengalaman saya. Bahasan materi lebih kearah menyadarkan para mahasiswa bahwa kuantifikasi fenomena, pembuatan model, machine learning, ketersediaan data dalam skala besar, ternyata membutuhkan peran ilmu matematika, baik dalam hal logika, formulasi, abstraksi, dan verifikasi. Profesi Data Scientist merupakan jembatan untuk mewujudkan hal tersebut.

Acara diadakan pada hari sabtu tanggal 16 februari 2019. Beberapa dosen Unisba juga ikut serta hadir, serta mengajukan pertanyaan, diantaranya adalah bagaimana membuat lulusan matematika ini mempunyai ketrampilan atau skill yang bisa langsung diaplikasikan ke dunia kerja. Bagaimana susunan kurikulum yang baik untuk adopsi kebutuhan tersebut. Saya menjawab sebaiknya diberikan porsi SKS yang cukup besar (sekitar 12-15 SKS) bagi mahasiswa untuk mengambil matakuliah peminatan dari jurusan luar, sehingga mahasiswa matematika mendapatkan sebagian skill dunia kerja sesuai dengan peminatan profesi yang nanti mereka inginkan. 

Karakteristik orang matermatika adalah sibuk dengan dunianya sendiri, tanpa mengetahui ilmu yang mereka miliki itu sebenarnya dibutuhkan banyak oleh masyarakat luas. Kemampuan abstraksi, menurunkan formula, berpikir logis (deduktif dan induktif), merupakan kemampuan yang sangat dibutuhkan di dunia kerja. Dunia kerja tidak hanya melulu mengenai ketrampilan atau skill tapi juga pemahaman mendalam tentang suatu domain. 

Beberapa foto dari acara tersebut

52460344 10156747525190202 6297495724745555968 n51960792 10156747525210202 492616256176783360 n51747281 10156747525305202 5919647295434915840 n52586331 10156747525260202 3617584875348951040 o52846898 10156747525335202 6589775026696749056 n

Penyimpanan Publikasi di Academia

Sudah sejak beberapa tahun yang lalu, Academia.edu merupakan pilihan saya untuk menyimpan hasil karya / publikasi ilmiah saya dan rekan rekan lab. Pemilihan Academia karena platform ini cukup sederhana dan mudah diakses oleh rekan rekan yang tidak mempunyai latar belakang akademis. Academia sendiri bukan merupakan tempat penyimpanan ideal, bahkan menurut saya tidak ada tempat penyimpanan publikasi yang benar benar sesuai dengank einginan saya.  Beberapa tempat lainnya dimana saya ikutan daftar adalah adalah Researchgate, Arxiv.org, dan Mendeley. Menurut saya ketiganya tidak sesederhana Academia sebagai  tempat “hanya” untuk penyimpanan. Kalau ada masukan yang lain mohon dikasih tahu ya.

Sudah sejak beberapa lama juga Academia menyediakan layanan berbayar.  Saya selalu berusaha untuk tidak berbayar, karena kebutuhan saya yang sederhana untuk penyimpanan saja. Namun berhubung jumlah publikasi sudah mencapai angka 50an lebih, maka mau tidak mau saya mulai melirik layanan berbayar Academia, terutama layanan web nya. Akhirnya saya pun berlangganan, sambil melihat lihat apakah layanan ini bisa membantu atau memberikan, Nanti kita lihat selama setahun kedepan. Anyway alamat web academia saya adalah:

https://andryalamsyah.academia.edu/

Tampilannya cukup simpel tapi cukup bagus ya .. 

Screen Shot 2018 11 25 at 19 09 00  2Screen Shot 2018 11 25 at 19 09 12  2Screen Shot 2018 11 25 at 19 09 22  2

Narasumber Big Data

Semenjak lulus sidang terbuka (ujian promosi doktor) bulan januari 2018 kemarin, saya merasa jauh lebih bebas memikirkan riset, memikirkan keilmuan, dan memikirkan hal hal lain termasuk topik Big Data. Dulu boro boro mau mikirin banyak hal, kalo urusan disertasi belum beres rasanya ga mau mikirin yang lain. Ini lebih karena takut yang dikerjakan di disertasi jadi lupa ..hehe. Karena lagi masa “tenang”, eh Ndilalah (ini basa jawa artinya tiba tiba) kok banyak datang tawaran jadi narasumber topik Big Data. Berhubung kebebasan mencari ide dan bercerita soal Big Data lagi banyak, maka saya iyain tawaran tersebut, lagian tawarannya deket, cuman di bandung dan jakarta, sebenernya ada satu tawaran lagi di jogja, terpaksa saya tolak, karena bentrok dengan acara yang di bandung. 

Narasumber pertama adalah di SBM-ITB dalam rangka pembukaan (Kick-Off) Seminar Lab. Big Data Analysis dan Social Simulation. Kebetulan nama lab nya mirip dengan lab saya (Social Computing dan Big Data). Ternyata memang ruang lingkupnya pun mirip, jadi asyiknya sekarang saya punya rujukan untuk kolaborasi riset tentang studi manusia / sosial menggunakan Big Data. Kebetulan ketua lab tersebut adalah teman waktu sama sama kuliah S1 di Matematika ITB. Jadi memang networking itu benar adanya. Saya yakin dengan kemampuan rekan saya (yang sealmamater ini) dalam membawa lab ini menjadi sukses. Sekali lagi selamat SBM ITB. 

Topik seminar SBM adalah “Big Data Development in Education and Business Practice”, dari topik besar tersebut saya jadi memikirkan kembali kenapa edukasi Big Data di Indonesia belum kedengaran gaungnya, padahal industri / bisnis lagi banyak mencari info dan talenta. Dari pemikiran tersebut maka muncul pemetaan kelimuan dan profesi Data Scientist yang saya tulis di blog ini. Dipikir pikir semakin sering jadi narasumber dan disodorin topik topik tertentu berkaitan dengan keahlian kita, maka semakin kita menguasai topik yang kita “rasa” kuasai dari berbagai sudut pandangan. 

Narasumber kedua adalah menjadi pembicara di acara BMKG (Badan Meterologi, Klimatologi, dan Geofisika). BMKG sedang menyambut hari jadi ke 68 hari meteorologi dunia. Untuk menyambut hari tersebut, mereka mengadakan seminar ilmiah dengan tema “Implementasi Big Data dan Artificial Intelligence untuk Peningkatan Layanan Kecepatan dan Akurasi Layanan Informasi BMKG”. Pembicara yang diundang adalah dari LIPI, UI, ITS, Grab, Solusi247, Telkom Indonesia, Schumberger, dan saya sendiri mewakili Telkom University. Materi yang saya bawakan berkaitan dengan peran Big Data dalam memahami perilaku manusia. Sepertinya topik saya tidak bersinggungan langsung dengan BMKG, akan tetapi ternyata misi dari BMKG sendiri adalah melihat kemajuan terkini terkait penelitian Big Data dalam segala bidang. 

Menjadi narasumber dalam suatu acara merupakan kesempatan bagus untuk menjalin jaringan dengan orang orang yang satu rumpun keilmuan dengan kita, atau bisa juga yang keilmuan tidak sama tapi mempunyai minat yang sama. Oh ya ngomong ngomong kenapa saya yang dipilih jadi narasumber di BMKG, rupanya alasannya sama dengan yang SBM, lagi lagi di BMKG ada rekan sesama almamater di S1 Matematika dulu.  ternyata oh ternyata .. eh tapi bukan hanya karena pertemanan lho saya diundang, tapi pertemanan bisa membantu menemukan siapa teman kita yang punya kemampuan seperti yang kita inginkan

Next Narasumber ? .. ada deh bulan bulan depan, nanti diupdate lagi beritanya.

Foto fotonya …

 

IMG 9170IMG 9284IMG 91636f520024 7198 43f1 80a6 ac297618d74e

 

 

Pemetaan Profesi Data Scientist

Big Data

Saking seringnya ngobrol tentang Big Data dengan beberapa kalangan, lama lama saya mulai bisa memetakan kebingungan, kegalauan, dan pemahaman masyarakat mengenai topik ini. Kebanyakan masyarakat yang awam dengan Big Data, sering tidak bisa mendefinisikan dengan tepat apa itu Big Data. Mereka hanya tahu bagian input dan output saja ..  proses di tengahnya gelap seperti blackbox. Bahkan beberapa rekan dosen yang masih awam bilang, coba selesaikan masalah penelitian dengan Big Data (maksudnya sih mengambil data dari media sosial), sementara yang lain menggangap bahwa Big Data itu metode pengganti statistik yang lebih canggih. Tentu saja anggapan anggapan tersebut tidak benar, kita semua mengenal istilah Big Data ini, karena ada peluang tersedianya data dalam jumlah besar, sehingga muncul peluang untuk memanfaatkannya. Perkara apakah hasil riset menggunakan Big Data akan lebih baik dari hasil metode konvensional (statistik), yah belum tentu juga.

Jadi Big Data itu apa ?, metode, alat, media atau yang hal lainnya yang kompleks,  tidak masuk dalam kategori yang bisa dipahami (rumit), maka dimasukkan ke dalam Big Data. Lucunya ini kenyataan lho, bahkan misalkan proses optimasi, simulasi, dan model matematika yang sudah ada sejak dulu, sering dianggap sebagai bagian Big Data juga, hanya karena metode itu saat ini sering digunakan (untuk menyelesaikan masalah kompleks) karena ketersediaan data yang semakin mudah. Sisi bagusnya adalah metode metode seperti artificial neural network, simulasi monte carlo, simulated annealing, dan lain lainnya semakin sering dipergunakan dan semakin dikenal.

Data Science

Supaya tidak terjebak istilah Big Data yang ambigu, maka saya sarankan kita bicaranya dari sisi Data Science saja. Data Science adalah suatu ilmu yang berpusat pada data sebagai komoditi utamanya. Beberapa metode dan kepentingan dari latar belakang kelimuan yang berbeda digunakan. Ilmu ilmu tersebut antara lain adalah ilmu komputer, matematika / statistika, bisnis, dan domain / konteks permasalahan.  Orang / talentanya disebut sebagai Data Scientist, dalam bahasa Indonesia adalah Ilmuwan Data. Kebetulan saya dan beberapa rekan ilmuwan serta praktisi membuat wadah Asosiasi Ilmuwan Data Indonesia (AIDI) (silahkan dicek,  boleh kok bergabung). Masih ingat postingan saya beberapa tahun yang lalu tentang tulisan Davenport dan DJ Patil di HBR bahwa “Data Scientist is the most sexiest job in 21th century” pada tahun 2012. Ternyata 5 – 6  tahun kemudian tetap sexy lho, cek disini dan disini.

Karena begitu sexy nya profesi ini, maka saya mulai melakukan riset kecil kecilan, kenapa profesi ini begitu dicari. Industri begitu kesulitan, dan bahkan putus asa mencari talenta yang bisa melakukan analisa, menceritakan pola dari data, dan membuat prediksi. Karena latar belakang pendidikan lulusan universitas pada umumnya sering terkotak kotak pada kelompok keilmuan tertentu, dan belum bisa berkomunikasi dengan bidang lain. Sebagai gambaran, daripada memberi gaji 1x ke programmer, 1x ke modeler, dan 1x ke orang bisnis (total 3x gaji), lebih baik perusahaan memberikan gaji 5x ke 1 orang yang menguasai ketiga domain tersebut. Nah talenta / orang ini yang disebut sebagai Data Scientist.

Pemetaan Data Scientist

Data Analytics Body of Knowledge

Data Science Knowledge Area

 

Data Engineering Body of Knowledge

 

Hasil baca sana sini, diperolah bahwa seorang Data Scientist itu harus mempunyai Knowledge Area (area pengetahuan) di bidang Data Analytics, Data Engineering, Data Management, Research Methodology, Project Management, Business Analytics, dan Domain Knowledge. Masing masing dari area pengetahuan diatas dibagi lagi menjadi keilmuan keilmuan kecil yang disebut sebagai Body of Knowledge (BoK) yang diselaraskan dengan cabang keilmuan, sehingga kita bisa identifikasi keilmuan besarnya masuk ke dalam ilmu apa. Peta sementara dari 3 gambar diatas, menunjukkan betapa kompleksnya keilmuan data tersebut, tidak salah kalo memang pekerjaan ini disebut pekerjaan sexy.

Oh ya sebagai penutup blog singkat ini.  Dari segitu banyak “maunya” industri mencari talenta Data Scientist yang canggih, sampai saat ini belum terlihat adanya daftar / framework kompetensi dari seorang Data Scientist yang diinginkan oleh industri, atau bahkan kompetensi secara global. Ini menjadi PR penting dalam rangka mengurangi gap antara lulusan universitas dan industri.

Menembus Kemacetan Bandung (Acara sharing BPS dan Konferensi ICoDIS)

Kemarin saya mendapatkan undangan untuk mengisi dua buah acara di bandung yang lokasinya berjauhan. Satu lokasi di ujung utara , di hotel grand mercure, jalan setiabudhi (di sekitaran area rumah sosis) dan satu lagi di ujung selatan, di kampus universitas telkom, jalan terusan buah batu. Acara di grand mercure adalah menjadi narasumber materi “Big Data Analytics Implementation” untuk Badan Pusat Statistik jam 8 pagi, sedangkan di universitas telkom adalah menjadi moderator plenary session pada International Conference on Data and Information Science (ICoDIS) jam 13 siang.

Bagi yang tinggal di Bandung tentu bisa membayangkan perjuangan menembus kemacetan yang makin hari makin tidak bisa diprediksi. Terutama dengan ada perbaikan jalan layang pasupati, kondisi pintu masuk GT pasteur yang menyempit, kemacetan luar biasa daerah terusan buah batu, belum lagi kemacetan daerah lain yang tidak terduga.

Akhirnya saya membujuk panitia acara BPS untuk memperbolehkan saya selesai jam 11 (dari rencana jam 12). Alhamdulilah perjalanan turun dari setiabudhi sampai GT pasteur lumayan lancar, hanya memakan waktu 30 menit, dari GT pasteur ke GT buah batu juga memakan waktu 30 menit. Tapi dari GT buah batu ke kampus telkom siang kemarin macetnya melebihi ekspektasi. Saya menghabiskan waktu 50 menit sampai ke gedung acara konferensi. Untungnya acaranya yang jam 13 dimulai agak telat, sehingga saya masih sempat sholat dan makan siang dulu. Total waktu dari setiabudi ke kampus univ telkom adalah 1 jam 50 menit.

Kesimpulannya jangan lagi lagi memenuhi undangan acara dalam sehari dalam jarak yang berjauhan seperti yang saya lakukan. kemarin saya termasuk beruntung karena hanya menemui satu titik kemacetan saja. Next time it could be worse

berikut foto acara sharing BPS dan konferensi ICoDIS