Sharing KickScraper (KickStarter Scrap using Ruby) sebagai Pemahaman Proses Pengumpulan Data

Lab Social Computing & Big Data mulai semester ganjil 2017/2018 ini diisi dengan personil personil baru mahasiswa angkatan 2014. Mereka akan mengadakan kegiatan riset, melayani pelatihan / asistensi mata kuliah Big Data dan Data Analytics, serta mengadakan acara sharing ilmu / akademik setiap minggu. Untuk minggu pertama ini kegiatan sharing diisi topik mengenai KickScraper, yaitu bagaimana melakukan web scrapping terhadap website Kickstarter dengan menggunakan script bahasa Ruby. Pemateri acara kali ini adalah Tri Buono, mahasiswa angkatan 2013. Teknik yang disharing oleh dia berkaitan dengan risetnya mengenai pengenalan pola pola investasi pada perusahaan startup. Acara ini dihadiri mahasiswa lab dan juga dosen dosen KK dan pengajar matkul Big Data & Data Analytics

Terdapat dua problem mendasar pada kegiatan data analytics yaitu yang pertama data collection dan yang kedua aktivitas data analytics sendiri. Kegiatan data collection sendiri merupakan masalah besar di Indonesia pada umumnya, dimana jarang sekali individu / organisasi yang memahami pentingnya semangat Open Data, sehingga data masing masing instansi / organisasi berdiri sendiri sendiri dan tidak teintegrasi, akibatnya banyak pekerjaan atau kebijaksanaan yang saling tumpang tindih, tidak konvergen mencapai tujuan bersama. Saya pernah punya pengalaman buruk mengenai open data dengan pemkot, dimana walikota klaim bahwa data pemkot terbuka untuk umum, tapi begitu mahasiswa saya mempelajari polanya, ternyata data tersebut tidak ‘berbunyi’ sehingga tidak bisa dicari polanya, tidak bisa didapat informasi atau pengetahuan. Pernyataan bahwa data sudah terbukapun  perlu diperiksa lagi, karena kita belum tahu seberapa lengkap data yang dimiliki.

Pada sharing kali ini, tujuan utama yang ingin dicapai bukanlah mengajarkan teknik mengambil datanya, tapi pemahaman bagaimana proses perolehan data. Kickscraper mengambil data web Kickstarter menggunakan API. Berbeda dengan teknik klasik web scrapping menggunakan layanan seperti import.io ataupun parsehub, maka pengambilan data menggunakan API lebih fleksibel, lebih powerful dan bisa mengambil hidden data kalau penyedia layanan mengijinkan. Kerugiannya adalah kita tidak tahu sampai kapan API tersebut tersedia (secara gratis). Jadi proses data collection merupakan proses yang dinamis, apa yang kita ketahui hari ini belum tentu besok masih bisa dilakukan. Oleh karenanya pesan yang saya sampaikan adalah yang paling penting memahami proses, klasifikasi jenis / teknik pengamnilan data, serta membiasakan mahasiswa mahasiswa manajemen bisnis ini untuk ngoding …. yah bahasa koding ini bahasa yang paling penting dipelajari selain bahasa inggris. Beberapa mahasiswa memang tidak biasa dengan pengoperasian terminal di mac atau  windows shell, bahkan belum tahu bagaimana menjalankan ruby (ataupun python dan sejenisnya), sehingga acara sharing ini merupakan sarana bagus untuk memperkenalkan hal hal tersebut. 

 

IMG 8452

IMG 1082

IMG 0102

IMG 8369

IMG 5349

IMG 3885

Advertisements

Dinamika Pilkada DKI 2017 menggunakan Jejaring Sosial

Pilkada DKI 2017 merupakan event yang menjadi magnet bagi bangsa Indonesia, bukan hanya ekslusif untuk warga DKI saja. Event ini sangat menarik untuk dianalisa, terutama buat saya yang selama ini mendalami keilmuan jejaring sosial, dimana konsentrasi pergerakan sosial atas isu isu tertentu bisa menjadi bahan untuk memahami perilaku sosial bangsa kita. Perilaku pada media sosial menunjukkan bagaimana opini nyata tiap individu, pembentukan kelompok sosial, dan juga rekayasa opini (termasuk hoax dan lain lainnya). Pada entri kali ini saya melihat dinamika percakapan masyarakat Indonesia di media sosial membahas berbagai topik berkaitan dengan Pilgub DKI 2017. Sebagai disclaimer saya tegaskan politik bukan merupakan domain yang saya pahami sepenuhnya. Pada entri blog ini tidak ada tendensi untuk mendukung calon manapun, dan lagian saya bukan warga DKI juga 😛

 

Saya mengambil data di Twitter sebagai sample, karena di media sosial ini perilaku sosial terkait pilkada terlihat jelas. Facebook juga menunjukkan kecenderungan serupa dengan Twitter, tetapi karena di Facebook tidak mungkin bagi kita untuk mengambil semesta data, dan hanya mungkin mengambil data dari lingkungan pertemanan kita, maka Twitter merupakan media yang tepat dari sisi pencapaian pengambilan data dan keterwakilan sample.

 

Profil Data :

Data percakapan di Twitter diambil mulai dari tanggal 8-11 februari 2017, tepat selama 60 jam. Durasi ini melewati acara debatcagub ke 3 yang diadakan pada tanggal 10 februari malam.  Sebelum acara debat yang dilaksanakan tweet yang terkumpul adalah sebanyak 18077 tweet (nomer1), 23656 tweet (nomer2), dan 41053 tweet(nomer3). Setelah acara debat terlihat lonjakan jumlah tweet menjadi 35380 tweet (nomer1), 49028 tweet(nomer2), dan 82185 tweet(nomer3). Total keseluruhan tweet yang diambil adalah sebanyak 166593 tweet dengan total data space mendekati 1 GB. Keyword / Hashtag disesuaikan untuk tiap tiap paslon, sesuai dengan hashtag yang paling banyak diadopsi oleh publik dan pendukungnya. Hashtag hashtag tersebut antara lain 

 

nomer 1 : #jakartauntukrakyat #ahyfordki1 #MuslimberSatupilihno1 #AgusSylviKonsisten #SATUkanjakarta #JakartaForAll

nomer 2 : #perjuanganbelumselesai #coblosbadjanomor2 #FreeAhok #BadjaMelaju #SekuatBadja #Gue2 #Badjajuara #salamduajari

nomer 3 : #salambersama #TerbuktiOkOce #majubersama #CoblosPecinya #AniesSandiCintaUlama

 

Nomer1


Dari paslon nomer 1 saya memperoleh 35380 tweet, dimana didalamnya terdapat 8505 aktor yang terlibat percakapan, dengan sejumlah 29836 percakapan antar aktor tersebut. Pola percakapan dari gambar dibawah memperlihatkan bahwa terdapat 3 kelompok besar  (ungu, hijau, biru) yang mendominasi 60% percakapan. Aktor aktor utama jaringan ini adalah @AgusYudhoyono @Abaaah @SBYudhoyono. Terdapat beberapa situs berita yang dominan yaitu @Metro_TV @kompscom @detikcom dll. keseluruhan top 50 aktor bisa dilihat di gambar dibawah. Kelompok terbesar adalah kelompok berwarna ungu dengan ukuran 27% (cukup besar) dari keseluruhan jaringan.  Kelompok terbesar ini berisi tokoh tokoh utama dari paslon 1, kelompok kedua sebesar 13% berisi akun akun pendukung utama seperi @AhyCenter @agusylviDKI @ZaraZettiraZZ @Umar_Hasibuan @panca66. 

 

 

1

 

1detail

 

1top

 

11

Nomer2

 

Dari paslon nomer 2 diperoleh 49028 tweet, dimana percakapan tersebut melibatkan 15745 aktor dan 44834 percakapan antar aktor aktor tersebut. DI jejaring nomer 2 ini kelompok terlihat lebih menyebar dengan kelompok terbesar berwarna ungu mempunyai ukuran hanya 10,9%, dilanjutkan dengan kelompok warna hijau tua (9,5%), dan disusul warna biru (8,39%). Aktor aktor utama nya bisa dilihat pada gambar dibawah (top-50), terlihat bahwa aktor aktor dominan tersebut berada pada kelompok yang berbeda (terlihat dari warna node yang berbeda). 

 

 

2

 

2detail

 

2top

 

21

 

 Nomer3

 

Paslon 3 mempunyai data tweet yang paling banyak dibandingkan paslon lainnya. 82185 tweet terambil dalam periode pengambilan, yang melibatkan 12744 aktor dan 22565 interaksi percakapan. Dengan sejumlah 22565 tweet interaksi dibandingkan dengan total 82185 tweet yang terambil, maka rasio percakapan / diskusi dalam jaringan ini sangat kecil dibandingkan paslon lain. Sebagian besar tweet adalah indivdual tweet atau tweet yang tidak mengenerate percakapan.Seperti paslon 1, kelompok di jaringan ini didominasi oleh 3 kelompok utama yaitu kelompok ungu (26,76%), hijau (23,67%), dan biru (18,51%). Total tiga kelompok tersebut sudah sangat mendominasi dengan mencakup 69% percakapan. 

 

 

3

 

3detail

 

3top

 

31

Analisa

 

Dari pengukuran average degree (rata rata koneksi dari seorang aktor) dan network diameter (besar jaringan)  ketiga jejaring sosial tidak mempunyai perbedaan yang signifikan. Pada pengukuran .graph density (kepadatan percakapan), Nomor 1 dan 2 lebih baik dari Nomor 3, kepadatan yang baik lebih disukai, ini mengindikasikan bagaimana banyaknya interaksi dalam suatu jejaring sosial. Perbedaan yang signifikan terlihat dari dinamika terbentuknya kelompok dan pengukuran kecenderungan pengelompokan dengan menggunakan metric modularity. Nomer 1 dan nomer 3 mempunyai nilai modularity yang lebih tinggi dari Nomer 2, yang artinya kelompok yang terbentuk benar benar terpisah dengan jelas. Kelompok kelompok pada paslon nomor  2, masih berhubungan erat dengan keompok lain dalam jejaring sosialnya.  Bisa disimpulkan bahwa percakapan paslon nomor 2 lebih di generate oleh massa, sehingga kelompok percakapan yang terbentuk terlihat lebih natural, sedangkan kelompok pada nomor 1 dan nomor 3 dikendalikan secara sistematik oleh aktor aktor utama.

 

Analisa jejaring sosial adalah analisa cepat untuk melihat dinamika struktur jaringan. Untuk supaya bisa memodelkan dan membuat prediksi siapa pemenang pilkada, tentunya butuh analisa faktor lain, contohnya seperti analisa konten tweet (sentiment analysis atau opinion mining). Saya pernah mengusulkan analsia konten dengan cara cepat menggunakan network text analysis seperti yang saya tulis di paper saya ini dan paper saya yang ini. Untuk analisa konten tersebut, dibutuhkan data raw twitter, berhubung data tersebut berukuran sangat besar 1 GB dan berada di komputer lab., plus  sayanya sedang mobile (weekendan), maka saya hanya mengambil ekstrak data jejaring sosial yang hasilnya saya jabarkan dalam blog ini.

 

Bila ada yang tertarik untuk menganalisa topik ini lebih mendalam, terutama yang ahli dibidang politik, silahkan kontak saya untuk berdiskusi atau bahkan mungkin mendapatkan datanya. 

 

 

 

Fenomena #SayaBertanya

Hashtag #SayaBertanya muncul pertama kali pada 6 Februari 2017 setelah mantan presiden SBY memposting tweet yang ditujukan kepada Presiden dan Kapolri. Saya tidak menyoal tweet pak SBY tersebut, tapi saya lebih tertarik viralitas hashtag ini yang ternyata sangat populer. Viralitas tersebut disebabkan kreativitas warga twitter sendiri yang membuat guyonan menggunakan hashtag tersebut, terlepas itu sindiran atau hanya sekedar guyonan. Meme dan variasi kata pendek ini diaplikasikan ke dalam permasalahan pacaran, gebetan, harga bahan pokok, kemacetan, dan hal hal keseharian masing masing orang. Viralitas ini juga menyebar sampai ke facebook, instagram, dan path.

Sayangnya saya baru sempat ambil data sejak tanggal 7 Februari, jadi lumayan telat sehari dari puncak masa populer hashtag tersebut. Akan tetapi walaupun telat, dimana saya mengambil tweets antara tanggal 7-9 februari (selama kurang lebih 50 jam). Saya mendapatkan 25 ribu tweet yang memuat hashtag #SayaBertanya. Menurut saya termasuk lumayanlah, sebenarnya proses crawling sampai saat ini masih tetap berjalan, tapi saya sudah ga sabar untuk segera analisa dan nunggu hasilnya :P. Dari 25 ribu tweet tersebut, saya memperoleh 8613 aktor dan 15898 relasi, cukup lumayan ramai / padat percakapan yang terjadi disana baik dalam bentuk retweet maupun reply / mention.  

Viralitas hashtag ini menunjukan bagaimana dinamisnya bangsa kita di media sosial. Bagaimana kreativitas merubah hal hal yang biasa menjadi suatu hiburan dan menjadi topik pembicaraan serius maupun santai. Fenomena yang asyik untuk diteliti dan dijadikan percobaan perilaku manusia di internet.

Berikut ini pola interaksi hashtag #SayaBertanya

Sayabertanya1

Sayabertanya2

Berikut ini ini adalah aktor aktor dominan dalam percakapan tersebut. @SBYudhoyono paling banyak dimention, diteruskan oleh @jokowi dan @basuki_btp. 3 kelompok terbesar adalah kelompok (modularity class) no 11, 544, dan 540. @jokowi @basuki_btp tidak termasuk ke dalam kelompok dominan. 

Screen Shot 2017 02 09 at 9 14 00 PM  2

Berikut ini contoh contoh tweet tweet dari hashtag ini yang lucu lucu (menurut saya lho)

Screen Shot 2017 02 09 at 8 43 47 PM

Screen Shot 2017 02 09 at 8 43 52 PMScreen Shot 2017 02 09 at 8 44 10 PM

Contoh contoh lain bisa dilihat di artikel (di detik) berikut ini : 

https://inet.detik.com/cyberlife/d-3415131/netizen-heboh-sayabertanya-kepada-presiden

Terpaksa Ngoding, Tapi Seneng …

Beberapa saat yang lalu saya diajak riset bersama oleh peneliti dari Inggris. Topik riset sendiri meneliti bisnis otomotif dengan mengambil data dari media sosial. Karena kesibukan saya yang “super” saat itu, maka saya serahkan proses data collection dan pre-processing ke asisten (mahasiswa). ekspektasi saya proses ini akan berjalan dalam waktu seminggu. Seminggu, dua minggu saya tunggu ternyata belum beres juga. Saya selidiki ternyata ada permasalahan dalam langkah pre-process data yang  saya baru tahu masih menggunakan beberapa langkah manual  … :(. Makanya asisten saya seperti kewalahan mengurusi data ratusan ribu tweet, kalau dibiarkan bisa bisa dia stress, plus saya sendiri udah tidak sabar nungguin hasil crawl dan analisa

Jadinya saya otak atik python supaya proses transformasi data mentah dari twitter ke format social network menjadi lebih cepat dan otomatis. Setelah setengah hari ngoding akhirnya problem pre-process yang berlangsung lama bisa diselesaikan dengan koding saya tersebut. Senengnya dari data twitter sebesar 500mb (200 ribu tweets) bisa saya konvert dalam kurun waktu kurang dari 10 menit. Wah tahu gini proses yang seminggu kemarin bisa diselesaikan dalam 10 menit. Memang kalo ga kepentok problem, sepertinya saya juga ga akan turun tangan ngoding sendiri …:D

Seneng juga kalo koding yang kita bikin bener bener menyelesaikan masalah .. nah akhirnya karena lagi seneng, maka saya teruskan menggambar visualisasi jejaring sosial 3 merk mobil dari data 200 ribu tweet yang saya sebutkan diatas … 

Merk A

merk A

Merk B

merk B

Merk C

merk C

Sharing Big Data ke ITERA

Pada tanggal 31 Januari 2017, Saya memberikan materi tentang Data Science Business Perspective pada acara meetup komunitas idBigData dan Asosiasi Ilmuwan Data Indonesia (AIDI) di Institut Teknologi Sumatra (ITERA) – Lampung. Kesempatan ini adalah pertama kalinya saya mengunjungi ITERA. Saya sudah mendengar mengenai kampus ini sejak 2-3 tahun yang lalu, yang mana pada saat itu mereka sedang gencar gencarnya membuka lowongan dosen. Acara di ITERA ini adalah juga acara Big Data pertama kali yang saya ikuti di luar jawa. Hal ini sangat menarik karena kita juga perlu memeratakan pengetahuan mengenai Big Data di kampus kampus di luar pulau jawa.

Acara idBigData meetup ini sudah diadakan 12 kali, setiap bulan rutin diadakan dengan bersafari ke kampus kampus di seluruh Indonesia. Kali ini acara cukup istimewa karena AIDI yang baru dibentuk bulan november 2016 ikut berperan serta. Sebagai info idBigData berkonsentrasi kepada metodologi komputasi Big Data sedangkan AIDI berkonsetrasi kepada aktivitas analytics Big Data.

Selain saya yang mewakili AIDI, pemateri lainnya adalah Ibu Masayu (ITB / ITERA) yang membawakan materi peringkasan text bahasa indonesia, Pak Beno (Solusi247) mengenai kedaulatan data Indonesia, Pak Sigit (idBigData) mengenai engine Big Data Yava. Peserta yang hadir adalah mahasiswa dan dosen ITERA, dan juga industri, pemerintah, dan mahasiswa lampung di luar ITERA. Ini sangat menarik melihat keragaman peserta yang ikut hadir pada acara ini.

Streaming video materi saya dan foto fotonya bisa dilihat berikut ini :

FullSizeRender 3

IMG 0777

Rekayasa Komunikasi / Communication Engineering

Tadi malam sambil ngopi ngopi dan makan gorengan, saya ngobrol ngobrol asyik (unofficial) dengan beberapa rekan social media officer (SMO). SMO ini sebenernya kerjanya rangkap rangkap menjadi Humas, Customer Relationship Management (CRM), Branding, Analisa Kompetitor, membangun massa dan lain lain melalui corong media sosial organisasi / perusahaan. Berat bukan pekerjaan mereka ? .. sepertinya mudah tapi tanggung jawabnya sangat besar dan belum ada alat ukur yang pasti bagaimana mengukur keberhasilan pekerjaan mereka, akibatnya banyak SMO yang disalahkan karena dianggap tidak optimal mendukung aktivitas organisasi dalam berhubungan dengan pihak luar. Beberapa rekan SMO mengungkapkan strategi mereka untuk mengatasi hal tersebut, seperti menghitung like, retweet, engagement, dll .. tapi rasanya belum ada pemahaman mendasar bagaimana menjelaskan pengukuran pengukuran yang dilakukan, sampai saya ingat ide saya 5 tahun lalu (mengenai rekayasa komunikasi) saat saya pertama kali belajar mengenai social network analysis (SNA).

Ide yang saya lontarkan saya sebut sebagai Rekayasa Komunikasi ( Communication Engineering), yang tujuannya adalah bagaimana kita bisa merekayasa jejaring sosial sehingga bentuk, ukuran, dan engagementnya sesuai yang kita inginkan. Teringat hal tersebut, saya langsung presentasikan di depan para SMO mengenai beberapa faktor dan framework untuk merekayasa komunikasi online ini. Dengan paham rekayasa komunikasi kita bisa menangkis hoax, mengukur viralitas (diseminasi informasi), mengukur brand awareness, meningkatkan jumlah engagement, meningkatkan audience secara terukur dengan menyediakan langkah langkah strategis sesuai feedback dari bentuk jaringan, dll.

Contoh ilustrasi jejaring sosial bisa dilihat pada gambar 1, berikut ini. Misal terdapat 34 orang / aktor di dalam jejaring sosial yang membicarakan tentang suatu brand / organisasi. Maka bentuk jaringan 34 orang yang semuanya saling terhubung tentu akan berbeda dengan bentuk jaringan 34 orang yang masing masing punya satu hubungan. Disini jejaring sosial memainkan peran penting dalam mengukur kompleksitas hubungan yang ada (diukur dari berapa banyaknya hubungan atau densitas jejaring sosial). Kita bisa monitor bentuk jaringan sosial percakapan per hari untuk melihat apakah usaha usaha yang dilakukan SMO mendapatkan respon positif (jaringan membesar) atau bahkan respon kurang (jaringan menciut). Kita juga bisa identifikasikan orang orang yang berpengaruh di dalam jaringan (aktor nomer 1, 33, 34) baik pengaruhnya baik ataupun buruk. Kelompok yang terbentuk di dalam jejaring sosial dan lain lain

 

NewImage

  gambar 1. jejaring sosial 34 orang 

Framework yang saya usulkan supaya kerja SMO menjadi terukur menggunakan rekayasa komunikasi adalah pada gambar 2 sebagai berikut. Disini dapat dilihat bahwa sumbu X dan sumbu Y menunjukan bahwa network (ukuran, densitas, bentuk jaringan) menjadi tolak ukur apakah 5 faktor (content, context, buzzer, threat, interactivity) membawa perubahan signifikan ke network. Saya uraikan satu satu faktor tersebut.

Framework SMO

gambar 2. framework rekayasa komunikasi 

1. Content

Konten adalah hal pertama yang bisa meningkatkan engagement atau memperbesar ukuran jaringan (Viral). Kita bisa melakukan day-to-day monitoring terhadap ukuran jaringan. Apakah konten yang kita tampilkan memperbesar jaringan secara signifikan, mengecilkan jaringan atau tetap saya tidak ada perubahan. Dengan target engagement audience yang besar (menjadi massa) maka kita harus memperbanyak konten / akun yang menampilkan cerita yang berhubungan dengan brand dari berbagai sisi, kemudian kita lihat konten mana yang berhasil menjadi viral dan konten mana yang tidak, serta mendefinisikan karakteristik audience kita

2. Context

Dengan konteks yang sesuai maka ukuran ukuran jaringan juga bisa membesar secara cepat, contoh adalah menyesuaikan dengan trending topics, seperti Om Telolet Om , Persib Juara dan lain lain. Sama seperi konten diatas kita evaluasi konteks yang kita tampilkan apakah sukses menjadi viral, jika tidak, langkah apa yang diperlukan supaya menjadi viral

3. Buzzer

Buzzer sebetulnya bukan suatu keharusan, akan tetapi jika kita ingin membentuk massa dengan cepat (tidak melihat kualitas) maka menyewa buzzer merupakan langkah yang praktis. Perlu diingat bahwa kehadiran buzzer perlu dievaluasi dengan ukuran berapa besar jaringan yang buzzer berhasil bentuk yang akhirnya terintegrasi dengan jaringan brand kita. Dan apakah jaringan ini bersifat permanen atau temporary. Evaluasi jaringan membantu SMO dalam melihat efektivitas seorang Buzzer

4. Threat

Identifikasi ancaman merupakan salah satu faktor yang penting agar supaya jaringan yang ktia bentuk dengan susah payah tidak menjadi bubar dan hancur. Identifikasi ancaman dilanjutkan dengan langkah meminimalisir ancaman. Kita bisa melakukan proses analisa sentimen terhadap jaringan brand kita. Jaringan yang terbentuk bisa dibagi menjadi kelompok jaringan positif dan kelompok jaringan negatif. Identifikasi tokoh pada jaringan negatif dan langkah langkah untuk meminimalisir supaya tidak viral perlu dilakukan bergantung kepada kondisi isu yang digulirkan. Identifikasi hoax juga bisa dimulai dari aktvitas pada faktor ini.

5. Interactivity

Dalam rangka pencarian informasi yang efektif dan efisien, banyak pengguna intereat beralih menggunakan media sosial sebagai jalur komunikasi utama ke perusahaan. CRM melalui media sosial sudah banyak diadopsi oleh perusahaan perusahaan besar. Akan tetapi masih banyak juga perusahaan yang belum melakukan hal ini. Dengan menyediakan jalur komunikasi antar pelanggan-perusahaan melalui media sosial, maka viralitas dan ukuran jaringan akan meningkat, apalagi aktivitas CRM biasanya bisa kita lihat juga sebagai Frequently Asked Question (FAQ), sebuah dokumentasi penting yang wajib dipunyai oleh sebuah brand. Interactivity yang tinggi sangat disukai audience dan secara positif memperbesar ukuran jaringan.

Ke lima faktor diatas adalah faktor faktor yang bisa kita rekayasa untuk meningkatkan viralitas, brand awareness, menambah jumlah user, dan meminimalisir ancaman. Saya pernah berkata bahwa di era ICT saat ini. Komunikasi bukan hanya masalah kualitas konten tapi juga pengukuran penyebarannya, makanya sebetulnya orang orang yang melakukan aktivitas rekayasa ini lebih kita sebut sebagai engineer (insinyur) daripada seorang ahli sosial. Entah yang lains etuju apa tidak … Semoga bermanfaat …

Asosiasi Ilmuwan Data Indonesia (AIDI)

Pada acara Data Science Days bulan November 2016 yang diselenggarakan oleh Fakultas Ekonomi dan Bisnis, Universitas Telkom, telah dideklarasikan terbentuknya Asosiasi Ilmuwan Data Indonesia (disingkat AIDI). Latar belakang pembentukan AIDI adalah perlunya membangun suatu ekosistem Data Science (+Big Data) yang aman, bermanfaat sejahtera, berdaya saing, berkelanjutan untuk mendukung pembangunan bangsa dan kedaulatan data Indonesia. Perlunya perkumpulan / gerakan ini, kami rasakan sejak bermunculannya layanan berbasis internet (dari luar negeri) yang mengumpulkan data data dari pengguna internet Indonesia. Kita mengenal penyedia layanan tersebut dengan sebutan Over The Top content (OTT), contohnya yah penyedia layanan jejaring sosial yang populer di Indonesia (Facebook, Twitter, Instagram, Path, dll), layanan terintegrasi seperti Google (email, maps, search engine..), layanan pengetahuan (wikipedia, imdb), layanan berita, layanan perjodohan, layanan chatting, dan lain lain

Kurang mampu bersaingnya aplikasi nasional / OTT lokal (atau mungkin kurang populernya) membuat data data yang diproduksi dari aktivitas online terkirim ke penyedia layanan di luar negeri. Walaupun saat ini sudah mulai banyak penyedia layanan seperti forum diskusi (kaskus), ecommerce (tokopedia, bukalapak, blibli, dll), akan tetapi sebagian besar pengguna internet indonesia masih menggunakan aplikasi buatan luar dalam mendukung aktivitas sehari hari. Kondisi ini mendorong pentingnya suatu asosiasi yang turut berperan aktif dalam memberikan edukasi baik dari sisi pengembang maupun pengguna sehingga data data yang dihasilkan bisa digunakan untuk mendukung perekonomian dan pembangunan bangsa.

Inisiator dari AIDI terdiri dari para akademisi, pelaku industri, pemerintahan, dan komunitas. Tercatat dari akademisi adalah wakil dari Universitas Telkom, ITB, UNPAD, UNS, UGM, STIS. Dari Industri ada beberapa perusahaan seperti Solusi 247, Mediawave, NoLimit, Bahasa Kita, Zamrud Technology, PasarLaut. Dari pemerintahan diwakili oleh Kemenkominfo dan BPPT. Dari komunitas adalah dua komunitas besar di bidang Data Science + Big Data yaitu Komunitas Data Science Indonesia dan Komunitas IdBigData.

Banyak sekali permasalahan data-related yang membutuhkan aturan dan kebijaksanaan yang terintegrasi, contohnya Open Data dan Smart City. AIDI diharapkan akan berperan aktif dalam pembuatan draft regulasi yang berkaitan dengan data sebagai komoditas strategis. Dorongan perkembangan ICT dan keilmuan Data Mining, Machine Learning, dan Keseluruhan aktivitas Data Analytics membuat data menjadi komoditas yang sangat penting. Produksi data melimpah seiring dengan masifnya pengguna internet Indonesia membuat aktivitas disekitar data harus segera diatur dan dibuatkan roadmapnya.

Saat ini AIDI sedang melakukan konsolidasi organisasi dan menyusun program kerja, diharapkan dalam waktu tidak terlalu lama AIDI akan segera aktif berkontribusi untuk perkembangan Data Science + Big Data di Indonesia. Untuk informasi lebih lanjut dan update terkini bisa akses website AIDI yaitu www.aidi.id

IMG 2017 01 12 00 20 30

Para inisiator AIDI berfoto bersama, setelah penandatanganan deklarasi