Mampir ke Gudangnya Data (Badan Pusat Statistik)

Sebagai orang data, maka salah satu cita cita utama adalah maen dan berdiskusi dengan lembaga pusat data, nah kalo di indonesia, lembaga resmi pemerintah itu namanya Badan Pusat Statistik (BPS). Seminggu sebelum pandemic covid19, yaitu tanggal 10 Maret 2020, saya diundang mas Tio (Setia Pramana, PhD) untuk sharing “Social Media Analytics” ke BPS.

Seharian saya berbagi mengenai fenomena, teori, dan praktek mencari pola pada data data yang berasal dari media sosial. BPS sangat memperhatikan implementasi Big Data dalam metodologi mereka, makanya mas Tio diangkat untuk meleverage keilmuan tersebut, dengan salah satu caranya mengundang beberapa narasumber untuk sharing, salah satunya saya. Pengalaman dan diskusi yang menyenangkan, thanks mas Tio.

89139982 10157811393410202 6172514156411879424 o

89656799 10157811393655202 5449853344417841152 o

89358227 10157811393840202 206713657810223104 o

89354542 10157811393550202 8832448202381721600 o

89273276 10157811394105202 1901241842796593152 o

89731603 10157811394265202 4041091942342197248 o

Advertisement

Pelatihan Social Media Analytics

Saat ini banyak organisasi termasuk bisnis dan pemerintahan yang penasaran dengan proses analitik pada data di media sosial. Pada umumnya mereka sudah mengerti manfaat pengumpulan data pada media sosial yang umumnya berupa data tidak terstruktur atau istilah awamnya Big Data. Mencari pola pengetahuan pada data tidak terstruktur merupakan hal yang cukup kompleks dilakukan. Seringnya eksperimen dan penelitian pada domain permasalahan yang berbeda beda membuat lab. Social Computing dan Big Data mempunyai pengalaman yang mumpuni. Oleh karenanya pelatihan bagaimana menggunakan metode metode untuk memproses data data tidak terstruktur tersebut sangat diperlukan, sehingga muncullah pelatihan “Social Media Analytics” ini.

Pelatihan tanggal 19-20 september ini khusus dilakukan untuk karyawan direktorat jendral pajak pusat, khususnya pada bagian operasional IT. Dengan mengenal Social Media Analytics diharapkan mereka bisa implementasi ekstrasi pengetahuan di media sosial untuk operasional kerja sehari hari. Materi yang dibawakan adalah: 1. Social Media Analytics Workflow. 2. Modelling and Machine Learning. 3. Data Collection. 4. Network Data. 5. Social Network Analysis. 6. Text Network Analysis. 7. Sentiment Analysis. 8. Topic Modelling.

Berikut foto foto acara tersebut: 

IMG 20180919 094607

42247774 10156402308065202 3069643350136061952 n

IMG 20180919 085035

IMG 20180919 082808

IMG 20180919 131107

 

 

 

 

 

 

 

 

 

 

 

Supaya Tetap Waras di Media Sosial

filosofi yin-yang (cina), the unity of opposite (yunani), atau sejenisnya mengajarkan pada kita bagaimana bersikap dalam kehidupan kita sehari hari. harus dipahami bahwa dua kubu yang berlawanan sebenarnya saling melengkapi, saling terhubung, dan tidak terpisahkan.

capek dan bosan kalo kita baca riuhnya medsos saat ini, kebanyakan adalah dua kubu yang polarisasi opininya berbeda saling gontok gontokan. ga sebelah sana dan sebelah sini sama aja kelakuannya, akibatnya orang awam yang setuju pada salah satu opini jadi kebawa juga ikutan bully bully kelompok seberang. social media is contagious.

saya sering kasih nasihat ke mahasiswa, hidup itu janganlah ekstrim kanan atau kiri, coba hidup ditengah, pahami setiap sisi kehidupan, niscaya hidup jadi penuh toleransi dan ketenangan. memang ga semua bisa terima opini saya tersebut. tapi yang penting saya sudah share obat saya supaya tetap waras,

bagaimana dengan anda ?? ..

sumber gambar : http://insights.berggruen.org/issues/issue-6/institute_posts/147

BARISAN CINTA INDONESIA

Untuk urusan debat politik, Facebook ga kalah ramenya dibandingkan dengan Twitter. Grup FB Barisan Cinta Indonesia adalah satu satunya grup politik yang saya ikuti, karena isinya masih dalam tahap waras menurut saya. Pada grup ini terjadi debat / perang posting antara pro dan kontra pemerintahan Jokowi. Data diambil periode Juni – September 2017, total terkumpul sebanyak 2201 group status (group_post) yang terdiri dari postingan status, link, photo, video dan note. Terdapat total 45814 likes, 51234 reactions, 2576 shares dan 33773 komentar. Jumlah relasi / debat / percakapan / hujatan antar user-user dan user-group_post sebesar 64848 relasi. Total anggota grup ini adalah 66188 anggota

Postingan yang paling sering ditanggapi adalah group_post dibandingan komentar user, dimana dari 4 peringkat postingan (group_post) yang paling membangkitkan percakapan / debat / hujatan adalah: 2 post mendukung jokowi dan 2 post anti jokowi. Keempat posting tersebut berupa status dengan photo atau status dengan link. Secara keseluruhan grup ini cukup mendukung pemerintahan Jokowi, walaupun akhir akhir ini banyak sekali postingan yang bersifat troll (mencerca, provokatif, membuat hawa panas).

Dari pengamatan sekilas, untuk urusan debat politik akhir akhir ini jagat Twitter lebih liar dari Facebook, akan tetapi urusan pembangkitan percakapan / diskusi Facebook lebih menarik.

 

Untitled

interaksi user-user dan user- group_post, dimana user mencakup 83.17% keseluruhan posting. group_post digambarkan dengan warna berbeda tergantung jenis group_post tersebut

Untitled3

pembentukan kelompok berdasarkan interaksi. kelompok adalah kelompok warna ungu dengan proporsi 33.39%, dan group_post paling banyak di komentarin ada pada kelompok warna kuning yang berada pada peringkat ke 4 dengan ukuran proprosi 14.84%

Untitled4

kelompok yang berisi group_post yang paling banyak di komentari (kelompok warna kuning)

Untitled10

group_post yang paling banyak membangkitkan percakapan / diskusi

Screen Shot 2017 09 05 at 3 46 34 PM

Data node jaringan percakapan fb

Screen Shot 2017 09 05 at 3 52 21 PM  2

Postingan komentar user yang paling banyak di like (13 likes)

Technopreneur Workshop Speaker

Berawal dari kebiasaan ngomong mengenai New Digital Economy dan Disruptive Innovation, akhirnya pada suatu kesempatan saya ditodong untuk memberikan materi tentang Technopreneurship. Saya yang latar belakangnya bukan dari bidang Entrepreneurship sempat khawatir juga, jangan jangan saya cuman sok tahu tentang bidang ini. Akhirnya setelah menyelidiki kesana kemari, ternyata Technopreneur ini lebih kental ke nuansa inovasi penggunaan teknologi, startup, solusi inovatif, dan hal hal yang lebih erat ke bidang ICT (atau TIK) (high technology). Technopreneur adalah Entrepreneur (wirausaha) yang melibatkan penggunaan high technology (termasuk ICT). Technopreneur erat hubungannya dengan StartUp dan metode metode kebaruan saat ini seperi crowdsource / crowdfunding, dll

Acara dilangsungkan di plaza clicksquare, dengan peserta sekitar 300 orang, lumayan banyak dan ternyata bidang ini sangat menarik minat audiens yah. Peserta didominasi oleh anak anak SMA yang sedang mengikuti seleksi paskibraka tingkat kota Bandung. Berbicara dengan audiens anak SMA ini sangat menyenangkan, mereka mempunyai rasa ingin tahu yang besar.  Apalagi saya berharap mereka inilah yang nanti akan menjadi tulang punggung ekonomi digital masa depan Indonesia, sehingga saya berusaha menyampaikan dengan bahasa yang sederhana tapi mudah dipahami, terutama berkenaan dengan praktik ekonomi global yang sangat dipengaruhi oleh teknologi TIK. 

Diskusi meliputi fenomena TIK, tantangan / kompetisi pekerjaan, perlunya bangsa kita akan ide ide inovasi / kreatif dengan bantuan teknologi TIK, serta bekal apa saja yang mereka butuhkan untuk bisa survive di masa depan. Banyak juga yang belum terbayang implementasi praktisnya. Saya coba putarkan video youtube tentang Future Vision, setidaknya memberikan gambaran kondisi near future dan itu adalah masa dimana mereka akan berkarya. 93 dari 255 juta penduduk Indonesia terhubung internet, setidaknya dari 93 juta tersebut bisa lahir technopreneur technopreneur handal Indonesia. Semoga .. Amin 

IMG 3299

7th Techno screen

IMG 3309

Fenomena #SayaBertanya

Hashtag #SayaBertanya muncul pertama kali pada 6 Februari 2017 setelah mantan presiden SBY memposting tweet yang ditujukan kepada Presiden dan Kapolri. Saya tidak menyoal tweet pak SBY tersebut, tapi saya lebih tertarik viralitas hashtag ini yang ternyata sangat populer. Viralitas tersebut disebabkan kreativitas warga twitter sendiri yang membuat guyonan menggunakan hashtag tersebut, terlepas itu sindiran atau hanya sekedar guyonan. Meme dan variasi kata pendek ini diaplikasikan ke dalam permasalahan pacaran, gebetan, harga bahan pokok, kemacetan, dan hal hal keseharian masing masing orang. Viralitas ini juga menyebar sampai ke facebook, instagram, dan path.

Sayangnya saya baru sempat ambil data sejak tanggal 7 Februari, jadi lumayan telat sehari dari puncak masa populer hashtag tersebut. Akan tetapi walaupun telat, dimana saya mengambil tweets antara tanggal 7-9 februari (selama kurang lebih 50 jam). Saya mendapatkan 25 ribu tweet yang memuat hashtag #SayaBertanya. Menurut saya termasuk lumayanlah, sebenarnya proses crawling sampai saat ini masih tetap berjalan, tapi saya sudah ga sabar untuk segera analisa dan nunggu hasilnya :P. Dari 25 ribu tweet tersebut, saya memperoleh 8613 aktor dan 15898 relasi, cukup lumayan ramai / padat percakapan yang terjadi disana baik dalam bentuk retweet maupun reply / mention.  

Viralitas hashtag ini menunjukan bagaimana dinamisnya bangsa kita di media sosial. Bagaimana kreativitas merubah hal hal yang biasa menjadi suatu hiburan dan menjadi topik pembicaraan serius maupun santai. Fenomena yang asyik untuk diteliti dan dijadikan percobaan perilaku manusia di internet.

Berikut ini pola interaksi hashtag #SayaBertanya

Sayabertanya1

Sayabertanya2

Berikut ini ini adalah aktor aktor dominan dalam percakapan tersebut. @SBYudhoyono paling banyak dimention, diteruskan oleh @jokowi dan @basuki_btp. 3 kelompok terbesar adalah kelompok (modularity class) no 11, 544, dan 540. @jokowi @basuki_btp tidak termasuk ke dalam kelompok dominan. 

Screen Shot 2017 02 09 at 9 14 00 PM  2

Berikut ini contoh contoh tweet tweet dari hashtag ini yang lucu lucu (menurut saya lho)

Screen Shot 2017 02 09 at 8 43 47 PM

Screen Shot 2017 02 09 at 8 43 52 PMScreen Shot 2017 02 09 at 8 44 10 PM

Contoh contoh lain bisa dilihat di artikel (di detik) berikut ini : 

https://inet.detik.com/cyberlife/d-3415131/netizen-heboh-sayabertanya-kepada-presiden

Terpaksa Ngoding, Tapi Seneng …

Beberapa saat yang lalu saya diajak riset bersama oleh peneliti dari Inggris. Topik riset sendiri meneliti bisnis otomotif dengan mengambil data dari media sosial. Karena kesibukan saya yang “super” saat itu, maka saya serahkan proses data collection dan pre-processing ke asisten (mahasiswa). ekspektasi saya proses ini akan berjalan dalam waktu seminggu. Seminggu, dua minggu saya tunggu ternyata belum beres juga. Saya selidiki ternyata ada permasalahan dalam langkah pre-process data yang  saya baru tahu masih menggunakan beberapa langkah manual  … :(. Makanya asisten saya seperti kewalahan mengurusi data ratusan ribu tweet, kalau dibiarkan bisa bisa dia stress, plus saya sendiri udah tidak sabar nungguin hasil crawl dan analisa

Jadinya saya otak atik python supaya proses transformasi data mentah dari twitter ke format social network menjadi lebih cepat dan otomatis. Setelah setengah hari ngoding akhirnya problem pre-process yang berlangsung lama bisa diselesaikan dengan koding saya tersebut. Senengnya dari data twitter sebesar 500mb (200 ribu tweets) bisa saya konvert dalam kurun waktu kurang dari 10 menit. Wah tahu gini proses yang seminggu kemarin bisa diselesaikan dalam 10 menit. Memang kalo ga kepentok problem, sepertinya saya juga ga akan turun tangan ngoding sendiri …:D

Seneng juga kalo koding yang kita bikin bener bener menyelesaikan masalah .. nah akhirnya karena lagi seneng, maka saya teruskan menggambar visualisasi jejaring sosial 3 merk mobil dari data 200 ribu tweet yang saya sebutkan diatas … 

Merk A

merk A

Merk B

merk B

Merk C

merk C

Rekayasa Komunikasi / Communication Engineering

Tadi malam sambil ngopi ngopi dan makan gorengan, saya ngobrol ngobrol asyik (unofficial) dengan beberapa rekan social media officer (SMO). SMO ini sebenernya kerjanya rangkap rangkap menjadi Humas, Customer Relationship Management (CRM), Branding, Analisa Kompetitor, membangun massa dan lain lain melalui corong media sosial organisasi / perusahaan. Berat bukan pekerjaan mereka ? .. sepertinya mudah tapi tanggung jawabnya sangat besar dan belum ada alat ukur yang pasti bagaimana mengukur keberhasilan pekerjaan mereka, akibatnya banyak SMO yang disalahkan karena dianggap tidak optimal mendukung aktivitas organisasi dalam berhubungan dengan pihak luar. Beberapa rekan SMO mengungkapkan strategi mereka untuk mengatasi hal tersebut, seperti menghitung like, retweet, engagement, dll .. tapi rasanya belum ada pemahaman mendasar bagaimana menjelaskan pengukuran pengukuran yang dilakukan, sampai saya ingat ide saya 5 tahun lalu (mengenai rekayasa komunikasi) saat saya pertama kali belajar mengenai social network analysis (SNA).

Ide yang saya lontarkan saya sebut sebagai Rekayasa Komunikasi ( Communication Engineering), yang tujuannya adalah bagaimana kita bisa merekayasa jejaring sosial sehingga bentuk, ukuran, dan engagementnya sesuai yang kita inginkan. Teringat hal tersebut, saya langsung presentasikan di depan para SMO mengenai beberapa faktor dan framework untuk merekayasa komunikasi online ini. Dengan paham rekayasa komunikasi kita bisa menangkis hoax, mengukur viralitas (diseminasi informasi), mengukur brand awareness, meningkatkan jumlah engagement, meningkatkan audience secara terukur dengan menyediakan langkah langkah strategis sesuai feedback dari bentuk jaringan, dll.

Contoh ilustrasi jejaring sosial bisa dilihat pada gambar 1, berikut ini. Misal terdapat 34 orang / aktor di dalam jejaring sosial yang membicarakan tentang suatu brand / organisasi. Maka bentuk jaringan 34 orang yang semuanya saling terhubung tentu akan berbeda dengan bentuk jaringan 34 orang yang masing masing punya satu hubungan. Disini jejaring sosial memainkan peran penting dalam mengukur kompleksitas hubungan yang ada (diukur dari berapa banyaknya hubungan atau densitas jejaring sosial). Kita bisa monitor bentuk jaringan sosial percakapan per hari untuk melihat apakah usaha usaha yang dilakukan SMO mendapatkan respon positif (jaringan membesar) atau bahkan respon kurang (jaringan menciut). Kita juga bisa identifikasikan orang orang yang berpengaruh di dalam jaringan (aktor nomer 1, 33, 34) baik pengaruhnya baik ataupun buruk. Kelompok yang terbentuk di dalam jejaring sosial dan lain lain

 

NewImage

  gambar 1. jejaring sosial 34 orang 

Framework yang saya usulkan supaya kerja SMO menjadi terukur menggunakan rekayasa komunikasi adalah pada gambar 2 sebagai berikut. Disini dapat dilihat bahwa sumbu X dan sumbu Y menunjukan bahwa network (ukuran, densitas, bentuk jaringan) menjadi tolak ukur apakah 5 faktor (content, context, buzzer, threat, interactivity) membawa perubahan signifikan ke network. Saya uraikan satu satu faktor tersebut.

Framework SMO

gambar 2. framework rekayasa komunikasi 

1. Content

Konten adalah hal pertama yang bisa meningkatkan engagement atau memperbesar ukuran jaringan (Viral). Kita bisa melakukan day-to-day monitoring terhadap ukuran jaringan. Apakah konten yang kita tampilkan memperbesar jaringan secara signifikan, mengecilkan jaringan atau tetap saya tidak ada perubahan. Dengan target engagement audience yang besar (menjadi massa) maka kita harus memperbanyak konten / akun yang menampilkan cerita yang berhubungan dengan brand dari berbagai sisi, kemudian kita lihat konten mana yang berhasil menjadi viral dan konten mana yang tidak, serta mendefinisikan karakteristik audience kita

2. Context

Dengan konteks yang sesuai maka ukuran ukuran jaringan juga bisa membesar secara cepat, contoh adalah menyesuaikan dengan trending topics, seperti Om Telolet Om , Persib Juara dan lain lain. Sama seperi konten diatas kita evaluasi konteks yang kita tampilkan apakah sukses menjadi viral, jika tidak, langkah apa yang diperlukan supaya menjadi viral

3. Buzzer

Buzzer sebetulnya bukan suatu keharusan, akan tetapi jika kita ingin membentuk massa dengan cepat (tidak melihat kualitas) maka menyewa buzzer merupakan langkah yang praktis. Perlu diingat bahwa kehadiran buzzer perlu dievaluasi dengan ukuran berapa besar jaringan yang buzzer berhasil bentuk yang akhirnya terintegrasi dengan jaringan brand kita. Dan apakah jaringan ini bersifat permanen atau temporary. Evaluasi jaringan membantu SMO dalam melihat efektivitas seorang Buzzer

4. Threat

Identifikasi ancaman merupakan salah satu faktor yang penting agar supaya jaringan yang ktia bentuk dengan susah payah tidak menjadi bubar dan hancur. Identifikasi ancaman dilanjutkan dengan langkah meminimalisir ancaman. Kita bisa melakukan proses analisa sentimen terhadap jaringan brand kita. Jaringan yang terbentuk bisa dibagi menjadi kelompok jaringan positif dan kelompok jaringan negatif. Identifikasi tokoh pada jaringan negatif dan langkah langkah untuk meminimalisir supaya tidak viral perlu dilakukan bergantung kepada kondisi isu yang digulirkan. Identifikasi hoax juga bisa dimulai dari aktvitas pada faktor ini.

5. Interactivity

Dalam rangka pencarian informasi yang efektif dan efisien, banyak pengguna intereat beralih menggunakan media sosial sebagai jalur komunikasi utama ke perusahaan. CRM melalui media sosial sudah banyak diadopsi oleh perusahaan perusahaan besar. Akan tetapi masih banyak juga perusahaan yang belum melakukan hal ini. Dengan menyediakan jalur komunikasi antar pelanggan-perusahaan melalui media sosial, maka viralitas dan ukuran jaringan akan meningkat, apalagi aktivitas CRM biasanya bisa kita lihat juga sebagai Frequently Asked Question (FAQ), sebuah dokumentasi penting yang wajib dipunyai oleh sebuah brand. Interactivity yang tinggi sangat disukai audience dan secara positif memperbesar ukuran jaringan.

Ke lima faktor diatas adalah faktor faktor yang bisa kita rekayasa untuk meningkatkan viralitas, brand awareness, menambah jumlah user, dan meminimalisir ancaman. Saya pernah berkata bahwa di era ICT saat ini. Komunikasi bukan hanya masalah kualitas konten tapi juga pengukuran penyebarannya, makanya sebetulnya orang orang yang melakukan aktivitas rekayasa ini lebih kita sebut sebagai engineer (insinyur) daripada seorang ahli sosial. Entah yang lains etuju apa tidak … Semoga bermanfaat …

Network dan Sentimen #SaveGojek

Kemarin selama beberapa jam layanan ojek online dilarang beroperasi oleh Kemenhub. Tagar #SaveGojek langsung merajai media twitter. Sambil nungguin Sarah ujian balet pagi ini, saya iseng crawl twitter tentang fenomena kemarin. Bagaimana network dan sentimen dari tweet tweet tersebut, bisa dilihat pada gambar dibawah ini. Network diperoleh dari percakapan yang terjadi. Crawling dengan library twitteR di R diperoleh 10 ribu tweet dalam rentang dari pukul 8:30 pagi sampai dengan pukul 14:00 siang tanggal 18 desember 2015. Saya berhentikan crawling data sampai 14:00 karena saat itu pelarangan ojek online di tunda, yang artinya ojek online sudah diperbolehan lagi.

Setelah melakukan penyaringan tweet saya memperoleh sekitar 2000 percakapan. Banyak sekali ditemukan tweet sampah, tampaknya ada orang / kelompok yang berusaha mengaburkan isu #SaveGojek dengan isu isu lain yang tidak berkaitan (sampah). Konstruksi interaksi di twitter membentuk network percakapan dengan visualisasi sebagai pada gambar dibawah ini. Seperti karakteristik cuitan pada twitter, mayoritas diwarna oleh opini pribadi, dan mayoritas akhirnya tidak membentuk percakapan yang memadai. 

Savegojek

Peringkat akun akun populer (me-mention + di-mention) adalah berturut turut @jokowi, @kurawa, @pramonoanung dan seterusnya. lengkapnya ada pada tabel dibawah ini, semakin besar nilai degreenya maka semakin populer akun itu di twitter.

 

Rankingsavegojek

Adapun sentimen dari tagar #SaveGojek dapat dilihat pada wordcloud berikut ini. Terlihat bahwa sentimen yang terjadi mayoritas adalah sentimen negatif terkait pelarangan ojek online, terutama berkaitan dengan kata kata dilarang, dukung, rakyat, inovasi, membantu, Jonan dan lain lain.  

Savegojekwordcloud

Quora : Media Sosial Q&A

Pada saat browsing di blog mengenai topik data science, salah satu peneliti menjelaskan secara detail mengenai data science dalam format tanya jawab (FAQ / Q&A) di situs Quora. Menjelaskan suatu keilmuan, masalah, fenomena, cerita, dokumentasi dan lain lainnya ternyata lebih enak dalam bentuk tanya jawab, karena sifatnya natural individu memulai suatu keingintahuan mengenai suatu bidang dengan pertanyaan atau sering kita kenal sebagai Frequently Asked Questions (FAQ). Dengan banyak pertanyaan yang diajukan dan dijawab oleh member member lain (crowdsource) maka sebagian besar pertanyaan yang diajukan bisa dijawab, tentu saja jawaban tidak tunggal tergantung konteks dan pengalaman member, kita bisa memilih jawaban yang paling kita suka dengan mekanisme voting.

Dari sini saya mulai browse situs Quora tersebut, dan ternyata saya menemukan banyak hal menarik, terutama yang berkaitan dengan hobi dan passion saya di bidang social network, data science, movie, music, bisnis, teknologi, filsafat dan lain lainnya. Dengan semakin ramai member yang terlibat maka semakin kaya juga informasi yang tersedia. Setahu saya beberapa situs akademik sudah implementasi mekanisme Q&A seperi Quora contohnya adalah Researchgate, akan tetapi keragaman topik di Quora dan tidak hanya topik akademik menjadi daya tarik sendiri. Mungkin inii waktunya bagi kita untuk membaca informasi tidak dalam bentuk konvensional seperti narasi tetapi dalam bentuk Q&A.

Terus terang saya sudah cukup lama melihat sepintas Quora, akan tetapi tidak pernah benar benar menghabiskan waktu untuk eksplorasi. Ternyata Quora ini sudah berdiri sejak 2011, tapi baru akhir akhir ini perkembangan penggunanya melesat cepat. Sejarah Quora, modal investasi dan operasinya bisa dilihat di halaman wikipedia Quora ini. Mungkin saat ini adalah waktu yang tepat untuk melihat lihat Quora karena konten Q&A sudah cukup banyak dan bervariasi, dibandingkan pada saat saya mampir di tahun tahun sebelumnya.

Oh ya apps Quora tersedia di Android dan IOS, mangga silahkan dieksplore ..

 

Unnamed

tampilan Quora di Android