Paper Scopus 2016 (4th ICOICT dan 4th Intelysis)

Di tahun 2016 ini (sampai bulan juli), sudah ada 4 paper kami (saya dan team lab. SCBD) yang akan terindeks SCOPUS.  4 paper tersebut terdiri dari 2 paper ditampilkan pada 4th ICOICT dan 2 paper pada 4th Intelysis. Pada konferensi ICOICT kami menampilkan paper dengan tema network text analysis berjudul “Network Text Analysis to Summarize Online Conversations for Marketing Intelligence Efforts in Telecommunication Industry” dan “Word Association Network Approach for Summarizing Twitter conversations about Public Election”. Pada konferensi Intelysis kami menampilkan paper dengan judul “Social Network and Sentiment analysis for Social Customer Relationship Management in Indonesia Banking Sector” dan “Top Brand Alternative Measurement Based on Consumer Network Activity”

Dengan penambahan 4 paper tersebut maka total akan terdapat 12 paper kami yang terindeks SCOPUS. Ini merupakan hasil yang lumayan, melihat tim kami yang kecil dan variasi penelitian yang terbatas, sehingga tidak bisa memproduksi lebih banyak paper lagi. Harapan saya kedepannya, kami makin produktif dalam mepublikasikan hasil penelitan,tentunya dengan kualitas yang makin baik dan variasi topik yang semakin beragam. 

Selain ke 4 paper SCOPUS tersebut, menjelang paruh kedua tahun 2016 ini saya mempunyai target menulis untuk 2 jurnal internasional terindeks SCOPUS. .. wish me luck .. wish us luck ..

 

Paper

Advertisements

Tempat Nongkrong Baru di Lab. Big Data

Mulai semester ini kelompok riset Social Computing and Big Data (SCBD)  mempunyai tempat “nongkrong” baru yaitu laboratorium riset. Ruangan yang dipakai adalah laboratorium Kelompok Keahlian (KK) yang bernama Collaborative Innovation Room (CIR) yang terletak di Gedung D, lantai dasar, Fakultas Ekonomi dan Bisnis. Sehari hari saya akan lebih banyak menghabiskan waktu di lab ini kalo sedang berada di kampus, dibandingkan di ruang dosen. Terlihat sejak dimulainya aktivitas di lab ini, mahasiswa sudah antusias untuk eksplorasi software dan melakukan riset.

Saya mendorong mahasiswa untuk bekerja secara kolaboratif, karena ilmu data analytics adalah ilmu yang besar dan banyak aspek pendukungnya, sehingga materi belajar harus dibagi bagi, selanjutnya pengetahuan hasil belajar dan eksperimen dibagi diantara mereka. Selanjutnya kita akan mengadakan jadwal pertemuan mingguan untuk saling sharing. Sehari hari juga bakal ada beberapa mahasiswa yang bakal rutin jadi “penunggu” lab tersebut. 

Di lab kami ada 5 PC komoditas untuk menjalankan Hadoop Cloudera, terutama modul SOLR untuk search / crawl /index situs internet dan 1 iMac. 

Oh ya beberapa istilah di lab kami yang berbeda dengan istilah lab pada umumnya adalah pada pengertian, scope, pekerjaan riset, yag disesuaikan dengan konteks sosial dan bisnis walaupun namanya sama:

Big Data : Sekumpulan data yang jumlahnya sangat besar, yang ada di sekitar kita (online), dan yang bisa kita manfaatkan untuk pengambilan keputusan

Data Analytics : Aktivitas pengenalan pola dari data dimana kita bisa melakukan deskripsi dan prediksi suatu peristiwa dengan metode pembuatan model, optimasi, simulasi dan lain lain

Social Computing : Aktivitas untuk kuantifikasi / mengukur perilaku manusia dari jejak digital yang ditinggalkannya (pada umumnya jejak online), untuk keperluan deskripsi dan prediksi suatu peristiwa 

IMG 6144

kumpul kumpul pertama semester ini

IMG 5673

layout lab.

IMG 5678

beberapa hasil karya ditempelkan sebagai poster di dinding lab.

Network dan Sentimen #SaveGojek

Kemarin selama beberapa jam layanan ojek online dilarang beroperasi oleh Kemenhub. Tagar #SaveGojek langsung merajai media twitter. Sambil nungguin Sarah ujian balet pagi ini, saya iseng crawl twitter tentang fenomena kemarin. Bagaimana network dan sentimen dari tweet tweet tersebut, bisa dilihat pada gambar dibawah ini. Network diperoleh dari percakapan yang terjadi. Crawling dengan library twitteR di R diperoleh 10 ribu tweet dalam rentang dari pukul 8:30 pagi sampai dengan pukul 14:00 siang tanggal 18 desember 2015. Saya berhentikan crawling data sampai 14:00 karena saat itu pelarangan ojek online di tunda, yang artinya ojek online sudah diperbolehan lagi.

Setelah melakukan penyaringan tweet saya memperoleh sekitar 2000 percakapan. Banyak sekali ditemukan tweet sampah, tampaknya ada orang / kelompok yang berusaha mengaburkan isu #SaveGojek dengan isu isu lain yang tidak berkaitan (sampah). Konstruksi interaksi di twitter membentuk network percakapan dengan visualisasi sebagai pada gambar dibawah ini. Seperti karakteristik cuitan pada twitter, mayoritas diwarna oleh opini pribadi, dan mayoritas akhirnya tidak membentuk percakapan yang memadai. 

Savegojek

Peringkat akun akun populer (me-mention + di-mention) adalah berturut turut @jokowi, @kurawa, @pramonoanung dan seterusnya. lengkapnya ada pada tabel dibawah ini, semakin besar nilai degreenya maka semakin populer akun itu di twitter.

 

Rankingsavegojek

Adapun sentimen dari tagar #SaveGojek dapat dilihat pada wordcloud berikut ini. Terlihat bahwa sentimen yang terjadi mayoritas adalah sentimen negatif terkait pelarangan ojek online, terutama berkaitan dengan kata kata dilarang, dukung, rakyat, inovasi, membantu, Jonan dan lain lain.  

Savegojekwordcloud

Partisipasi dalam Konferensi Big Data 2015

Konferensi Big Data Indonesia (KBI) adalah event besar Big Data di Indonesia. Tahun ini adalah tahun ke dua KBI dilakukan, setelah event pertama tahun lalu di Jogjakarta. Tahun ini KBI akan diadakan di Bandung, dimana komunitas idBigData akan berpartner dengan Telkom University. Tujuan dari KBI adalah untuk mempermudah penyampaian informasi Big Data kepada para peserta dengan mengkombinasikan antara penjelasan, diskusi, showcase (demo) dan studi kasus. Konferensi adalah forum yang akan menggabungkan praktisi, peneliti dan pendidik untuk berdiskus inovasi dani state-of-the-art Big Data khususnya di Indonesia dan untuk kemajuan pembangunan Indonesia.Profil lengkap dan pengenalan mengenai KBI 2015 bisa dilihat di link ini. Visi dan Misi KBI 2015 berkenaan dengan kemandirian / kedaulatan bangsa Indonesia atas datanya sendiri, hal ini tertuang pada executive summary berikut ini 

Event ini adalah event kedua saya ikut berpartisipasi dalam acara idBigData, setelah idBigData MeetUp #4 bulan juni 2015. Pada event KBI 2015 banyak sekali pembicara dan pakar di bidang bidang yang berhubungan dengan Big Data, detailnya bisa dilihat pada halaman ini. Para pembicara diantaranya adalah Walikota Bandung Ridwan Kamil, Dirjen Pos dan Penyelenggaraan Informatika Kominfo Prof. Dr. Kalamullah Ramli, Ketua Dewan TIK Nasional Dr. Ing. Ilham Akbar Habibie, dan masih banyak lagi ahli ahli di bidangnya masing masing. Dari Telkom University saya mewakili bidang yang menjadi spesialiasi saya yaitu Social Network Analysis.  

Ok jangan sampai ketinggalan dan ramaikan event KBI 2015 di Telkom University tanggal 1-2 Desember 2015. Have Fun dengan Big Data

887403 10153407754613073 8598826414545641952 o

Pembicara

Membuat Ringkasan Berita Dari Situs Berita Nasional – Website Crawl

Bagi kebanyakan dari kita membaca berita merupakan aktivitas rutin bahkan mungkin wajib, tetapi sebaliknya banyak yang menganggap membaca berita adalah aktivitas yang istimewa karena mereka susah punya waktu cukup luang untuk membaca berita di koran maupun di situs berita online. Untuk orang yang tidak mempunyai waktu yang cukup, maka membaca ringkasan berita akan sangat membantu. Membuat ringkasan berita merupakan ide yang sudah lama saya pikirkan dan mungkin sudah dilakukan oleh banyak orang. Berbagai macam teknik diperkenalkan yang tujuan akhirnya membuat ringkasan berita pada satu periode tertentu misal berita harian, berita mingguan, berita bulanan dan seterusnya berdasarkan topik topik tertentu.

Salah satu teknik yang paling umum dilakukan adalah melakukan “crawling” situs berita online. Aktivitas “crawling” ini tidak mudah, diperlukan pengetahuan programming dan layout halaman web (HTML, CSS, JS dll). Dengan kebutuhan yang tinggi maka aktivitas ekstraksi situs berita akan menjadi lama dan biaya mahal (biaya programmer, komputer, internet dan lain lain). Representasi bentuk ringkasan berita pun bisa bermacam macam, contohnya bisa saja dilakukan proses kompleks menggunakan text miningnetwork text analysis ataupun yang sederhana seperti word cloud / tag cloud

Untungnya saat ini terdapat cara untuk membuat API online sehingga proses “crawling” ini bisa dilakukan dengan cepat dan mudah. Mahasiswa saya Rio memberitahu saya mengenai aplikasi import.io untuk membuat API crawling website menjadi lebih mudah. Saya mencoba eksperimen dengan situs berita antara , dimana saya ambil berita nasional selama satu bulan terakhir (2 september 2015 – 2 oktober 2015), dan saya peroleh 1495 berita. Atribut informasi yang saya ekstrak adalah judul berita, isi berita, quote berita, waktu berita di post dan identitas wartawan penulis. Kemudian hasilnya saya tampilkan dalam ringkasan sederhana yaitu  word cloud / tag cloud.

Kalo anda ingin membuat ringkasan / ekstraksi informasi dari website, maka bisa melakukannya dengan cara ini, baik website berita, ecommerce, forum online, dan lain lain. Jika ingin bantuan mendetail atau tidak mau repot repot otak atik dan cuma butuh datanya saja bisa kontak Rio.  Cek screenshot dari eksperimen saya dibawah ini. Semoga sharing ini bermanfaat ..

1

 

2

 

proses crawling url website pada situs berita antara

3

 

proses penentuan informasi apa yang akan diambil dari suatu situs, import.io membuatnya sangat mudah

 

4

 

proses konstruksi API import.io

 

5

 

wordcloud dari isi situs berita antara sub berita nasional periode 2 september 2015 – 2 oktober 2015

Dicari : Mahasiswa untuk Skripsi di Bidang Data Science / Data Analytics

Saat ini tantangan untuk grup riset Big Data dan Social Computing semakin besar dan bertambah dengan adanya beberapa tawaran (tepatnya tantangan) untuk meneliti di bidang Data Analytics dari beberapa instansi dan industri. Untuk itu kami membutuhkan beberapa mahasiswa untuk ikut aktif terlibat dalam riset ini dalam bentuk proyek tugas akhir / skripsi / magang. Sebagai gambaran umum pekerjaan Data Analytics yang dilakukan adalah melakukan menentukan ruang lingkup masalah, menentukan ruang observasi (untuk pengambilan data), melakukan pre processing data, melakukan aktivitas data mining seperti klasifikasi, klustering, regresi, asosiasi dan lain lain hingga membentuk model data atau melakukan aktivitas social network analysis atau proses sentiment analysis. 

Profil mahasiswa bisa dari ilmu bisnis / manajemen maupun dari teknik, ataupun kolaborasi kedua bidang ilmu tersebut. Syarat syarat yang kami butuhkan adalah:  (nomer 1 wajib, nomer 2,3,4 boleh salah satu)

  1. punya minat / passion yang besar di bidang data science / data analytics dengan orientasi bisnis
  2. mengerti teori, konsep dan teknik data mining
  3. mengerti teori, konsep dan teknik sentiment analysis
  4. mengerti teori, konsep dan teknik social network analysis

Penguasaan tiga hal penting (teori, konsep dan teknik) biasanya kami lakukan bersama sama dalam bentuk diskusi antar mahasiswa atau antar mahasiswa dengan dosen. Dengan forum diskusi rutin diharapkan penguasaan mahasiswa akan tiga hal penting tersebut bisa tercapai dengan cepat. Jika berminat silahkan kontak saya. 

Data science for datadriven business 1 638

sumber gambar : google

Peta Ekonomi Indonesia menggunakan Data Kota Foursquare

Di era “Data Everywhere” saat ini, kita bisa melakukan hal hal kreatif terkait dengan ketersediaan data untuk menunjang riset atau sekedar memenuhi rasa ingin tahu kita. Sebagai contoh, beberapa dari kita mungkin belum pernah berkunjung ke kota kota besar di dunia, sehingga kita tidak bisa membayangkan bagaimana kondisi keramaian di kota/negara tersebut. Bisa juga untuk seorang pebisnis yang ingin membuka cabang atau melihat pasar di luar negeri, bisa memperkirakan kondisi kota tersebut dengan melihat tingkat keramaian di kota yang dituju. Bagaimana caranya kita mengetahui hal tersebut tanpa perlu melakukan perjalanan ke sana.

Foursquare sebagai layanan jejaring sosial online yang menyediakan fitur fitur untuk check in berbasis metode gamification dengan diberikannya award seperti badge, mayor dan lain lain. Pengguna Foursquare pun merasa nyaman untuk membagikan lokasi mereka ke lingkungan teman temen dekat dan bisa disebarkan melalui  media sosial lainnya seperti Facebook, Twitter, Instagram dan lain lain. Data yang kita produksi pada platform Foursquare sangatlah besar sehingga bisa dimasukkan dalam kategori Big Data.

Dalam entry blog kali ini saya akan memperlihatkan peta beberapa kota di Indonesia menggunakan data check in Foursquare selama 3 bulan terakhir, dimana titik titik putih menunjukan orang orang yang check in di lokasi tersebut, semakin terang titiknya maka semakin banyak orang yang check in disana. Kota yang saya pilih adalah Jakarta (karena kita bisa bandingkan dengan kenyataan kondisi kepadatan Jakarta), Bandung (karena saya tinggal di Bandung, jadi bisa saya bandingkan langsung) dan Malang (karena ini kota asal saya, jadi saya juga bisa bandingkan langsung). 

Hasil pemetaan setelah divalidasi dengan kondisi kenyataan keramaian dan kepadatan tiga kota tersebut, ternyata memang sesuai. Jadi bisa kita simpulan penggunaan data Foursquare bisa menggambarkan kenyataan seperti kepadatan perkotaan, pusat keramaian, sentra ekonomi dan lain lain. Dalam konteks ekonomi, pengetahuan seperti ini sangatlah berharga bagi pemerintah, walaupun saya yakin mereka sudah punya data sendiri tentang hal tersebut, tapi bagi masyarakat awam atau industri swasta insight seperti ini akan sangat bermanfaat.

 

Asia

Peta Asia, bisa dilihat keaktifan Indonesia dalam menggunakan Foursquare dibandingkan dengan negara negara tetangga 

 

 

Jakarta1

Jakarta2

Jakarta3

Jakarta (zoom out gambar atas dan zoom in gambar bawah)

 

 

Bandung0

Bandung1

Bandung2

Bandung (zoom out gambar atas dan zoom in gambar bawah)



Malang1

Malang2

Malang (zoom out gambar atas dan zoom in gambar bawah)

Post lengkap dari cerita ini ada di link berikut ini : Indonesia dalam foursquare : Mengintip Potensi Ekonomi di 3 Kota : http://bms.telkomuniversity.ac.id/indonesia-dalam-foursquare-mengintip-potensi-ekonomi-di-3-kota/

Tentang Grup Riset – Social Computing and Big Data

Dalam sebuah aktivitas riset mempunyai grup riset itu sangat penting, terutama berguna sebagai sparring partner dalam berdiskusi  Di kampus kampus terkenal di dalam dan di luar negeri, grup riset biasanya dibuat dan diketuai oleh seorang profesor / peneliti senior yang didalamnya ada beberapa peneliti yunior / dosen yunior dan tentu saja mahasiswa. Membuat grup riset yang solid itu tidak mudah, dengan alasan yang paling utama adalah anggota tim harus benar benar satu ide, satu visi dan satu misi dengan tujuan dibuatnya grup riset tersebut. Di Indonesia hal ini lebih sulit dilakukan karena rata rata kurang menghargai riset jangka panjang, yang diutamakan adalah proyek proyek jangka pendek dan impact yang instan.

Saya mendirikan grup riset Social Computing dan Big Data (Analytics) ini pada tahun 2012, karena saya menemukan partner yang sejalan dengan ide saya, yaitu Pak Yahya Peranginangin. Kami berdua bertemu pada tahun 2011, pada saat kami bergabung di Institut Manajemen Telkom (sebelum menjadi Universitas Telkom). Grup riset ini dibentuk dengan misi utama adalah riset di bidang kuantifikasi perilaku manusia berdasarkan data data yang melimpah di Internet (Big Data). Karena kami bergabung di kebidangan ekonomi dan bisnis, maka mayoritas riset kami adalah untuk kepentingan ekonomi dan bisnis. Kebetulan di bidang ini, riset yang berdasarkan pendekatan Big Data sangat sedikit dan sangat baru. Akan tetapi kami tidak menutup kemungkinan untuk mencoba aplikasi di bidang lain, karena masih banyak yang bisa kami tawarkan dengan hasil model riset kami. 

Publikasi pertama kami muncul di tahun 2012 dan jurnal internasional pertama kali muncul di tahun 2013. Sepanjang 3 tahun riset grup ini berdiri, formasi kami tidak bertambah tetap dua dosen dengan kadang kadang ditambah satu dua dosen yang lain untuk satu dua penelitian tertentu, tetapi saat ini kami punya sekitar 10an mahasiswa S1 yang mengerjakan topik topik riset riset di bidang Big Data / Social Network seperti : Comparison Legacy and Data Analytics Methodology Approach, Social Network and Game Theory, Smart City based on Social Media, Modelling for SME, Investor Network, Sentiment Analysis, New Metric Constructions, Network Market Predictions, Dynamic Network etc

Misi kami ke depan adalah membuat riset yang lebih kearah keilmuan dasar seperti Data Mining, Data Science, Statistics, Graph Theory, Sentiment Analysis karena selama ini kami kurang menggali ke arah sana dan lebih banyak disibukkan dengan riset riset aplikasi tertentu. 

Oh ya, saat ini untuk menambah network riset kami bekerja sama langsung dengan beberapa industri layanan Big Data / Media Sosial besar di Indonesia seperti mediawave, NoLimit, Solusi247, dan lain lain. Kami mencoba menggali problem problem yang mereka hadapi di lapangan dan kami coba untuk implementasikan knowledge yang kami punyai, di samping itu bekerja dengan industri yang fokus di data akan semakin mempertajam pengalaman dan kematangan grup riset kami.  

Jika anda industri / dosen / mahasiswa tertarik untuk berkolaborasi riset, project, konsultasi bahkan mungkin workshop, kami berdua sangat terbuka, silahkan kontak saya melalui email di andry.alamsyah@gmail.com atau Pak Yahya di jaqpopo@gmail.com 

Beberapa contoh hasil riset dari grup riset kami :

Screen Shot 2015-06-13 at 10.29.32 AM (2).png

Screen Shot 2015-06-13 at 10.29.36 AM (2).png

Screen Shot 2015-06-13 at 10.29.41 AM (2).png

Screen Shot 2015-06-13 at 10.29.45 AM (2).png

 

 

 

Daftar Buku untuk Social Computing, Content Mining, dan Data Science for Business

Dalam entri blog ini saya ingin share daftar buku buku penting untuk belajar social computing, content mining, data science atau fundamental big data. Beberapa hal dasar yang perlu dikuasai adalah Data Mining, Social Network Analysis, Opinion Mining / Sentiment Analysis, Matematika dan Statistika

Screen Shot 2015-02-23 at 12.58.14 AM

Mining User Generated Content : Berisi Mining Web with different media, different types of UGC, termasuk sentiment analysis, social annotation, dan banyak contoh / applikasi / studi kasus. Pendekatan buku ini dari level aplikasi nyata dan praktis.

Screen Shot 2015-02-23 at 12.59.07 AM

Web Data Mining : Berisi pengertian dasar web / data mining, teknik asosiasi dan sequential patterns, supervised / unsupervised / partially supervised learning, Information Retrieval, SNA, Web Crawling, Sentiment Analysis. Buku ini mencoba mencakup semua topik dalam bahasan web mining dengan konsekuen pembahasan bersifat global dan tidak mendetail. Buku ini bagus bagi yang ingin belajar pengetahuan umum tentang Web Mining

Screen Shot 2015-02-23 at 1.00.30 AM

Analyzing the Social Web : Buku ini melakukan pendekatan social computing dengan melihat web sebagai tempat aktivitas sosial, sehingga kita bisa melakukan kuantifikasi perilaku sosial dari aktivitas di web tersebut. Dalam buku ini dibahas Dasar dasar SNA, struktur jaringan, visualisasi jaringan, scaling issue, tie strength, trust dan beberapa studi kasus dari dasar dasar teori tersebut. Buku ini menitik beratkan permasalahan social computing dari sisi jaringan (social network).

Screen Shot 2015-02-23 at 1.02.46 AM

Data Science for Business : Berisi dasar dan filosofi Data Analytic Thinking, Business Problem and Data Science Solution, Implementasi Data Mining untuk aktivitas Data Science, contoh kasus. Buku menawarkan pendekatan filosofis dan advanced analytics terhadap masalah masalah nyata dunia bisnis yang bisa diselesaikan oleh social computing. Semua teknik ditawarkan tidak diutamakan dengan pendekatan matematis tapi lebih ke pendekatan logis analytics.

Screen Shot 2015-02-23 at 1.01.53 AM

Doing Data Science for Business : Menjelaskan teknik dan metodologi yang harus dilakukan oleh seorang data scientist untuk menyelesaikan persoalan bisnis. Teknik teknik berdasarkan data mining dan SNA. Buku ini banyak menyediakan contoh dan studi kasus

Screen Shot 2015-02-23 at 1.03.53 AM

Social Network Data Analytics : Berisi kumpulan topik topik atau penelitian terkini untuk Analytics SNA data. Boleh dikatakan buku ini adalah Advanced Topics of SNA. Buku ini mencoba menjawab implementasi SNA dalam aplikasi nyata, bagaimana kemampuan SNA dan gap apa yang ditemukan pada aplikasi nyata.