Archive

Archive for the ‘Visualisasi Data’ Category

Analisa Network Graph Kecenderungan Belanja Masyarakat dengan Aplikasi Gephi dan Sci2

October 16, 2014 Leave a comment

Network graph merupakan salah satu jenis grafik untuk memvisualisasikan hubungan antar node. Pada grafik ini node mewakili satu satuan yang memiliki hubungan dengan node lainnya. Relasi ini sangat cocok untuk menggambarkan hubungan sosial seperti status pertemanan di media sosial. Pada kesempatan ini kita akan mencoba menggambarkan hubungan tersebut dalam konteks kecenderungan belanja bulanan masyarakat, di mana node akan mewakili jenis komoditi barang belanja, dan hubungan antar komoditi terjadi bila komoditi-komoditi tersebut dibeli pada saat yang sama (satu transaksi yang sama). Network graph ini dibuat dengan menggunakan tools Gephi untuk menampilkan visualisasinya dan tools Sci2 untuk mentransformasi network grafik 2 mode mejadi network grafik 1 mode.

Network graph ini merupakan grafik yang menggambarkan item-item tertentu dalam bentuk nodes serta derajat hubungan (edge) masing-masing nodes tadi untuk menggambarkan kedekatannya. Semakin dekat item tertentu dengan item lainnya maka garis hubungannya akan digambarkan semakin tebal. Dari grafik ini diharapkan kita dapat memperoleh informasi secara cepat dan mudah mengenai hubungan antar barang yang dibelanjakan konsumen, serta kecenderungan belanjanya. Dengan informasi ini penanggung jawab supermarket dapat membuat perencanaan untuk mengatur tata letak barang-barang komoditas belanja yang dimiliki sesuai dengan kecenderungan belanja konsumen. Diharapkan barang-barang yang sering dibeli konsumen tidak terlalu jauh dari pintu masuk atau kasir, dan beberapa barang yang biasanya dibeli bersamaan diatur agar letaknya berdekatan. Hal ini bisa mempercepat waktu belanja konsumen dan menjadikan proses berbelanja di toko menjadi lebih nyaman.

Tidak akan dilakukan analisis statistik yang mendalam dari penelitian ini dikarenakan metode pengumpulan datanya yang sangat terbatas. Penelitian akan lebih fokus pada proses pembuatan visualisasi data dengan network graph menggunakan tools Gephi dan Sci2. Berdasarkan output dari visualisasi data ini nantinya akan dilakukan analisis sederhana untuk memperlihatkan hubungan antar komoditi pada setiap transaksi tunggal. Analisis yang dilakukan hanya untuk memperlihatkan kecenderungan belanja barang yang biasanya dibeli pada saat bersamaan atau komoditas mana yang paling sering dibeli konsumen.

Sumber Data

Untuk menghasilkan visualisasi data dengan network graph seperti yang diharapkan, kita memerlukan data penjualan per transaksi. Data dalam satu transaksi ini akan diperlakukan sebagai satu unit observasi. Kita bisa mendapatkan data ini melalui log pada sistem penjualan. Namun dikarenakan keterbatasan penelitian, maka sumber data yang digunakan adalah struk belanja dari konsumen yang baru selesai berbelanja pada minimarket.

Dari hasil pengumpulan data, didapatkan sebanyak73 jenis barang dari sejumlah sampel yang diteliti. Jumlah jenis barangnya memang belum mencakup keseluruhankomoditas yang dijual di mini market, melainkan hanya berdasarkan komoditas yang muncul dalam transaksi terpilih saja.

Proses

Data mentah yang diperoleh sebagian besar dalam bentuk image, dan sebagian kecil lainnya dalam bentuk fisik struk belanja. Mula-mula data komoditas barang belanja dari setiap transaksi dikelompokkan sehingga didapat 73 jenis komoditi. Data setiap komoditi dan identitas transaksi  dientri untuk menggambarkan node dalam format *.csv. Kemudian setiap transaksi dientri dalam format *.csv untuk menggambarkan edge dengan memisahkan node-node tersebut menjadi dua kelompok yaitu node transaksi dan node komoditi.

Setelah didapatkan file node dan edge, maka kita siap untuk mengimport kedua file ini ke dalam program Gephi. Setelah itu kita akan mendapatkan hubungan setiap node transaksi dengan node komoditas. Namun dari gambaran ini kita hanya melihat hubungan antara transaksi dan komoditas, padahal kita menginginkan gambaran mengenai hubungan antar komoditas. Untuk itu kita harus mentransformasi visualisasi 2 mode ini menjadi visualisasi 1 mode dengan menghilangkan node transaksi. Output dari Gephi kita simpan dalam format *.net lalu load ke dalam program Sci2. Lalu lakukan perintah “extract document co-citation network” untuk menghilangkan node transaksi. Kemudian lakukan perintah “delete isolates” untuk menghilangkan node transaksi yang telah terhapus agar setiap node komodisi bisa langsung terhubung satu sama lain. Hasil proses Sci2 ini kemudian disimpan dalam bentuk *.gdf yang kemudian akan kita import lagi ke program Gephi.

Dari sini kita bisa menjalankan perintah untuk modifikasi tampilan visualisasi sesuai yang dibutuhkan, misalnya dengan melakukan filtering untuk barang-barang yang selalu muncul bersamaan minimal dalam 3 kali transaksi yang berbeda. Kita juga bisa mengatur letak node-node komoditinya agar lebih mudah dilihat dengan algoritma tertentu misalnya “yifanhu’s multilevel” untuk mengatur komoditi yang sering dibeli digambarkan pada posisi tengan dan komoditi yang jarang dibeli digambarkan pada lingkar yang lebih jauh.

Hasil Visualisasi

Dari hasil processing ini kita bisa mendapatkan tampilan grafik sebagai berikut:

fig 1

Fig 1. Hubungan Setiap Node Komoditas Barang Belanja berdasarkan Tingkat Pembelian

fig 2

Fig 2. Zoom pada Salah Satu Kedakatan antar Komoditas Minuman

fig 3

Fig 3. Zoom pada Salah Satu Kedakatan antar Komoditas Mie Instan

Penjelasan

Grafik di atas memberikan gambaran mengenai hubungan atar komoditas dalam setiap satu kali transaksi di minimarket. Pada Fig 1 kita dapat melihat gambaran secara umum mengenai tingkat pembelian setiap komoditi. Komoditi yang paling sering dibeli konsumen digambarkan pada posisi tengan grafik, sedangkan barang yang paling jarang dibeli konsumen digambarkan pada posisi paling jauh dari tengah. Barang-barag yang termasuk laris ini antara lain yaitu mie instan, minyak goreng minuman, gula pasir, biskuit, baby diaper, gula pasir, air putih, dan pasta gigi. Setiap komoditas pada gambar ini di hubungkan satu sama lain melalui garis-garis yang menandakan bahwa barang-barang tersebut dibeli pada satu transaksi yang sama. Namun pada gambar ini belum memperlihatkan seberapa sering barang-barang tersebut dibeli secara bersamaan.

Pada Fig 2 kita sudah bisa melihat seberapa dekat komoditas satu dengan yang lainnya dalam hal seberapa sering mereka dibeli dalam satu transaksi yang sama. Dalam gambar ini terlihat grafik di-zoom pada komoditas minuman dan dilakukan filtering untuk kemunculan beberapa barang yang sama pada minimal 3 transaksi. Dari situ bisa kita lihat bahwa komoditas minuman ini berhubungan dekat dengan coklat dan gula pasir. Dari data tersebut dapat kita artikan secara sekilas bahwa konsumen yang membeli minuman biasanya akan membeli coklat atau gula pasir. Sehingga kita bisa menawarkan strategi untuk mendekatkan letak barang ini pada rak penjualan untuk memudahkan konsumen berbelanja. Bila dilihat pada zoom komoditas lain, kita bisa juga melihat hubungan antara komoditas kosmetik dan pembalut yang dibeli pada satu transaksi yang sama. Atau juga pada komoditi lain seperti pada Fig 3 yang menggambarkan kodekatan komoditas mie instant yang sering dibeli bersamaan dengan snack, coklat, atau susu.

Beberapa penjelasan di atas  bisa ditambah dengan analisis hasil zoom yang bisa dilakukan pada beberapa komoditas lainnya. Kita bisa membuat strategi untuk penempatan barang yang sering dibeli bersamaan dalam transaksi yang sama untuk ditempatkan berdekatan. Dengan informasi tersebut kita juga bisa membuat perencanaan untuk menjaga stok barang dan bahkan porsi penempatannya pada rak. Dengan strategi ini diharapkan kenyamanan dan kepuasan konsumen akan meningkat dan pada akhirnya akan meningkatkan daya saing minimarket tersebut. Salah satu yang cukup unik terjadi pada komoditi air putih di mana komoditi ini cukup sering dibeli konsumen, namun kedekatannya dengan komoditi lain cenderung rendah. Hal ini berarti air putih memang sering dibeli konsumen tanpa mempertimbangkan pembelian barang lainnya.

Analisa ini dibuat dengan sampel seadanya, jadi hasilnyapun tidak bisa dipertanggungjawabkan secara statistik. Adapun penelitian kecil ini hanya dilakukan untuk ujicoba penggunaan tools Gephi dan Sci2 untuk membuat network graph. Analisa ini akan lebih berguna bila diterapkan pada data penjualan yang lebih besar pada lingkungan yang lebih homogen untuk melihat kecenderungan belanja masyarakat dengan lebih akurat, misalnya data toko tertentu pada jangka waktu tertentu atau dengan menggunakan big data penjualan.  Tapi mungkin untuk data yang  jauh lebih besar, maka tools yang digunakan juga harus yang lebih powerful. Untuk latihan  atau penelitian yang tidak terlalu besar, saya rasa menggunakan tools seperti ini sudah cukup. 🙂