Archive

Archive for June, 2015

mengekstrak informasi dari file HTML (website) dan dikonversi menjadi file csv

June 18, 2015 Leave a comment

lagi iseng, karena agak longgar, terinspirasi dari thesis seorang temen yg membahas tentang information extraction yang mampu mengenali dan mempelajari pola dokumen (wheww), jadi pengen juga belajar cara mengekstrak kulit manggis, halah.. tapi ini ga sekeren thesis temen saya tadi, karena yang saya lakukan di sini cuma mengekstrak informasi dari tag-tag HTML doang, yang susunan tag-nya juga udah diketahui secara baku.. kecewa? yah namanya juga baru belajar… 😀

 

jadi studi kasusnya di sini adalah, saya mempunyai file HTML yang berisi informasi mengenai kode dan nama provinsi di indonesia. kode html ini bisa berasal dari file lokal ataupun berupa link ke website tertentu.

Read more…

Categories: Office, PHP Tags: , ,