Classification | 004 |
Title | APLIKASI WEB SCRAPING UNTUK KOLEKSI KONTEN RESEP MASAKAN JAWA BERBASIS XML |
Edition | |
Call Number | 020/PD/2014 |
ISBN/ISSN | |
Author(s) | Setyawan Wibisono, S.Kom, MCs. Tri Ariyanto, S.Kom |
Subject(s) | |
Series Title | GMD | Penelitian Dosen |
Language | Indonesia |
Publisher | |
Publishing Year | 2014 |
Publishing Place | |
Collation | |
Abstract/Notes | |
Specific Detail Info | Dalam temu kembali informasi, korpus merupakan sekumpulan data set yang akan di hitung / diproses datanya secara statistik dengan pendekatan tertentu. Data set tersebut merupakan data yang relevan dengan topik dari kebutuhan temu kembali tersebut. Untuk membangun pendekatan pada suatu permasalahan tertentu pada temu kembali informasi seringkali korpus yang dibutuhkan tidak tersedia, dengan demikian korpus harus dibangun terlebih dahulu sebelum dilakukan proses komputasi terhadapnya. Sistem ini adalah rekayasa perangkat lunak komputer berbasis web yang bertujuan untuk melakukan pengambilan isi dari konten halaman web. Hal-hal yang diharapkan oleh pengguna agar dapat diwujudkan dalam sistem ini diantaranya adalah hal-hal sebagai berikut : 1) Sistem dapat secara otomatis mengekstrak konten utama dari suatu halaman web; 2) Dalam penelitian ini digunakan halaman dokumen pada situs http://bango.co.id; 3) Pengambilan data / crawling url pada http://bango.co.id menggunakan aplikasi sphider yang dapat diunduh di http://www.sphider.eu/; 4) Bahasa pemrograman digunakan php dan hasil scrape resep disimpan dalam database; 5) Sistem ini dapat memproduksi data resep dengan format xml; 6) Aplikasi di integrasikan dalam bentuk plugin CMS wordpress yang dapat diunduh di http://wordpress.org; 7) Sistem diimplementasikan secara online menggunakan url http://masakbagus.com Dalam pengembangan aplikasi ini diharapkan dapat memberikan manfaat : 1) Sistem dapat mengekstrak data resep halaman situs http://bango.co/id, dan menyimpannya dalam basis data mysql; 2) Sistem dapat memproduksi data resep dengan format xml. Aplikasi yang dibangun ditanam pada web server yang terkoneksi dengan jaringan internet. Aplikasi berjalan menggunakan service http dengan format transaksi data html, sehingga dapat dibuka menggunakan terminal yang terkoneksi ke jaringan komputer dan mampu / mempunyai browser WEB. Pengguna dapat melihat dokumen yang telah diekstrak dalam bentuk xml. Kata kunci : web scraping, konten resep masakan jawa, xml, ekstrak, crawling |
Image | |
File Attachment | LOADING LIST... |
Availability | LOADING LIST... |
Back To Previous |