HIi Pake scrubyt aja.. lebih gampang... tapi sayangnya tidak ada toturialnya.. saya jg lagi buat untuk ambil data dari web game online..
Thank you --- On Tue, 24/11/09, Achmad Gozali <goz...@gmail.com> wrote: From: Achmad Gozali <goz...@gmail.com> Subject: Re: [id-ruby] Tanya tentang ekstraksi dokumen html To: id-ruby@yahoogroups.com Date: Tuesday, 24 November, 2009, 4:33 AM coba hpricot mas Andriy http://github.com/whymirror/hpricot atau nokogiri http://wiki.github.com/tenderlove/nokogiri Regards, Gozali On Nov 21, 2009, at 10:56 AM, Andriy Shevtiawan wrote: > > Dear rubyist/railers indonesia, saya punya permasalahan. Mohon > bantuannya ya. > > Saya sedang mengerjakan tugas akhir tentang ekstraksi struktur > halaman web (html document) dengan algoritma berdasarkan visual > cues. Secara garis besar, kira begini langkah2nya: > > 1. Mendapatkan satu halaman web yg akan diekstrak (misal, > "http://www.detik.com > "). > 2. Ambil beberapa elemen dari satu halaman web tersebut berdasarkan > tanda2 visualnya.(Misal: ambil semua div yg backgroundnya biru) > 3. Memproses hasil dari langkah no.2 dengan algoritma saya. > 4. Simpan hasilnya di database. > > Nah, pertanyaan saya gimana mengimplementasikan langkah ke 1 dan ke > 2 dengan ruby (atau rails?) ya? Adakah library, plugin, helper, atau > apapun yg bisa digunakan untuk masalah ini? > > Saya sudah coba gugling, tp blum menemukan hasil yg diharapkan. Atau > keywordnya yg blum pas mungkin ya? :D > > terimakasih, > > -andrisetiawan- > > [Non-text portions of this message have been removed] > > > [Non-text portions of this message have been removed] ------------------------------------ ID-Ruby Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat dengan Ruby (Ruby on Rails, JRuby on Rails, Merb) http://rubyurl.com/Q8DD http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia New Email addresses available on Yahoo! Get the Email name you've always wanted on the new @ymail and @rocketmail. Hurry before someone else does! http://mail.promotions.yahoo.com/newdomains/aa/ [Non-text portions of this message have been removed]