Re: Parsing HTML stránek

Robert Novotny Sat, 19 Feb 2011 08:39:19 -0800

Typicka uloha: na serveri stahujete periodicky HTML stranky
a automaticky z nich extrahujete relevantne udaje.


Technologie prehliadaca vam v tom nepomozu, lebo
to neviete automatizovat a na strane servera si to zrejme nespustite.

RN

On 19. 2. 2011 11:15, Michal Bernhard wrote:

Muzete prosim vsichni, co jste tu psali, ze jste to taky resili,napsat konkretni usecase?Zajimalo by me proc vznikne takovy pozadavek a zaroven a jestli se toneda resit elegantneji treba kombinaci

firefox/chrome + greasemonkey + treba jquery.

Dekuji :)

Michal
http://twitter.com/#!/michalb_cz <http://twitter.com/#%21/michalb_cz>

2011/2/18 Lukas "lzap" Zapletal <[email protected]<mailto:[email protected]>>



    Presne tohle jsem resil zhruba pred 5 lety. A vyresil.

    Knihovna JTidy - umi zpracovat skoro vsechno. Je to "vsezravec".
    Funguje
    tam, kde si ostatni parsery lamou doslova zuby.

    Jestli je rychla nevim. Jestli zvladne nejnovejsi XHTML nebo HTML5
    take
    nevim. Ale na mem projektu fungovala skvele (HTML 4).

    Napiste jak jste pochodil.

    LZ

    -----
    Later,
     Lukas
    --
    View this message in context:
    
http://konference-java-cz.958153.n3.nabble.com/Parsing-HTML-stranek-tp2526109p2526552.html
    Sent from the konference java.cz <http://java.cz> mailing list
    archive at Nabble.com.

Re: Parsing HTML stránek

Odpovedet emailem