Ahoj, díky za moc zajímavé myšlenky. K tomu co parsuju, jde o jídelníčky denní menu různých restaurací. Každá restaurace publikuje denní obědové menu jinak, někteří v neděli/pondělí vyvěsí kompletní menu pro celý týden, někteří jen pro následující den, je to různé. Ať už to dělá každý jinak, vždycky můžou menu pro následující/kterýkoli den změnit, což je pro mě problém, pokud jsem si k sobě už uložil starou verzi, proto chci peridicky kontrolovat jaký je stav.
Pro každou restauraci mám samostatný modul, kde je link na jídelníček a metoda která umí z html vytahat data, která mě zajímají ( a další obslužné metody). Každé jídlo se uloží do objektu databázového modelu (je to celé postavené na djangu) a zatím mám zapracovanou myšlenku hashe, tedy onen objekt má popis jídla, cenu, gramáž, atd. Z tohoto se vytvoří hash který se tam taky uloží. Při dalším checku se opět zparsuje, opět se nasekají objekty a spočítají hashe, ale jestli se bude ten jeden aktuální objekt updatovat nebo ne závisí na tom, jestli se hash změnil nebo ne. Pokud je popis jídla, cena, nebo cokoli jiné, bude i hash jiný a objekt se přepíše. Na HTTP hlavičky jsem nepomyslel a je to dobrý nápad, díky za to, vyzkouším, rozhodně se mi to líbí. Chci do databáze zapisovat co nejmíň, celé to běží na Google App engine, jsou tam různé kvóty na čtení/zápis z databáze a i když nečekám nějaký obrovský provoz, chci to napsat slušně :) -- S pozdravem Martin Stiborský Jabber: st...@njs.netlab.cz _______________________________________________ Python mailing list Python@py.cz http://www.py.cz/mailman/listinfo/python