Re: script gesucht: Zellen aus html tabelle auslesen
-BEGIN PGP SIGNED MESSAGE- Hash: SHA1 On Sunday 31 October 2004 00:26, Knoller Stocker Martin Pia Stocker mit Marvin und Andreina wrote: -- Weitergeleitete Nachricht -- [...] nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen gerichten gibt, dies will ich auslesen, aber nur die spalte des aktuellen Tages: also sowas wie , hol mir das heutige vegi-menu vom restaurant x und das heutige vegi-menu von restaurant y. oder noch kuerzer: zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an... mit grep -B 1 -A 12 Vegi Menu.htm hole ich ungefaehr die passende Zeile raus. in Zeile 1 steht immer tr in Zeile 2 der Vegi-Header, und dann die tabellen-spalten pro wochentag. dann weiter mit: grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1 und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber leider koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken ... wie merkt mein skript denn das? tja, da fällt mir nur Perl ein. Da kann man mit der Variablen $/ einen bestimmten Einlesemodus bestimmen, also: $/ = .\n; #das soll mehrere Zeilen ermöglichen while ($zeile = ) { if ($zeile =~ m/vegi.*) $vegi = $1 . oder keine Ahnung. Bin Perl-Anfänger. Mehr fällt mir im Moment leider auch nicht ein. Gruß Gebhard -BEGIN PGP SIGNATURE- Version: GnuPG v1.0.6 (GNU/Linux) Comment: For info see http://www.gnupg.org iD8DBQFBhRJ09EYTTD7FjIERAnEfAJ0dem6UDCHDkljxqYt1PuycjxE69wCgkl3t ZEk7+Oq0yomufPqb4QvqWiQ= =/vNp -END PGP SIGNATURE-
script gesucht: Zellen aus html tabelle auslesen
hallo liste nach langem googeln etc. bin ich immer noch nicht weiter gekommen: ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag. ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach... warscheinlich geht das mit perl besser doch das kenne ich zuwenig vorschlaege? gruss martin -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: script gesucht: Zellen aus html tabelle auslesen
Am Samstag, 30. Oktober 2004 15:09 schrieb Knoller Stocker Martin Pia Stocker mit Marvin und Andreina: ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag. ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach... warscheinlich geht das mit perl besser doch das kenne ich zuwenig vorschlaege? Das klingt alles ein wenig vage, machs konkreter und gib ein Beispiel. Ansonsten fällt mir spontan awk als Tool der Wahl ein. -- Gruß Frank
Re: script gesucht: Zellen aus html tabelle auslesen
Hallo, vielleicht hilft dir das Perl-Modul HTML::TableExtract. Es Befindet sich in dem Debianpaket libhtml-tableextract-perl. Jakob -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: script gesucht: Zellen aus html tabelle auslesen
ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag. ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach... Das klingt alles ein wenig vage, machs konkreter und gib ein Beispiel. ich habe verschiedene html-tabellen von verschiedenen Restaurants/Cafe's mit eintraegen wochentag x menu, also spalten-titel: montag bis freitag, zeilentitel: menu1, vegi-menu, bio-menu etc.. was will ich: eine htm-table generieren, die z.B. am mittwoch z.B. alle vegi-menus anzeigt, die die restaurants in ihrer table unter (vegi,mittwoch) haben ... Ansonsten fällt mir spontan awk als Tool der Wahl ein. habe ich schon daran gedacht, aber awk um html-code zu bearbeiten? habe keine erfahrung damit, muesste wohl zuerst den html-code normieren..
Re: script gesucht: Zellen aus html tabelle auslesen
-BEGIN PGP SIGNED MESSAGE- Hash: SHA1 On Saturday 30 October 2004 15:09, Knoller Stocker Martin Pia Stocker mit Marvin und Andreina wrote: hallo liste nach langem googeln etc. bin ich immer noch nicht weiter gekommen: ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag. Was heißt das? Stehen die, die du willst, in unterschiedlichen Tags? Nicht alle td td width=20 etc.? ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach... warscheinlich geht das mit perl besser doch das kenne ich zuwenig vorschlaege? Das Ganze klingt weniger nach einer bestimmten Sprache als nach regulären Ausdrücken. So gesehen ist perl eigentlich ein guter Kandidat, doch in php sollte es genauso gehn. Aber poste doch mal ein paar Zeilen gruss martin gruss gebhard -BEGIN PGP SIGNATURE- Version: GnuPG v1.0.6 (GNU/Linux) Comment: For info see http://www.gnupg.org iD8DBQFBg7A59EYTTD7FjIERAjAGAJ4mcGB1tgDP4eJLclXTXKs79a177ACgm9t/ zW1No8c0Q5fUUFlGfbekfx0= =NVr9 -END PGP SIGNATURE-
Re: script gesucht: Zellen aus html tabelle auslesen
Knoller Stocker Martin Pia Stocker mit Marvin und Andreina schrieb: hallo liste nach langem googeln etc. bin ich immer noch nicht weiter gekommen: ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag. ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach... warscheinlich geht das mit perl besser doch das kenne ich zuwenig vorschlaege? also mit ein wenig Einarbeit und halbwegs guten html Seiten (nahezu xhtml konform, br tags und sachen die nicht xml konform sind kann man zur not noch mit sed bearbeiten) bietet sich für sowas ein XSLT Script an. Damit kannst du dir Regeln bauen die die Daten aus den einzelnen Tabellen extrahieren und in eine neue html Seite in eine Tabelle einfügen. Markus Schulz -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: script gesucht: Zellen aus html tabelle auslesen
-BEGIN PGP SIGNED MESSAGE- Hash: SHA1 On Saturday 30 October 2004 17:39, Knoller Stocker Martin Pia Stocker mit Marvin und Andreina wrote: Aber poste doch mal ein paar Zeilen Ok, hier ist eine typische Zeile einer der html-tabellen [ist halt ein bisschen gross fure den Post, sorry pfff, kein Problem, aber du solltest an die Liste posten. Da gibt's einige, die davon 'ne Menge mehr verstehn als ich (auch wenn du dafür: dispatch.asp? vielleicht ein bisschen Schimpfe riskierst ;-) Mach dir nichts draus, hab ich auch schon abgekriegt;-)) [...] tr th nowrap align=left valign=topVegibr5.80 / 8.40 / 10.80nbsp;/th td align=left valign=topa href=dispatch.asp?fct=OeffnungszeitenIdMensa=1GESCHLOSSEN/anbsp; /td td align=left valign=topa href=dispatch.asp?fct=OeffnungszeitenIdMensa=1GESCHLOSSEN/anbsp; /td td align=left valign=topFarfalle al boscaiolo (Rahmsauce, Pilze), Salatnbsp;/td td align=left valign=topTomaten- oder Spinatjalousie, Drei Saisongemuuml;senbsp;/td td align=left valign=topRouml;stipick mit Quarkfuuml;llung, Gemuuml;sebett, Salatnbsp;/td /tr [...] Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag Vegi finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite etc... Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast du ja wohl noch tags wie tdboeses Schweinefleisch/td die du nicht matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder 'fleisch' in allen unerwünschten. Oder man macht eine Datei mit, sagen wir, erwünschten, und dann grep -f (wie geht das in perl?) gruss Martin -BEGIN PGP SIGNATURE- Version: GnuPG v1.0.6 (GNU/Linux) Comment: For info see http://www.gnupg.org iD8DBQFBg/on9EYTTD7FjIERAuaMAJ9ClKkAPFnOMQQjFhXYacipvdU5JQCgk6DJ 8zbvDCR8xiKD77TbeP1fgzg= =h+OR -END PGP SIGNATURE-
Re: script gesucht: Zellen aus html tabelle auslesen
-- Weitergeleitete Nachricht -- Subject: Re: script gesucht: Zellen aus html tabelle auslesen Date: 2004 - Oktober - Samstag, 30. 23.47 From: Knoller Stocker Martin Pia Stocker mit Marvin und Andreina [EMAIL PROTECTED] To: [EMAIL PROTECTED] Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag Vegi finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite etc... Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast du ja wohl noch tags wie tdboeses Schweinefleisch/td die du nicht matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder 'fleisch' in allen unerwünschten. Oder man macht eine Datei mit, sagen wir, erwünschten, und dann grep -f (wie geht das in perl?) nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen gerichten gibt, dies will ich auslesen, aber nur die spalte des aktuellen Tages: also sowas wie , hol mir das heutige vegi-menu vom restaurant x und das heutige vegi-menu von restaurant y. oder noch kuerzer: zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an... mit grep -B 1 -A 12 Vegi Menu.htm hole ich ungefaehr die passende Zeile raus. in Zeile 1 steht immer tr in Zeile 2 der Vegi-Header, und dann die tabellen-spalten pro wochentag. dann weiter mit: grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1 und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber leider koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken ... wie merkt mein skript denn das? am schluss muesste ich noch sed drueber laufen lassen um die html-tags rauszuschmeissen ---