Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-31 Diskussionsfäden gebhard dettmar
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

On Sunday 31 October 2004 00:26, Knoller Stocker Martin  Pia Stocker mit 
Marvin und Andreina wrote:
 --  Weitergeleitete Nachricht  --
[...]

 nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen
 gerichten gibt,  dies will ich auslesen, aber nur die spalte des
 aktuellen Tages: also sowas wie , hol mir das heutige vegi-menu vom
 restaurant x und das heutige vegi-menu von restaurant y. oder noch
 kuerzer:
 zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an...

 mit

 grep -B 1 -A 12 Vegi Menu.htm

 hole ich ungefaehr die passende Zeile raus.
 in Zeile 1 steht immer tr
 in Zeile 2 der Vegi-Header,
 und dann die tabellen-spalten pro wochentag.
 dann weiter mit:

 grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1

 und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber
 leider koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken
 ...

 wie merkt mein skript denn das?
tja, da fällt mir nur Perl ein. Da kann man mit der Variablen $/ einen 
bestimmten Einlesemodus bestimmen, also:
$/ = .\n;   #das soll mehrere Zeilen ermöglichen
while ($zeile = ) {
if ($zeile =~ m/vegi.*)
$vegi = $1
. 
oder keine Ahnung. Bin Perl-Anfänger. Mehr fällt mir im Moment leider auch 
nicht ein.
Gruß Gebhard

-BEGIN PGP SIGNATURE-
Version: GnuPG v1.0.6 (GNU/Linux)
Comment: For info see http://www.gnupg.org

iD8DBQFBhRJ09EYTTD7FjIERAnEfAJ0dem6UDCHDkljxqYt1PuycjxE69wCgkl3t
ZEk7+Oq0yomufPqb4QvqWiQ=
=/vNp
-END PGP SIGNATURE-



script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden Knoller Stocker Martin Pia Stocker mit Marvin und Andreina
hallo liste

nach langem googeln etc. bin ich immer noch nicht weiter gekommen:

ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine 
eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag.
ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach...

warscheinlich geht das mit perl besser doch das kenne ich zuwenig
vorschlaege?

gruss
martin


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden Frank Evers
Am Samstag, 30. Oktober 2004 15:09 schrieb Knoller Stocker Martin  Pia 
Stocker mit Marvin und Andreina:

 ich moechte mir aus verschiedenen zellen von mehreren html tabellen
 eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen
 tag. ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu
 schwach...

 warscheinlich geht das mit perl besser doch das kenne ich zuwenig
 vorschlaege?

Das klingt alles ein wenig vage, machs konkreter und gib ein Beispiel. 
Ansonsten fällt mir spontan awk als Tool der Wahl ein.

-- 
Gruß Frank



Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden Jakob Lell
Hallo,

vielleicht hilft dir das Perl-Modul HTML::TableExtract. Es Befindet
sich in dem Debianpaket libhtml-tableextract-perl.

Jakob


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden Knoller Stocker Martin Pia Stocker mit Marvin und Andreina

  ich moechte mir aus verschiedenen zellen von mehreren html tabellen
  eine eigene html-tabelle generieren lassen, abhaengig vom jeweiligen
  tag. ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu
  schwach...

 Das klingt alles ein wenig vage, machs konkreter und gib ein Beispiel.
ich habe verschiedene html-tabellen von verschiedenen Restaurants/Cafe's
mit eintraegen wochentag x menu, also spalten-titel: montag bis freitag,
zeilentitel: menu1, vegi-menu, bio-menu etc..

was will ich: eine htm-table generieren, die z.B. am mittwoch z.B. alle 
vegi-menus anzeigt, die die restaurants in ihrer table unter (vegi,mittwoch) 
haben ...
 Ansonsten fällt mir spontan awk als Tool der Wahl ein.
habe ich schon daran gedacht, aber awk um html-code zu bearbeiten?
habe keine erfahrung damit, muesste wohl zuerst den html-code normieren..



Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden gebhard dettmar
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

On Saturday 30 October 2004 15:09, Knoller Stocker Martin  Pia Stocker 
mit Marvin und Andreina wrote:
 hallo liste

 nach langem googeln etc. bin ich immer noch nicht weiter gekommen:

 ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine
 eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag.
Was heißt das? Stehen die, die du willst, in unterschiedlichen Tags? Nicht 
alle td td width=20 etc.?
 ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu
 schwach...
 warscheinlich geht das mit perl besser doch das kenne ich zuwenig
 vorschlaege?
Das Ganze klingt weniger nach einer bestimmten Sprache als nach regulären 
Ausdrücken. So gesehen ist perl eigentlich ein guter Kandidat, doch in php 
sollte es genauso gehn.
Aber poste doch mal ein paar Zeilen
 gruss
 martin
gruss
gebhard
-BEGIN PGP SIGNATURE-
Version: GnuPG v1.0.6 (GNU/Linux)
Comment: For info see http://www.gnupg.org

iD8DBQFBg7A59EYTTD7FjIERAjAGAJ4mcGB1tgDP4eJLclXTXKs79a177ACgm9t/
zW1No8c0Q5fUUFlGfbekfx0=
=NVr9
-END PGP SIGNATURE-



Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden Markus Schulz
Knoller Stocker Martin  Pia Stocker mit Marvin und Andreina schrieb:
hallo liste
nach langem googeln etc. bin ich immer noch nicht weiter gekommen:
ich moechte mir aus verschiedenen zellen von mehreren html tabellen eine 
eigene html-tabelle generieren lassen, abhaengig vom jeweiligen tag.
ich dachte zuerst an php, doch irgendwie ist wohl php dafuer zu schwach...

warscheinlich geht das mit perl besser doch das kenne ich zuwenig
vorschlaege?
also mit ein wenig Einarbeit und halbwegs guten html Seiten (nahezu 
xhtml konform, br tags und sachen die nicht xml konform sind kann man 
zur not noch mit sed bearbeiten) bietet sich für sowas ein XSLT Script an.

Damit kannst du dir Regeln bauen die die Daten aus den einzelnen 
Tabellen extrahieren und in eine neue html Seite in eine Tabelle einfügen.

Markus Schulz
--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)


Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden gebhard dettmar
-BEGIN PGP SIGNED MESSAGE-
Hash: SHA1

On Saturday 30 October 2004 17:39, Knoller Stocker Martin  Pia Stocker 
mit Marvin und Andreina wrote:
  Aber poste doch mal ein paar Zeilen

 Ok, hier ist eine typische Zeile einer der html-tabellen
 [ist halt ein bisschen gross fure den Post, sorry
pfff, kein Problem, aber du solltest an die Liste posten. Da gibt's 
einige, die davon 'ne Menge mehr verstehn als ich (auch wenn du dafür:
dispatch.asp? vielleicht ein bisschen Schimpfe riskierst ;-) Mach dir 
nichts draus, hab ich auch schon abgekriegt;-))
 [...]
 tr
  th nowrap align=left valign=topVegibr5.80 / 8.40 /
 10.80nbsp;/th td align=left valign=topa
 href=dispatch.asp?fct=OeffnungszeitenIdMensa=1GESCHLOSSEN/anbsp;
/td td align=left valign=topa
 href=dispatch.asp?fct=OeffnungszeitenIdMensa=1GESCHLOSSEN/anbsp;
/td td align=left valign=topFarfalle al boscaiolo
 (Rahmsauce, Pilze),
 Salatnbsp;/td
  td align=left valign=topTomaten- oder Spinatjalousie,
 Drei Saisongemuuml;senbsp;/td

  td align=left valign=topRouml;stipick
 mit Quarkfuuml;llung,
 Gemuuml;sebett,
 Salatnbsp;/td
 /tr
 [...]

 Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag Vegi
 finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite
 etc...
Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast 
du ja wohl noch tags wie tdboeses Schweinefleisch/td die du nicht 
matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder 
wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so 
vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder 
'fleisch' in allen unerwünschten. Oder man macht eine Datei  mit, sagen 
wir, erwünschten, und dann grep -f (wie geht das in perl?)
 gruss
 Martin
-BEGIN PGP SIGNATURE-
Version: GnuPG v1.0.6 (GNU/Linux)
Comment: For info see http://www.gnupg.org

iD8DBQFBg/on9EYTTD7FjIERAuaMAJ9ClKkAPFnOMQQjFhXYacipvdU5JQCgk6DJ
8zbvDCR8xiKD77TbeP1fgzg=
=h+OR
-END PGP SIGNATURE-



Re: script gesucht: Zellen aus html tabelle auslesen

2004-10-30 Diskussionsfäden Knoller Stocker Martin Pia Stocker mit Marvin und Andreina


--  Weitergeleitete Nachricht  --

Subject: Re: script gesucht: Zellen aus html tabelle auslesen
Date: 2004 - Oktober - Samstag, 30. 23.47
From: Knoller Stocker Martin  Pia Stocker mit Marvin und Andreina 
[EMAIL PROTECTED]
To: [EMAIL PROTECTED]

  Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag Vegi
  finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite
  etc...

 Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast
 du ja wohl noch tags wie tdboeses Schweinefleisch/td die du nicht
 matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder
 wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so
 vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder
 'fleisch' in allen unerwünschten. Oder man macht eine Datei  mit, sagen
 wir, erwünschten, und dann grep -f (wie geht das in perl?)

nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen
gerichten gibt,  dies will ich auslesen, aber nur die spalte des aktuellen
Tages: also sowas wie , hol mir das heutige vegi-menu vom restaurant x
und das heutige vegi-menu von restaurant y. oder noch kuerzer:
zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an...

mit

grep -B 1 -A 12 Vegi Menu.htm

hole ich ungefaehr die passende Zeile raus.
in Zeile 1 steht immer tr
in Zeile 2 der Vegi-Header,
und dann die tabellen-spalten pro wochentag.
dann weiter mit:

grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1

und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber leider
koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken ...

wie merkt mein skript denn das?
am schluss muesste ich noch sed drueber laufen lassen um die html-tags
rauszuschmeissen

---