Re: [Talk-de] keepright.at

2013-03-22 Diskussionsfäden Martin Raifer

Aufs Geradewohl habe ich am Startort von keepright ein paar Bugs
angeschaut, wo unter anderem diese Fehler gemeldet wurden:


Sorry, aber da hast du jetzt gerade so ca. die drei schlechtesten  
Beispiele herausgepickt:



http://ompldr.org/vaHVqOQ


"www.genusswerk.at/partnerbetriebe/lehmberg/" wird weitergeleitet auf  
"www.danzingercompany.at". Dort ist vom entsprechenden Restaurant nirgends  
dir Rede. Die korrekte Website ist wahrscheinlich die folgende:  
http://www.lehmberg.at/



http://ompldr.org/vaHVqYQ


Hier fehlt am OSM POI wahrscheinlich ein alt_name="Das Powidl" oder so  
ähnlich.



http://ompldr.org/vaHVqYg


Die Webseite scheint im Moment offline oder in Neugestaltung zu sein.  
Informationen zum Geschäft findet man dort jedenfalls nicht.



Sicher ist es wenig trivial, diese und andere Fehler als nicht-Fehler
zu erkennen - aber bei der nicht unerheblichen Anzahl von false
positives verliert man mit der Zeit doch die Lust...


Sicher gibt es einige Falschmeldungen, aber im Allgemeinen finde ich  
persönlich diesen "Website" Layer schon recht hilfreich.


Ich habe gerade einen kleinen Bereich in Wien X durchgearbeitet. Hier mein  
"Erfolg" [1]:


* 6 "false positives" (darunter 2 mit angeblichem HTTP-Fehler) in  
keepright als solche markiert
* 4 Links, die auf webseiten ohne Inhalt (bzw "under construction") gehen  
mit fixmes ausgestattet

* 2 tote Links auf die aktuelle Webseite umgeleitet
* 2 tote Links entfernt
* 2 Links entdeckt, die auf die Website einer Dachorganisation verlinken.  
Keine Ahnung ob das sinnvoll ist. Erstmal so gelassen.


Grüße
Martin

[1] http://www.openstreetmap.org/browse/changeset/15456384

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] keepright.at

2013-03-22 Diskussionsfäden malenki
Am Fri, 22 Mar 2013 02:40:29 -0700 (PDT)
schrieb Philip Gillißen :

> Ich habe mir mal den Code von dem Website-Tag-Check[1] angesehen und
> ab Zeile 777[2] wird es interessant mit den Umlauten. Alles, was ich
> im Folgenden schreibe ist nur mein Verständnis des Codes. Wenn ich
> falsch liege, möchte ich nichts gesagt haben :) Ich bin keiner, der
> täglich PHP-Code schreibt, bin da in anderen Welten unterwegs. Wie
> ich den Code verstehe, wird anscheinend der HTML-Text der Website
> heruntergeladen und dort das Encoding überprüft. Kann jemand das
> verifizieren? Wenn dem so ist, geht meiner Meinung der Check etwas zu
> weit. Ansonsten kann man ja direkt den W3C-Validator auch noch
> drüberlaufen lassen... Falls der Website-Check so penibel ist, sind
> für mich die Fundstellen dann sehr wertlos. Meistens kann man die
> externe Seite ja nicht beeinflussen.

Ich bezog mich eher auf Bugs, wo das Matching z.B. nicht erkennen
konnte, das name=Müller und website=mueller durchaus zueinander passen.

Aufs Geradewohl habe ich am Startort von keepright ein paar Bugs
angeschaut, wo unter anderem diese Fehler gemeldet wurden:
http://ompldr.org/vaHVqOQ
http://ompldr.org/vaHVqYQ
http://ompldr.org/vaHVqYg

Sicher ist es wenig trivial, diese und andere Fehler als nicht-Fehler
zu erkennen - aber bei der nicht unerheblichen Anzahl von false
positives verliert man mit der Zeit doch die Lust...

Gruß
Thomas



___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] keepright.at

2013-03-22 Diskussionsfäden Martin Raifer

Hallo!

Ich denke das Problem liegt eher darin, dass keepright keine  
"Internationalisierte Domainnamen" (IDN) [1] unterstützt. Somit werden  
alle URLs, die z.B. Umlaute oder "ß" beinhalten, fälschlicherweise  
beanstandet (z.B. www.ströbel.at - siehe [2]).


Ich habe den entsprechenden Code mal überflogen und kann jetzt nichts grob  
falsches erkennen (außer die offensichtlich fehlende Implementierung des  
IDNA Standards): Die meisten Routinen (z.B. das von dir erwähnte  
'check_redirects' oder 'fix_charset') scheinen dazu dienen, in PHP das  
Verhalten eines Web-Browsers zu simulieren (hier: HTML-Weiterleitungen  
bzw. inkonsistente Encoding-Angaben). Inwieweit diese Vorgangsweise  
sinnvoll ist, sei mal dahingestellt...


Unabhängig davon könnte IDNA-Support leicht nachgereicht werden [3].

Liebe Grüße
Martin

[1] http://de.wikipedia.org/wiki/Internationalisierter_Domainname
[2]  
http://keepright.ipax.at/report_map.php?zoom=16&lat=48.20742&lon=16.17782&layers=B0T&ch=0%2C411%2C412%2C413&show_ign=1&show_tmpign=1

[3] http://phlymail.com/de/downloads/idna-convert.html



Am 22.03.2013, 10:40 Uhr, schrieb Philip Gillißen :


Ich habe mir mal den Code von dem Website-Tag-Check[1] angesehen und ab
Zeile 777[2] wird es interessant mit den Umlauten. Alles, was ich im
Folgenden schreibe ist nur mein Verständnis des Codes. Wenn ich falsch
liege, möchte ich nichts gesagt haben :) Ich bin keiner, der täglich
PHP-Code schreibt, bin da in anderen Welten unterwegs. Wie ich den Code
verstehe, wird anscheinend der HTML-Text der Website heruntergeladen und
dort das Encoding überprüft. Kann jemand das verifizieren?
Wenn dem so ist, geht meiner Meinung der Check etwas zu weit. Ansonsten  
kann

man ja direkt den W3C-Validator auch noch drüberlaufen lassen...
Falls der Website-Check so penibel ist, sind für mich die Fundstellen  
dann

sehr wertlos. Meistens kann man die externe Seite ja nicht beeinflussen.

Gruß, Philip

[1]:
http://sourceforge.net/p/keepright/code/676/tree/checks/0410_website.php
[2]:
http://sourceforge.net/p/keepright/code/676/tree/checks/0410_website.php#l777


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] keepright.at

2013-03-22 Diskussionsfäden Philip Gillißen
Hi!


malenki wrote
> Die Überprüfung von URLs durch keepright bringt etliche false Positives.
> Ich bin sicher nicht der einzige, der dem Autor Mails zu Bugs
> geschrieben hat...

Ich habe mir mal den Code von dem Website-Tag-Check[1] angesehen und ab
Zeile 777[2] wird es interessant mit den Umlauten. Alles, was ich im
Folgenden schreibe ist nur mein Verständnis des Codes. Wenn ich falsch
liege, möchte ich nichts gesagt haben :) Ich bin keiner, der täglich
PHP-Code schreibt, bin da in anderen Welten unterwegs. Wie ich den Code
verstehe, wird anscheinend der HTML-Text der Website heruntergeladen und
dort das Encoding überprüft. Kann jemand das verifizieren?
Wenn dem so ist, geht meiner Meinung der Check etwas zu weit. Ansonsten kann
man ja direkt den W3C-Validator auch noch drüberlaufen lassen...
Falls der Website-Check so penibel ist, sind für mich die Fundstellen dann
sehr wertlos. Meistens kann man die externe Seite ja nicht beeinflussen.

Gruß, Philip

[1]:
http://sourceforge.net/p/keepright/code/676/tree/checks/0410_website.php
[2]:
http://sourceforge.net/p/keepright/code/676/tree/checks/0410_website.php#l777



--
View this message in context: 
http://gis.19327.n5.nabble.com/keepright-at-tp5754215p5754278.html
Sent from the Germany mailing list archive at Nabble.com.

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] keepright.at

2013-03-21 Diskussionsfäden malenki
Wolfgang Wienke schrieb:

> kann es sein, dass diese Seite Umlaute im tag website bemängelt, auch 
> wenn diese ok sind?

Die Überprüfung von URLs durch keepright bringt etliche false Positives.
Ich bin sicher nicht der einzige, der dem Autor Mails zu Bugs
geschrieben hat...

malenki



___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


[Talk-de] keepright.at

2013-03-21 Diskussionsfäden Wolfgang Wienke

Hallo,
kann es sein, dass diese Seite Umlaute im tag website bemängelt, auch 
wenn diese ok sind?

--
   wonk

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de