Re: [de-dev] Anti-Abzock-Kampagne

2009-11-16 Diskussionsfäden Florian Effenberger

Hi Raphael,

Es macht wenig Sinn, dass da jemand anders das Tool schnell auf diese 
Arbeit auslegt. Da ich mich in meinem Quelltext wohl am besten 
zurechtfinde. das anpassen der Scripts dauert für mich vielleicht ne 
Stunde... wenns gut geht auch nur 10 Min.


Aber ich will mich da nicht aufdrängen, ihr dürft auch gerne was anderes 
wählen. Nur das Tool alleine wird dir nicht helfen, da es auf HTML 
Dateien ausgelegt ist, und nicht auf text Dateien. Ohne Anpassungen 
funktioniert es also schon mal nicht.


vielen Dank für das Angebot! Ich hab eventuell schon was Fertiges 
gefunden, damit wir uns die Zeit zum Anpassen ganz sparen. Ich schaus 
mir die Tage mal an und melde mich nochmal. ;-)


Viele Grüße
Flo

-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-16 Diskussionsfäden Florian Effenberger

Hallo Jörg,


Ich wäre mit solcherlei automatischen Auswertungen so oder so
vorsichtig. Meiner Meinung nach müßten diese Daten händisch gesichtet
und verlässlich geprüft werden, es sei denn die Daten seien bereits
anderweitig auf Verlässlichkeit geprüft.


Warum?
Im Forum z.B. kämpfen wir gegen Spam und die Spammer sind inzwischen als
'Gegenmaßnahme' teils dazu übergegangen ordentliche beiträge als Spam zu
melden, damit wir sie löschen wenn wir nicht genau hinsehen, und somit
dem Forum Schaden entsteht.
Ich kann mir gut vorstellen das in den 600 Rückmeldungen sinngemäß
ähnliche Versuche enthalten sein können um OOo zu diskreditieren wenn
wir Seitenadressen potentieller Abzocker ohne konkrete Prüfung z.B.
weiterleiten o.Ä.


das ist in der Tat richtig. Das Parsen kann immer nur die Vorarbeit 
sein, damit wir am Schluss eine Liste von URLs/Hostnamen erhalten. Da 
fallen dann sicher viele Duplikate raus. Das was dann übrig bleibt, 
müssen wir händisch sichten, zumal ich mittlerweile auch die Möglichkeit 
habe, die URLs auf der Blacklist einer Warnsoftware einzutragen - da 
darf dann nichts "Falsches" dabei sein.


Viele Grüße
Flo

-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-14 Diskussionsfäden Jörg Schmidt
Hallo *,

Florian Effenberger schrieb:
> > Wie schon besprochen, ich hab so einen hier. Sende mir doch
> mal die Daten.
>
> kannst du mir den Parser schicken? Das wäre wohl einfacher...

Ich wäre mit solcherlei automatischen Auswertungen so oder so
vorsichtig. Meiner Meinung nach müßten diese Daten händisch gesichtet
und verlässlich geprüft werden, es sei denn die Daten seien bereits
anderweitig auf Verlässlichkeit geprüft.


Warum?
Im Forum z.B. kämpfen wir gegen Spam und die Spammer sind inzwischen als
'Gegenmaßnahme' teils dazu übergegangen ordentliche beiträge als Spam zu
melden, damit wir sie löschen wenn wir nicht genau hinsehen, und somit
dem Forum Schaden entsteht.
Ich kann mir gut vorstellen das in den 600 Rückmeldungen sinngemäß
ähnliche Versuche enthalten sein können um OOo zu diskreditieren wenn
wir Seitenadressen potentieller Abzocker ohne konkrete Prüfung z.B.
weiterleiten o.Ä.



Gruß
Jörg


-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-14 Diskussionsfäden Raphael Bircher

Florian Effenberger schrieb:

Hi,

Wie schon besprochen, ich hab so einen hier. Sende mir doch mal die 
Daten.


kannst du mir den Parser schicken? Das wäre wohl einfacher...
Einfacher ist das wohl kaum. Das ist nen PHP Commandline Tool, das ich 
komplett selbst gebastelt hab, und das eigentlich einen dead-link 
checker für HTML Seiten ist. Das ist kein schönes hübsches Tool, dem man 
das Verzeichniss angeben kann und es spuckt alle Links aus. Mit relativ 
kleinen Eingriffen im Quellcode kann ich da aber verdammt viel machen... 
z.B. reduzieren der Links auf die Domain oder nur weglassen der GET 
übergaben (SESSION etc.). evtl. kann ich sogar die Dublicates 
filtrieren. Doch die Änderungen muss ich erst testen. und dazu müsste 
ich erst daten haben. Das durchlaufen lassen der 600 Mails dauert wohl 
nur ein paar Sekunden.


Es macht wenig Sinn, dass da jemand anders das Tool schnell auf diese 
Arbeit auslegt. Da ich mich in meinem Quelltext wohl am besten 
zurechtfinde. das anpassen der Scripts dauert für mich vielleicht ne 
Stunde... wenns gut geht auch nur 10 Min.


Aber ich will mich da nicht aufdrängen, ihr dürft auch gerne was anderes 
wählen. Nur das Tool alleine wird dir nicht helfen, da es auf HTML 
Dateien ausgelegt ist, und nicht auf text Dateien. Ohne Anpassungen 
funktioniert es also schon mal nicht.


Gruss Raphael

--
# Raphael Bircher
# Community Member of OpenOffice.org
# Private Website: http://www.raphaelbircher.ch


-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-14 Diskussionsfäden Florian Effenberger

Hi,


Wie schon besprochen, ich hab so einen hier. Sende mir doch mal die Daten.


kannst du mir den Parser schicken? Das wäre wohl einfacher...

Viele Grüße
Flo

-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-14 Diskussionsfäden Raphael Bircher

Florian Effenberger schrieb:

Hallo,

ich habe hier 600 Mails im Maildir++-IMAP-Format. Am einfachsten wäre, 
einen URL-Parser zu benutzen und dort einfach die URLs rauszuziehen. 
Diese müssen danach noch um Parameter wie Session-ID etc. bereinigt 
werden, sodass am Schluss nur noch ein Hostname existiert.


Hat jemand so ein Skript in petto?

Wie schon besprochen, ich hab so einen hier. Sende mir doch mal die Daten.

Gruss Raphael


--
# Raphael Bircher
# Community Member of OpenOffice.org
# Private Website: http://www.raphaelbircher.ch


-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-14 Diskussionsfäden Florian Effenberger

Hallo,

ich habe hier 600 Mails im Maildir++-IMAP-Format. Am einfachsten wäre, 
einen URL-Parser zu benutzen und dort einfach die URLs rauszuziehen. 
Diese müssen danach noch um Parameter wie Session-ID etc. bereinigt 
werden, sodass am Schluss nur noch ein Hostname existiert.


Hat jemand so ein Skript in petto?

Viele Grüße
Flo

-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-14 Diskussionsfäden Heinz W. Simoneit
Hi Flo,

Florian Effenberger schrieb:
> auf die Anti-Abzock-Kampagne, die wir Mitte September gestartet haben,
> hab ich über 600 Rückmeldungen bekommen. Ich würde gerne die Anbieter
> und v.a. URLs in eine Tabelle oder Datenbank packen, damit wir eine
> Liste haben, die wir anschließend bereinigt um persönliche Daten
> weitergeben können.
>
> Das ist allerdings ein größerer Aufwand - hat jemand Zeit und Lust,
> mich dabei zu unterstützen?

wir können uns ja mal' über Einzelheiten unterhalten...   :-)

Gtuß
Heinz

-- 
Have a nice time!



-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org



Re: [de-dev] Anti-Abzock-Kampagne

2009-11-13 Diskussionsfäden Johannes A. Bodwing

Hi Florian,

...
 
Das ist allerdings ein größerer Aufwand - hat jemand Zeit und Lust, 
mich dabei zu unterstützen?

Lassen wir Zeit und Lust mal beiseite ;-)
Wie genau ginge das vor sich? 600 Mails, und aus denen die URLs der
Anbieter ziehen?
Wie käme ich an die Mails ran etc.?

Gruß,
Johannes


-
To unsubscribe, e-mail: dev-unsubscr...@de.openoffice.org
For additional commands, e-mail: dev-h...@de.openoffice.org