Hallo Liste,

ich weiß es gibt da draußen ein Haufen Statistiken über OSM, aber zu
folgender Problematik hab ich keine Informationen gefunden:

Wie häufig werden bereits existierende Informationen wieder verändert?
Gibt es Unterschiede zwischen den Tags?


Es gibt bisher immer nur Informationen über die Nutzer und wieviel die
so ändern und beitragen, aber nicht aus "Sicht der Daten".

Stelle mir da gerade eine Berechnung wie folgt vor:

Editierfrequenz = (Summe der Anzahl der Änderungen des Tags mit Key X)
/ ( (Summe der Lebensdauern von Key X an den jeweiligen Objekten)

Beispiel mit 3 Objekten. Es wird nur das highway-tag betrachtet und
die Zeit wird zur Vereinfachung in ticks angegeben.

Objekt 1:
nach 3 ticks hinzufügen von:
highway=residential
nach weiteren 4 ticks:
1. Änderung:
highway=service
nach 1 tick:
2. Änderung:
highway=living_street
10 ticks bis heute

Objekt 2:
nach 0 ticks:
highway=motorway
17 ticks bis heute

Objekt 3:
nach 0 ticks:
highway=unclassified
nach 7 ticks:
1. Änderung:
highway=road
nach 2 ticks:
2. Änderung:
highway=tertiary
nach 5 ticks:
3. Änderung:
löschung


Also:
3 Objekte, Insgesamt 5 Änderungen des highway-tags
Lebensdauer des highway-tags bei:
Objekt 1: 4+1+10=15 ticks
Objekt 2: 17 ticks
Objekt 3: 7+2+5=14 ticks

Editierfrequenz des highway-tags am Einzelobjekt:
Objekt 1: 2/15 Änderungen/tick
Objekt 2: 0/17 Änderungen/tick
Objekt 3: 2/14 Änderungen/tick

Mittelwert aller Änderungen pro Gesamtlebensdauer des Tags
(Editierfrequenz des Tags):
(2+0+2)/(15+17+14) = 4/49 Änderungen/tick

Und diese mittlere Editierfrequenz würde mich jetzt für die häufigsten
tagkeys der OSM-Datenbank interessieren.
Da würde dann so ne Statistik rauskommen:

highway: X Änderungen/Zeit
amenity: Y Änderungen/Zeit
...


Dafür müsste man allerdings erstmal die komplette OSM-historie in der
Datenbank haben und nen fetten Rechner der dann die Statistiken
rumrödelt.
Hab ich leider gerade nicht zur Hand.

Fragen an die Liste:
Hat jemand schonmal sowas in der Art gemacht? Gibt es vielleicht schon
fertiges Stats in der Richtung und ich habs nur nicht gefunden?
Findet ihr die Methode sinnvoll?
Kann mir jemand helfen sowas zu erstellen oder ist das eh
aussichtslos, weil die historie eh nicht so klar ist, bei den ganzen
API-Umstellungen?

Ich hätte sowas gerne für meine Diplomarbeit.
Ich arbeite an einem System, um OSM-Daten mit GPG zu signieren. Dabei
wäre es sehr hilfreich zu wissen, wie oft sich die Daten eigentlich
ändern.

Vielen Dank und Grüße aus Dresden
Christoph

_______________________________________________
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de

Antwort per Email an