Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-08 Diskussionsfäden Werner Hoch
On Freitag, 8. Oktober 2010, Christoph Wagner wrote:
> Am 07.10.2010 22:19, schrieb Jochen Topf:
> > On Wed, Oct 06, 2010 at 03:43:29PM +0200, Christoph Wagner wrote:
> >> Wie häufig werden bereits existierende Informationen wieder
> >> verändert?
> > 
> > Nodes haben im Durchschnitt ca. 1.5 Versionen, Ways ca. 1.7 und
> > Relations ca. 3.5.

Das gilt für den planet, die Werte sind regional sehr unterschiedlich.
Deutschland hat z.B.
Nodes=1,8  Ways=2,5  Relations=7,6

Meine Statistiken:
Deutschland:
http://www.h-renrew.de/h/osm/osmchecks/03_Statistik/de/statistic.html
Planet:
http://www.h-
renrew.de/h/osm/osmchecks/03_Statistik/planet/statistic.html

Für eine ausführliche Auswertung müsste man sicher auch noch alle 
Objekte betrachten die gelöscht worden sind.

Eine einfachere Auswertung ohne history wäre:
Wie häufig wurde ein Objekt geändert, das aktuell ein tag "x=y" trägt?
Bei nodes zusätzlich:
Wie häufig wurde ein Objekt geändert, das kein tag hat?

Grüße
Werner

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-07 Diskussionsfäden Jochen Topf
On Fri, Oct 08, 2010 at 12:31:34AM +0200, Christoph Wagner wrote:
> Am 07.10.2010 22:19, schrieb Jochen Topf:
> > On Wed, Oct 06, 2010 at 03:43:29PM +0200, Christoph Wagner wrote:
> >> Wie häufig werden bereits existierende Informationen wieder verändert?
> > 
> > Nodes haben im Durchschnitt ca. 1.5 Versionen, Ways ca. 1.7 und Relations
> > ca. 3.5.
> > 
> > Feiner aufgeschlüsselt habe ich das nicht.
> > 
> > Jochen
> 
> 
> Danke schonmal. Ist doch erst mal ein Anhaltspunkt. Wo hast du denn die 
> Informationen her bzw. wie hast du das berechnet?

Die Geofabrik hat da einen täglich laufenden Job, in dem verschiedene Dinge
berechnet werden. Da fällt auch diese Statistik bei raus. Das macht nichts
anderes als alle Versionsnummern pro Objekttyp (Node, Way, Relation)
aufzuaddieren und durch die Anzahl der Objekte zu teilen.

Jochen
-- 
Jochen Topf  joc...@remote.org  http://www.remote.org/jochen/  +49-721-388298


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-07 Diskussionsfäden Christoph Wagner
Am 07.10.2010 22:19, schrieb Jochen Topf:
> On Wed, Oct 06, 2010 at 03:43:29PM +0200, Christoph Wagner wrote:
>> Wie häufig werden bereits existierende Informationen wieder verändert?
> 
> Nodes haben im Durchschnitt ca. 1.5 Versionen, Ways ca. 1.7 und Relations
> ca. 3.5.
> 
> Feiner aufgeschlüsselt habe ich das nicht.
> 
> Jochen


Danke schonmal. Ist doch erst mal ein Anhaltspunkt. Wo hast du denn die 
Informationen her bzw. wie hast du das berechnet?


Grüße
Christoph



signature.asc
Description: OpenPGP digital signature
___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-07 Diskussionsfäden aighes

Hallo,
für "ein Node mit dem Tag x=y wurde im Durchschnitt 1,6mal geändert" würde
es aber reichen. So hatte ich deine Statistik jedenfalls verstanden.

aighes
-- 
View this message in context: 
http://gis.638310.n2.nabble.com/OSM-Statistik-gesucht-Editierfrequenz-von-Tags-tp5607138p5613112.html
Sent from the Germany mailing list archive at Nabble.com.

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-07 Diskussionsfäden Jochen Topf
On Thu, Oct 07, 2010 at 02:04:51PM -0700, aighes wrote:
> für solche Werte braucht man doch keine Datenbank. Die aktuelle
> Versionsnummer eines Elements findet sich doch im Planet-File (oder einem
> Extract). Daraus kann man das dann auch tag-spezifisch auswerten.

Das reicht nicht. Du weisst bei einer Änderung ja nicht, welche(s) Tag(s)
sich geänder hat oder vielleicht auch garkeins sondern nur die Position
eines Nodes.

Jochen
-- 
Jochen Topf  joc...@remote.org  http://www.remote.org/jochen/  +49-721-388298


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-07 Diskussionsfäden aighes

Hallo,
für solche Werte braucht man doch keine Datenbank. Die aktuelle
Versionsnummer eines Elements findet sich doch im Planet-File (oder einem
Extract). Daraus kann man das dann auch tag-spezifisch auswerten.
-- 
View this message in context: 
http://gis.638310.n2.nabble.com/OSM-Statistik-gesucht-Editierfrequenz-von-Tags-tp5607138p5613001.html
Sent from the Germany mailing list archive at Nabble.com.

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-07 Diskussionsfäden Jochen Topf
On Wed, Oct 06, 2010 at 03:43:29PM +0200, Christoph Wagner wrote:
> Wie häufig werden bereits existierende Informationen wieder verändert?

Nodes haben im Durchschnitt ca. 1.5 Versionen, Ways ca. 1.7 und Relations
ca. 3.5.

Feiner aufgeschlüsselt habe ich das nicht.

Jochen
-- 
Jochen Topf  joc...@remote.org  http://www.remote.org/jochen/  +49-721-388298


___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de



Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Walter Nordmann

joo, da haste - leider - recht :( ich hatte nicht an die history gedacht, die
ist in der 'simple' ja 
nicht drin.

dann bleiben ja wohl nur noch deine hstore-scripts über oder man erweitert
die von brett.

also mir wäre der ganze aufwand für "eine einfache auswertung" doch echt zu
groß.

gruss
walter

-
Wanderer, kommst Du nach Liechtenstein, tritt nicht daneben, tritt voll
hinein. - Ingo Insterburg
-- 
View this message in context: 
http://gis.638310.n2.nabble.com/OSM-Statistik-gesucht-Editierfrequenz-von-Tags-tp5607138p5609209.html
Sent from the Germany mailing list archive at Nabble.com.

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Peter Körner

Am 06.10.2010 21:39, schrieb Walter Nordmann:

schau dir mal osmosis 0.37 an (script-verzeichnis).
da ist hstore drin, und zwar direkt vom autor (brett)  :)
rennt bei mit seit 3 wochen. osm2psql ist - für mich - tot. und zwar
mausetot (drop database ...)


Die osmosis-Schemas können aber nicht mit mehreren Versionen für gleiche 
Objekte umgehen, dazu brauchst du ein anderes Schema und einen anderen 
Import-Prozess. Beides bietet das og. Plugin und dieser Teil sollte auch 
schon funktionieren.


Weitere Funktionen (minor-versions-builder, waynode-versions-builder, 
linestring-builder) funktionieren aber noch nicht.


Lg, Peter

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Johannes Huesing
Peter Körner  [Wed, Oct 06, 2010 at 09:17:24PM CEST]:
> Am 06.10.2010 17:08, schrieb Christoph Wagner:
> >Hat jemand ne Ahnung wie groß das Ding in ner Datenbank ist?
> >Müsste ich mir bestimmt ne neue Festplatte holen...
> ich denke ne 1TB Platte wird's schon werden müssen (Schätzung!)

Aussagekräftiges bekommt man dann auch in einer Stichprobe mit etwa 1 Prozent 
der Daten, zumindest über die häufigeren Tags.


-- 
Johannes Hüsing   There is something fascinating about science. 
  One gets such wholesale returns of conjecture 
mailto:johan...@huesing.name  from such a trifling investment of fact.  
  
http://derwisch.wikidot.com (Mark Twain, "Life on the Mississippi")

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Walter Nordmann

schau dir mal osmosis 0.37 an (script-verzeichnis).
da ist hstore drin, und zwar direkt vom autor (brett)  :)
rennt bei mit seit 3 wochen. osm2psql ist - für mich - tot. und zwar
mausetot (drop database ...)

gruss
walter

-
Wanderer, kommst Du nach Liechtenstein, tritt nicht daneben, tritt voll
hinein. - Ingo Insterburg
-- 
View this message in context: 
http://gis.638310.n2.nabble.com/OSM-Statistik-gesucht-Editierfrequenz-von-Tags-tp5607138p5608639.html
Sent from the Germany mailing list archive at Nabble.com.

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Peter Körner

Am 06.10.2010 17:08, schrieb Christoph Wagner:

Hat jemand ne Ahnung wie groß das Ding in ner Datenbank ist?
Müsste ich mir bestimmt ne neue Festplatte holen...

ich denke ne 1TB Platte wird's schon werden müssen (Schätzung!)


Was gibts so für Möglichkeiten/Tools, um das überhaupt in ne DB zu
bekommen? Geht da was mit osmosis?


Ich habe ein nicht-mal-halb-fertiges Plugin für Osmosis, das es dir 
erlauben sollte, ein simple-schema mit History-Informationen zu füllen:




Lg, Peter

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Christoph Wagner
Am 6. Oktober 2010 16:52 schrieb Sven Geggus :
> Christoph Wagner  wrote:
>
>> Wie häufig werden bereits existierende Informationen wieder verändert?
>> Gibt es Unterschiede zwischen den Tags?
>
> Full Planet dump geeignet in eine DB einlesen?
>
> Nur so eine Idee.
>

Hmm, habs schon befürchtet.
Hat jemand ne Ahnung wie groß das Ding in ner Datenbank ist?
Müsste ich mir bestimmt ne neue Festplatte holen...

Was gibts so für Möglichkeiten/Tools, um das überhaupt in ne DB zu
bekommen? Geht da was mit osmosis?
Hat das nicht schon jemand mal gemacht und braucht jetzt nur noch ne
Query loszulassen?
Die würde ich dann auch basteln helfen, wenn ich die Tabellenstruktur kenne.

Danke
Christoph

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


Re: [Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Sven Geggus
Christoph Wagner  wrote:

> Wie häufig werden bereits existierende Informationen wieder verändert?
> Gibt es Unterschiede zwischen den Tags?

Full Planet dump geeignet in eine DB einlesen?

Nur so eine Idee.

Gruss

Sven

-- 
"Das Einzige, wovor wir Angst haben sollten, ist die Angst selbst"
(Franklin D. Roosevelt)

/me is gig...@ircnet, http://sven.gegg.us/ on the Web

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de


[Talk-de] OSM Statistik gesucht - Editierfrequenz von Tags

2010-10-06 Diskussionsfäden Christoph Wagner
Hallo Liste,

ich weiß es gibt da draußen ein Haufen Statistiken über OSM, aber zu
folgender Problematik hab ich keine Informationen gefunden:

Wie häufig werden bereits existierende Informationen wieder verändert?
Gibt es Unterschiede zwischen den Tags?


Es gibt bisher immer nur Informationen über die Nutzer und wieviel die
so ändern und beitragen, aber nicht aus "Sicht der Daten".

Stelle mir da gerade eine Berechnung wie folgt vor:

Editierfrequenz = (Summe der Anzahl der Änderungen des Tags mit Key X)
/ ( (Summe der Lebensdauern von Key X an den jeweiligen Objekten)

Beispiel mit 3 Objekten. Es wird nur das highway-tag betrachtet und
die Zeit wird zur Vereinfachung in ticks angegeben.

Objekt 1:
nach 3 ticks hinzufügen von:
highway=residential
nach weiteren 4 ticks:
1. Änderung:
highway=service
nach 1 tick:
2. Änderung:
highway=living_street
10 ticks bis heute

Objekt 2:
nach 0 ticks:
highway=motorway
17 ticks bis heute

Objekt 3:
nach 0 ticks:
highway=unclassified
nach 7 ticks:
1. Änderung:
highway=road
nach 2 ticks:
2. Änderung:
highway=tertiary
nach 5 ticks:
3. Änderung:
löschung


Also:
3 Objekte, Insgesamt 5 Änderungen des highway-tags
Lebensdauer des highway-tags bei:
Objekt 1: 4+1+10=15 ticks
Objekt 2: 17 ticks
Objekt 3: 7+2+5=14 ticks

Editierfrequenz des highway-tags am Einzelobjekt:
Objekt 1: 2/15 Änderungen/tick
Objekt 2: 0/17 Änderungen/tick
Objekt 3: 2/14 Änderungen/tick

Mittelwert aller Änderungen pro Gesamtlebensdauer des Tags
(Editierfrequenz des Tags):
(2+0+2)/(15+17+14) = 4/49 Änderungen/tick

Und diese mittlere Editierfrequenz würde mich jetzt für die häufigsten
tagkeys der OSM-Datenbank interessieren.
Da würde dann so ne Statistik rauskommen:

highway: X Änderungen/Zeit
amenity: Y Änderungen/Zeit
...


Dafür müsste man allerdings erstmal die komplette OSM-historie in der
Datenbank haben und nen fetten Rechner der dann die Statistiken
rumrödelt.
Hab ich leider gerade nicht zur Hand.

Fragen an die Liste:
Hat jemand schonmal sowas in der Art gemacht? Gibt es vielleicht schon
fertiges Stats in der Richtung und ich habs nur nicht gefunden?
Findet ihr die Methode sinnvoll?
Kann mir jemand helfen sowas zu erstellen oder ist das eh
aussichtslos, weil die historie eh nicht so klar ist, bei den ganzen
API-Umstellungen?

Ich hätte sowas gerne für meine Diplomarbeit.
Ich arbeite an einem System, um OSM-Daten mit GPG zu signieren. Dabei
wäre es sehr hilfreich zu wissen, wie oft sich die Daten eigentlich
ändern.

Vielen Dank und Grüße aus Dresden
Christoph

___
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de