Am 19.09.2011 20:16, schrieb Martin Koppenhoefer:
Am 19. September 2011 19:34 schrieb Christian Müller<cmu...@gmx.de>:
Am 16.09.2011 11:16, schrieb Martin Koppenhoefer:
Du täuschst Dich hier. Siedlungsstellen lassen sich nicht automatisch
errechnen, weil die Informationen dazu fehlen. Bei den landuses - so
man sie alle erfasst hat - sind die benötigten Informationen hingegen
vorhanden. Daher geht es da.
-1  Das ist, sorry, absoluter Unfug.

/Erstens/ sind die benötigten Informationen für die Siedlungsstellen
existent, wenn landuses komplett erfasst sind.
Du willst es nicht verstehen. Es ist nicht klar, zu _welcher_
menschlichen Siedlung sie gehören. Das ist das Problem, nicht, ob sie
besiedelt sind.

Natürlich ist das klar - anhand der Gemeinde, bzw. Gemarkungsgrenze, innerhalb derer die landuses liegen. Im allgemeinen umfassen politische Grenzen einer Gemeinde einen größeren Bereich, mindestens aber den Bereich der Siedlung.

Selbst wenn eine politische Grenze aktuell nicht mehr zu finden ist, wird es eine historische geben, die für die Ermittlung benutzt werden kann.

Die Information einer Siedlungsflächengrenze ist damit klar redundant [[denn es gibt Regeln, mittels derer sie sich ausrechnen lässt]]. Ich vertrete aber die Auffassung, dass diese Regeln nicht außerhalb der DB stehen sollten.

Schließlich ist sie über eine Relation innerhalb OSM effizient pro Fall abbildbar. In gewisser Weise steckt Redundanz dann nur dadurch in der DB, dass die Regel mehrmals angewandt wird. Das hat aber eben auch den Vorteil, dass Ausnahmen ohne weiteres abbildbar sind.

Bisher standen dazu in unserer Debatte zwei Realisierungen zur Auswahl: a) Erfassung über (wiederbenutzte) Flächengrenzen b) Erfassung über Sammelrelation aller Teilflächen der Siedlungsfläche. b) hat klare Nachteile gegenüber a), siehe Datenhaltungsmail.

Das ist alles nur Wiederholung, siehe frühere mails..


/Zweitens/, kannst Du aus einem Netz MICROgemappter Flächen _nicht_ oder nur
mit sehr hohem Aufwand (sprich komplexe, regelbasierte Algorithmen) sinnvoll
auf ein Netz grobgranularer Flächen schließen.

So kompliziert ist das nicht.

Du lehnst Dich hier viel zu weit aus dem Fenster. /Wie/ kompliziert das werden kann, überblickst Du gar nicht. Ich überblicke das auch nicht, behaupte aber auch nicht, dass ich das könnte.


Der immense Vorteil ist aber dabei, dass
alle Informationen vorliegen und ich selbst entscheide, was für mich
unwesentlich ist, und was nicht.

Ich lese nur /ich/ in deinen Sätzen. So funktioniert OSM nicht. Um /als Datennutzer/ entscheiden zu können, was für mich wesentlich ist, muss ich aus einem Angebot /wählen/ können. /Du/ bist hier gerade derjenige der einem dieses Angebot vorschreiben will, weil /Du/ der Meinung bist, dass ein Salat aus MICROgemappten Flächen ausreiche, um sich alle erdenklichen gröberen Fälle auszurechnen.

Umgekehrt muss ich /als Mapper/ /wählen/ können, auf welcher Ebene ich Informationen zum Projekt hinzufüge. Nicht jeder hat die Muse, deinen Vorstellungen von Größen, die "nicht weiter teilbar" sind, nachzukommen. Solche Leute dürfen dann keine Flächennutzung mehr erfassen, oder wie? Und der nächste MICROmapper, der kommt, und das Gebiet der Forstwirtschaft dann "parzelliert" zerstört die Arbeit des MACROmappers - weil eben das Gebiet der Forstwirtschaft _nicht_ notwendigerweise, wie Du schreibst, aus Mini-Parzellen zusammensetzbar ist.

Ich bin der Meinung, dass Du immer noch nicht durchdacht hast, welche wirklichen Konsequenzen deine Streichung von "überwiegend" aus der Definition zur Flächennutzung hat. Nochmal, wenn Du die "reine" statt überwiegende Flächennutzung erfasst, heißt das für Dich und alle, die Du damit begeistern willst:

    a) Erfassung aller erdenklichen Flächennutzungen einer Fläche
b) Unterteilung der vorhandenen Fläche in kleinste Einheiten, die eine __eindeutige__ Erfassung der Flächennutzung ermöglichen

Ich bitte Dich nochmals, mitzudenken: Eine Fläche beliebiger Größe kann _immer_ nochmal geteilt werden, um die Flächennutzung genauer zu erfassen: Selbst für einen Acker funktioniert das: linienschmale Flächen werden z.B. als Furche des Ackers genutzt.

Bist Du allen Ernstes der Aufassung, dass aus diesen kleinsten, MICROgemappten landuses, sich _jeder_ diese gröberen Gebiete aus einem komplexen Regelset "zusammenbauen" will? Die Regel für den Acker wäre dann:

Gruppiere alle Furchen, um das Gebiet des Ackers zu erhalten. (Total einfach! Da braucht man doch die überweigende Nutzung der Gesamtfläche als Acker gar nicht erfassen..)

Ganze Softwareprojekte würden sich dann damit beschäftigen, Regelwerke zu pflegen, weil /Du/ der Auffassung warst, dass die Gruppierung feingranularer Strukturen in "gröbere" ja ein Kinderspiel sei (es aber schon für die Berechnung der Siedlungsflächengrenze verneinst!).


  Es geht nämlich nicht nur um die
Flächengröße sondern auch um die Art der Nutzung. Eine kleine aber
extreme Nutzung ist für bestimmte Fragestellungen interessant. Wenn
man alles vermanscht, fehlen die Infos nachher.

Gerade ein Flächennetzwerk erlaubt, was jetzt nicht möglich ist: Extreme Nutzungsänderungen für kleine Gebiete zu erfassen, ohne dabei das gröbere Gebiet zu zerstören. /Ob/ die extreme Nutzungsänderung interessiert oder nicht, bestimmt

    bei der Erfassung:  der/die MapperIn
    bei der Nutzung:  der Datennutzer

und nicht /eine/ /einzige/ Person. Momentan gibt es kein Flächennetzwerk der Bodennutzung und wenn es existiert, dann an lokalen Stellen, wo Mapper das Problem erkannt, aber dessen Lösung nicht publiziert haben (Wiki, Mailingliste). Das bedeutet:

MICROmapper X kommt, mappt die grob erfasste Bodennutzung von MACROmapper Y neu und die (sinnvolle!) Gruppierungsinformation ist verloren. Y kann sich ja sein Zeug, aus den neuen Flächen schon irgendwie errechnen --> Super Einstellung, so macht zusammenleben und -mappen Spaß..

Dann sollten wir das aber auch für die Siedlungsfläche so handhaben. Schließlich kann sich auch Mapper Martin aus den MICRO-landuses innerhalb irgendeiner politischen Grenze den landuse=settlement zusammenrechnen.. Oder wollen wir für manche gröbere landuses ein paar Ausnahmen schaffen?

Das ist alles vergebene Liebesmüh, denn wir haben schon festgestellt:

    Der Mapper bestimmt, /was/ /wie/ gemappt wird.
    Der Nutzer bestimmt, /was/ er davon haben will.

Ohne irgendwelche Verbote, kann OSM elegant beides bedienen, indem einfach der Fakt anerkannt wird, dass auch bei der "überwiegenden realen Bodennutzung" Beziehungen zwischen den Einzelflächen bestehen und sich Bodennutzungsflächen durchaus überlappen können. Die Erfassung der Bodennutzung muss nicht disjunkt erfolgen, das wäre eine Forderung nach _unmöglicher_ Pedanterie.

Beispiele: Ein Gebiet wird überwiegend für das Wohnen verwendet, wir erfassen es als landuse=residential. Außerdem gibt es eine kleine Stelle innerhalb des Wohngebietes, wo die Flächennutzung "extrem" (was extrem ist, ist auch Ansichtssache) schwankt, wir erfassen also landuse=residential.

Was bedeutet das? Ich habe eine Information, mit der ich ein großes Gebiet klassifizieren kann "_überwiegend zum wohnen verwendet_". Wenn mich nur dieses Gebiet interessiert, interessiert es mich nicht, ob und wieviele extreme Nutzungsänderungen innerhalb winziger Teilflächen dieses Gebietes stattfinden. Gleichfalls muss ich den Fakt anerkennen, dass sich andere evtl. für eine detailierte Flächennutzungsaufteilung interessieren. Gleichfalls müssen die, welche die detailierte Flächennutzungsaufteilung interessiert, anerkennen, dass es Leute gibt, die sich für gröbere Strukturen interessieren, für die es also vernachlässigbar ist, dass es extreme Nutzungsänderungen innerhalb eines Gebietes gibt.

OSM kann beide Welten problemlos verbinden, indem Flächengrenzen als /way/ und Flächen als /multipolygon/ erfasst werden. Dann lassen sich Flächen beliebiger Strukturgröße nach bestem Wissen und Gewissen durch Mapper bilden, ohne dass ein Mapper einem anderen Mapper /seine/ Vorstellung von "einer" "wahren" Flächengröße aufdrücken muss. Es gibt nicht die "wahre" Flächen, bzw. Strukturgröße, auf der Daten erfasst werden, sondern ein Spektrum, dass von der Größe eines Kontinents bis zur Größe eines Wegweisers reicht.

Solange Du behauptest, dass man "nur" Bodennutzungen MICROmappen müsste, um alle glücklich zu werden, verschiebst Du die Diskussion, die wir /hier/ führen, einfach nur in einen /anderen/ Größenbereich, um sie dort zu wiederholen.

==> Eventuell triffst Du dort dann NANOmapper, der Dir erklärt, dass es Unfug ist, landuse=* MICRO zu mappen, weil MICROgemappte landuses ja ohne Probleme aus NANOgemappten errechenbar seien..


Natürlich kann ich nur politische Gemeindegrenzen innerhalb der DB pflegen
und dann extern die Bundesgrenze ausrechnen.  Das machen wir aber eben
nicht, weil die Vorteile einer expliziten Erfassung innerhalb der DB (mit
Bezügen der Grenzen untereinander) klar überwiegen!

+1
daher sind Siedlungen auch besser nicht die Summe verschiedener
Landuses sondern ein extra Polygon.

Genau hier musst Du weiterdenken.. Das ist nicht die ganze Wahrheit, denn die _gleiche_ Argumentationsweise, die Du verwendest, um Dich gegen die automatische Errechenbarkeit einer Siedlungsflächengrenze zu wehren, zählt auch, wenn ich behaupte, dass der landuse=* eines Forstwirtschaftsgebiet aus seinen MICRO oder NANOgemappten Teilnutzungen _nicht_ errechenbar ist, sondern über "ein extra Polygon" (multipolygon) erfasst werden soll.

Egal ob das gröbere Gebiet nun eine Siedlung darstellt, oder ein Forstwirtschaftsgebiet - weshalb sollten gröbere Gebiete jedes Mal, wenn ein Nutzer sie braucht, berechnet werden?

Wenn ich weiß, welche Wege zu einer Radroute gehören, kann ich mir das auch jedes Mal aus OSM-Daten ausrechnen. Das brauche ich aber nicht, denn das Ergebnis dieser Rechnung ist Teil der Realität und damit Teil von OSM (vorgehalten durch eine type=route Relation).

Falls man das Argument der Errechenbarkeit zu Ende denkt, kommt man darauf, dass es eigentlich reicht, nur die nodes zu erfassen. Alles andere lässt sich doch, entsprechendes externes Wissen vorrausgesetzt, auch extern ausrechnen..


Betrachte bitte die Relationen in OSM.  Beziehungen zwischen den Daten sind
nicht immanent und einfach so da!

doch, die Lage ist einfach so da, genauso wie die Größe einer Fläche,
oder was innerhalb und ausserhalb einer Fläche liegt, bzw. welche
Flächen sich schneiden. Da musst Du z.B. nicht noch die Flächengröße
dazuschreiben, auch wenn manche das trotzdem machen.

Ja, was denkst Du wohl, weshalb einige die Flächengröße dranschreiben? Weil die Ermittlung des Ergebnisses wesentlich aufwendiger sein kann, als einfach diesen Wert nachzuschlagen.

Die Lagebeziehung zwischen zwei Flächen ist _nicht_ einfach so da! DU, als Mensch, kannst zwei Polygone zeichnen und dann sagen, das eine liegt innerhalb des anderen oder meinetwegen auch, die beiden Polygone schneiden sich. Das kannst DU, als Mensch, recht schnell für kleinere Polygone tun, aber auch nur dann, wenn Du eine visuelle Darstellung der beiden Polygone vor Dir hast.

Für eine Maschine ist die Lagebeziehung der beiden Polygone solange nicht gegeben, wie Du sie nicht explizit angibst (in Bezug setzt, eine Relation erstellst) __oder__ durch ihre Koordinaten errechnest. Das kann, in Abhängigkeit der Menge der Polygone, die in Bezug zu setzen sind, und ihrer einzelnen Größen sehr schnell sehr aufwendig werden.

Deine Aussage, dass irgend zwei "closed ways" automatisch eine immanente Beziehung zueinander in der DB hätten, ist also schlichtweg falsch. Die Beziehung ist nicht immanent, sonder maximal "ermittelbar".

Beziehungen zwischen Objekten innerhalb einer DB sind _nicht_ einfach so da. Sie müssen definiert werden (entweder durch Algorithmen, die Bezüge ermitteln, oder durch Datenstrukturen, die Bezüge speichern/vorhalten).

Immanent in der DB sind grundsätzlich ersteinmal nur die Beziehungen zwischen

    node - lat,lon pair
    way - node list
    relation - way or node
    relation - relation

Eventuell noch, aber da wird es schon wackelig: closed way - area Eine echte area (Flächentyp) kennt die DB überhaupt nicht! Wie willst Du da behaupten, dass Flächenbeziehungen untereinander immanent wären?

Einem multipolygon z.B. sind die Beziehungen zwischen seinen innliegenden Polygonen und dem außenliegenden Polygon "immanent". Das ist aber gerade, wovon ich rede: Generell Flächen als multipolygon zu erfassen, weil damit (einige) Flächenbeziehungen immanent gegeben wären. Das ist bis jetzt keine durchgängig angewandte Praxis (von politischen Grenzen, auf die Du dich _nicht_ beschränkt hast, einmal abgesehen).


Was aber nicht passieren darf (!), ist, dass sich unter den Render-Regeln,
Regeln befinden, wie Daten der Realität gruppiert werden, die schon in der
Realität gruppiert werden.
Die Renderregeln leisten das: Daten selektieren und ggf. gruppieren.

Der letzte Teilsatz war wichtig - ich schrieb ihn nicht zum Spaß. ", die schon in der Realität gruppiert werden."

Das schließt eine ganze Menge an Renderregeln aus.

/Falls/ Renderregeln Daten der Realität auf eine Art und Weise gruppieren, so dass die Selektion, die der Renderer da tätigt, einer Selektion/Gruppierung gleicht, die bereits Teil der Realität ist, dann hat diese Gruppierungsregel _nichts_ in den Renderregeln verloren.

Das Ergebnis der Gruppe sollte _dann_ stattdessen als Relation innerhalb der OSM-DB existieren. Idealerweise sind Renderregeln reine Layout-Regeln, es wird also nur des Layouts wegen gruppiert und nicht, wenn Daten schon in der Realität gruppiert (lies: in Beziehung gesetzt) werden. Letzteres ist Teil von OSM. Beispiel:

    Es gibt mehrere Buslinien innerhalb eines Netzwerks.
Der Renderer gruppiert sich diese Buslinien anhand des network-Tags, um dann einen Stil zu definieren. Diese Gruppierung gibt es aber schon in der Realität, es wäre also besser, das Netzwerk in OSM abzubilden:
        Relation type=network ...  mit den Buslinien als Mitglieder.
    .. und als Renderregel den Stil für das network festzulegen.

Als Richtlinie kann man sich evtl. merken: Solange eine Renderregel /selektiert/, ist alles in Ordnung. Sobald eine Renderregel /gruppiert/, muss man sich als Layouter die Frage stellen, ob die Gruppierung _wirklich nur_ für Layoutzwecke stattfindet, _oder_ nicht evtl. ein Workaround um eine fehlende Relation in OSM ist.


folgendes:
    - ein Renderer gruppiert sich die Elbe-Radroute aus den Wegen der DB auf
die eine Art
    - der nächste auf eine leicht andere Art
sorry, aber irgendwo haben Vergleiche auch ein Ende, und ein linearer
Radweg ist schlecht mit dem Problem hier vergleichbar.

Ich seh' schon - Du bist jemand, der nicht zwischen Radweg und Radroute unterscheidet. Dann trifft der Vergleich natürlich auch nicht ins Schwarze.

Und nein, Vergleiche müssen nicht /irgendwo/ ein Ende haben, sondern dort, wo sie nicht mehr zutreffen.

        Eine Radroute aus /ways/ in den Rollen 'Teilabschnitt' zu bilden.
ist vergleichbar mit
        Eine Fläche aus /ways/ in den Rollen 'Flächengrenze' zu bilden.

Wenn die Radroute ein Rundkurs ist, werden beide Sachverhalte sogar auf identische Weise abgebildet:

Die Relation enthält dann in beiden Fällen aneinandergeschlossene Wegsegmente. Es nehmen nur solche Wegsegmente Teil, deren Endpunkte auch Anfangspunkte eines anderen teilnehmenden Wegsegmentes sind.

Ob das ganze als Route oder Fläche interpretiert wird, entscheiden dann nur noch die Relations-Tags..


"richtig" im Sinne der Frage, ob die entstehende Gruppierung eine Abbildung
der Realität ist [...]
wie Frederik schon treffend sagte: um richtig und falsch geht es
nicht, in jedem Fall machen wir hier ein Modell der Welt, das man
nicht mit der Welt verwechseln sollte.

+1    "richtig im Sinne der Frage, ob [...] eine Abbildung der Realität ist"

"richtig" beschäftigt sich mit der Realitätstreue des Modells.. Ist die Abbildung gut oder wird unzulässig abstrahiert, etc.

Wenn ein Sachverhalt im Bezug auf das Modell "falsch" ist, aber in der Realität existent, stellt sich die Frage, inwieweit das Modell angepasst werden muss...


  M.E. geht es in der Diskussion
hier darum, herauszufinden, wie unser Modell am besten abbilden
sollte, dass:

- es Verwaltungseinheiten und dazugehörige Verwaltungsgrenzen gibt,
- es davon unabhängig Siedlungen und Teile davon gibt,
- dass jedes Stück Land irgendwie genutzt wird, oder eben nicht

+1  Wenn Du aber dogmenartig am "Modell" hängst, wird daraus Mist.

Du musst nicht nur herausfinden, wie die Realität in das Modell passt. Du musst auch prüfen, ob das Modell überhaupt geeignet ist, deine genannten Aspekte der Realität zu erfassen. Das ist eine Arbeit von zwei Seiten. OSM nutzt ein evolutionäres Datenmodell, sprich, ein Datenmodell, das sich fortentwickelt. Es ist keine Vorschrift des Projektes, dass der _jetzige_ Stand des Datenmodells für immer und ewig aktueller Stand bleibt.

Es gibt viele Stellen, an denen sich das Datenmodell bewiesen hat (true and tested). An denen ist es schwer Argumente für eine Änderung zu finden, weil die Argumente ja aufzeigen müssten, wie etwas, dass sich bewiesen hat, noch besser geht. Es gibt aber auch (nicht wenige) Stellen, an denen es einfach nur Mist ist, weil Struktur fehlt, weil Dinge vermischt werden, die in der Realität ausdifferenzierbar sind, etc.

OSM kann die Realität nicht abbilden, ohne zu strukturieren. Es ist ein klares Strukturierungsprojekt. Mischmasch, Brei und Chaos sind auch Teile der Realität, die werden in OSM durch die Änderungsrate eines Gebietes abgebildet: Ein Mapper, der mit der bestehenden Ausdifferenzierung eines Gebietes nicht zufrieden ist, "strukturiert das Gebiet um". I.d.R. erhöht er dabei Genauigkeits-, Detail- und Strukturierungsgrad. Die Änderungsrate eines Gebietes erfasst in OSM auch jenes Chaos der Realität, welches durch permanente Gebietsumgestaltungen des Raumes (etwa in Städten) entsteht.


weiterhin wären noch jede Menge andere Betrachtungsweisen denkbar
(aber nicht alle sinnvoll in OSM aufgehoben), z.B. die Bodenbedeckung,
die Vegetation, der Feuchtigkeitsgehalt des Bodens, das Klima, der
geologische Untergrund, die Bebauungstypologie, die Einwohnerdichte

+1 genau. OSM lässt sich für diese Anwendungsfelder öffnen. Das ist aber m.E. erst dann sinnvoll, wenn die Grundlage stimmt:

    Bessere Unterstützung für Flächenerfassung in Editoren
Multipolygone für die Zusammenarbeit von Makro-, Micro- und Nanomappern (Flächennetzwerk..) Dokumentation und schlüssige Definition im Wiki, wie Tags Verwendung finden

=Zukunftsmusik===========
Damit kann dann auch eine echte Zusammenarbeit zwischen Laie und Spezialist klappen, ohne dass sich beide gegenseitig die Arbeit zerstören, oder ein Disput enststeht, wo eine Fläche erfasst werden "darf" und wo nicht. Die Chancen sind groß, dass damit auch die bestehende Datenqualität erhöht wird und OSM zu dem Wiki ortsbezogener Information wird.

Es ist dann z.B. auch echt diskutierbar, /welche/ Flächengrenzen zusammenfallen und welche nicht. Man unterhält sich dann also nicht mehr über die Datenhaltung, ob Flächen zusammengepappt werden dürfen, oder an Wege geklebt, oder sonstwas, sondern um echte fachliche Fragen - welche Spezialgebiete brauchen ein eigenes Flächennetzwerk, welche können sich eins mit anderen Spezialgebieten teilen. Welche Beziehungen gibt es zwischen diesen entstehenden Flächennetzwerken, etc. Auf diesem Wege kann OSM helfen Zusammenhänge zu entdecken, die bisher nicht entdeckt werden, weil die Datenbasen von Spezialisten getrennt voneinander gepflegt werden.
=Ende Zukunftsmusik===========

Momentan würde ich mich auf den Bodennutzungsaspekt beschränken. Wenn es dafür nicht gelingt, alle Ansprüche unter einen Hut zu bringen, braucht man nicht weiter träumen. Ohne irgendeinen Bezug (und damit die Möglichkeit der Zusammenarbeit untereinander) zwischen Flächen wird es nicht gehen. Wenn wir da weiter mit "closed ways", "overlapping ways", geklebten ways, dicht nebeneinanderliegenden doppelten ways, etc. rummanschen und jeder sein eigenes Süppchen kocht, bleiben Sinnzusammenhänge der Daten für/in OSM verborgen. Diese dann herzustellen, bleibt individuelle Aufgabe für clevere Algorithmenschreiber, die aus dem Rausch-Salat ein bisschen Signal herausholen.

Ich komme nochmal auf die Radrouten-Analogie zurück:

Aus dem Schatz _aller_ Wege innerhalb OSM (abzüglich derer, wo das Radfahren verboten ist), können Wege ausgewählt werden, um eine Route zu bilden. (Route - Relation mit type=route)

Die Analogie für Flächen dazu: Aus dem Schatz _aller_ Wege innerhalb OSM, können die Wege ausgewählt werden, die eine Fläche begrenzen. (Multipolygon - Relation mit type=multipolygon)


Späten Gruß
Christian

_______________________________________________
Talk-de mailing list
Talk-de@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-de

Antwort per Email an