On Sun, Aug 24, 2008 at 06:55:36PM +0200, Tobias Wendorff wrote:
Ich habe den Kern für einen neuen Namefinder entwickelt (Source-Code in meinem Arch-Repository [1] unter osmsearch--devel--0.1), muß mich aber jetzt erstmal um andere Dinge (Studium, Geld verdienen) kümmern und kann deshalb nur noch selten dran arbeiten.Wird derzeit an einem neuen Namefinder geschrieben?
Du kannst gerne versuchen, das mit einzubauen. Achte allerdings auf den Speicherverbrauch: Der ist derzeit bei ca. 500MB für die Namen (+8GB virtuell für die Datenbank mit Ort+Typ). In einer ersten Implementierung habe ich std::vector<string> verwendet, das hat zu 1.3GB für die Namen geführt - und das war nur die lineare Abspeicherung für die Substring- und Regex-Suche, keine Hashtabellen für die exakte Suche (die von den jetzigen 500MB den größten Teil ausmachen). Lange Rede kurzer Sinn: Es ist sehr leicht, bei Daten in diesen Größenordnungen (160MB allein nur für die Namen, ohne IDs, Pointer etc.) den Arbeitsspeicher zu füllen, insbesondere auf AMD64 (8 Byte/Pointer). Der muß aber unbedingt ausreichen (Platte ca. Faktor 100 langsamer). Eine phonetische Suche wäre sehr interessant, bin schon gespannt drauf. :) Wäre natürlich erstmal wichtiger, das Frontend zu schreiben, damit der Namefinder überhaupt benutzbar wird. Aber lieber ein Modul für phonetische Suche schreiben als überhaupt nichts daran machen - wenn der Suchkern tolle neue Sachen kann, ist auch der Anreiz höher, das Frontend zu schreiben und es findet sich dann vll. jemand, der das macht.Ich habe gerade sehr erfolgreich mit Phonetik und Fuzzy-Suche experimentiert und kann meine Ideen vielleicht einfließen lassen.
[1] http://sascha.silbe.org/arch/[EMAIL PROTECTED] CU Sascha -- http://sascha.silbe.org/ http://www.infra-silbe.de/
signature.asc
Description: Digital signature
_______________________________________________ Talk-de mailing list Talk-de@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-de