Hallo Matija, Matija Šuklje writes:
> Ich weiß nicht ob ihr's wüstet, aber Google Books macht — und veröffentlicht! > — auch n-grame für die Bücher die ihr gescant haben: > > http://books.google.com/ngrams/datasets > > Vielleicht würde das bei der Neo3 ja helfen... Viele veröffentlichte n-Gramme haben als kleinstes Fragment ein ganzes Wort - auch die von Google. Bei den meisten Tastenbelegungen wird pro Tastendruck kein ganzes Wort, sondern ein Buchstabe ausgegeben. Daher sind auch für Neo n-Gramme interessanter, die als kleinstes Fragment ein Zeichen (statt ein Wort) haben. Da die n-Gramme aus einem Textkorpus erzeugt werden können und ein Textkorpus für die Überprüfung einer Tastenbelegung praktischer erscheint, sind Textkorpusse für Neo viel interessanter als fertige n-Gramme aus nicht reproduzierbarem Ursprung. Wenn ich mich richtig erinnere, mangelt es noch an einem oder mehreren verfügbaren und uneingeschränkt nutzbaren großen Textkorpussen. Bei meiner damaligen Suche danach, habe ich das Ziel nicht erreicht. Oder haben wir inzwischen weitere Korpusse? Mit netten Grüßen Karl