Hallo Matija,

Matija Šuklje writes:

> Ich weiß nicht ob ihr's wüstet, aber Google Books macht — und veröffentlicht! 
> — auch n-grame für die Bücher die ihr gescant haben:
> 
> http://books.google.com/ngrams/datasets
> 
> Vielleicht würde das bei der Neo3 ja helfen...

Viele veröffentlichte n-Gramme haben als kleinstes Fragment ein ganzes Wort -
auch die von Google.
Bei den meisten Tastenbelegungen wird pro Tastendruck kein ganzes Wort, sondern
ein Buchstabe ausgegeben. Daher sind auch für Neo n-Gramme interessanter, die
als kleinstes Fragment ein Zeichen (statt ein Wort) haben.

Da die n-Gramme aus einem Textkorpus erzeugt werden können und ein Textkorpus
für die Überprüfung einer Tastenbelegung praktischer erscheint, sind
Textkorpusse für Neo viel interessanter als fertige n-Gramme aus nicht
reproduzierbarem Ursprung. Wenn ich mich richtig erinnere, mangelt es noch an
einem oder mehreren verfügbaren und uneingeschränkt nutzbaren großen
Textkorpussen. Bei meiner damaligen Suche danach, habe ich das Ziel nicht
erreicht. Oder haben wir inzwischen weitere Korpusse?

Mit netten Grüßen
Karl


Antwort per Email an