Liebe Tastaturbegeisterte,

Ich habe das Analyseskript fertiggeschrieben und möchte meine Resultate mit euch teilen! Davor kurz der Kontext:


   Wieso Ngram-Dauer messen?

Dieses Thema kam durch die Frage auf, ob & wie Punkt und Komma bei der Berechnung eines neuen Layouts optimiert werden sollten. Wichtig ist hier hervorzuheben, dass das zwei unterschiedliche und teils unabhängige Fragen sind!


     Frage 1: Sollte man Punkt & Komma optimieren?

Das ist eine eher theoretische Frage: *Denken wir, dass die alten QWERTZ-Positionen für Punkt & Komma tatsächlich die bestmöglichen sind?* Gibt es etwas an diesen Positionen, das besonders für Punkt & Komma zugeschnitten ist?

 * *Falls ja,* dann sollte man Punkt & Komma fixieren und vergessen.
 * *Falls nein,* dann sollte man Punkt & Komma mitoptimieren. Aber was
   gibt es bei deren Optimierung zu bedenken? Hier setzt mein Skript an.


     Frage 2: Wie sollte man Punkt & Komma optimieren?

Die grundsätzlich berechtigte Sorge: Es könnte sein, dass Punkt & Komma den Anfang einer Gedankenpause darstellen. Deshalb könnte es sein, dass Trigramme, die mit Punkt/Komma beginnen, grundsätzlich nicht (oder nur selten) schnell getippt werden. Deshalb könnte es überflüssig / kontraproduktiv sein, sie mitzuoptimieren.

Daher die Frage: Gibt es diese langsamer getippten Gedankenpausen?


   Gedankenpausen messen → Ngram-Dauer

Stellen folgende Trigramme Gedankenpausen dar?
(Teilweise wird Shift verwendet, da wir Großbuchstaben erwarten)

 * /Punkt→Enter→Shift/
 * /Punkt→Leerzeichen→Shift/
 * /Komma→Leerzeichen→Shift/
 * /Komma→Leerzeichen→Buchstabe/

Diese Gedankenpausen sollte man unter anderem daran erkennen, dass diese Trigramme langsamer getippt werden. Deshalb habe ich einen Keylogger geschrieben, mit dem man Trigrammdauer messen kann.


   Resultate

Zwei Leute haben mir dazu Daten zukommen lassen, vielen Dank dafür! Ihre und meine Daten sind hier zu finden: https://github.com/Glitchy-Tozier/neo_ngram_duration_logger/tree/main/collected_durations_anon

*Gesammelter Plot*: https://github.com/Glitchy-Tozier/neo_ngram_duration_logger/blob/main/plots/grouped_duration_comparison.png

*Plot, aufgespalten nach Datenspender*: https://github.com/Glitchy-Tozier/neo_ngram_duration_logger/blob/main/plots/split_duration_comparison.png

Wir sehen im gesammelten Plot:

 * Vor allem /Punkt→Enter→Shift/ wird langsamer getippt
 * Alle anderen Trigramme werden im Durchschnitt etwa gleich schnell
   getippt

Da "J" um einiges mehr Daten gespendet hat als ich ("F") und "U", sind die gesammelten Resultate etwas in Richtung seines Schreibstils verzerrt. Deshalb habe ich auch einen nach Datenspender aufgeteilten Plot generiert.

Im aufgesplitteten Plot sehen wir ein gemischtes Muster:

 * Je nach Datenquelle werden
   /Punkt→Leerzeichen→Shift, Komma→Leerzeichen→Shift /und
   /Komma→Leerzeichen→Kleinbuchstabe /im Durchschnitt etwa gleich
   schnell ODER etwas langsamer als /3xBuchstabe/ getippt.
 * Teilweise gibt es auch hier Varianz. Bei "U" und "J" wird
   /Komma→Leerzeichen→Kleinbuchstabe/ gleich schnell getippt wie
   /3xBuchstabe/; nur "F" tippt diese Kombination langsamer als
   /3xBuchstabe./
 * Der eine starke Kontrast bleibt /Punkt→Enter→Shift/.


   Meine subjektive Interpretation:

Würde ich ein Layout optimieren, so würde ich momentan wie folgt vorgehen:

 * /Punkt→Leerzeichen→Shift, Komma→Leerzeichen→Shift /und
   /Komma→Leerzeichen→Kleinbuchstabe/ sind je nach Benutzer auf
   /3xBuchstabe/-Niveau oder etwas langsamer. Hier könnte man im Korpus
   die Häufigkeit dieser Trigramme leicht reduzieren ... oder sie
   unberührt lassen. Hier habe ich keine starke Meinung, würde aber
   eher zu "unberührt lassen" tendieren.
 * /Punkt→Enter→Shift/ stellt mMn eine klare Gedankenpause dar. Hier
   würde ich zu einer Häufigkeitsreduktion dieser Trigramme im Korpus
   tendieren. Ich würde sie jedoch nicht vollständig ausmerzen, um
   zumindest eine gewisse Tippflüssigkeit zu erhalten.
     o → Die Häufigkeit z.B. halbieren oder sogar vierteln
 * 2-Gramme und vor allem 1-Gramme würde ich tendentiell nicht
   verändern, da sie eher Tipphäufigkeit und nicht so sehr
   Tippflüssigkeit darstellen.

Pointierte Zusammenfassung eines Freundes: "Absätze sind also die wahren Gedankenpausen"


Das waren vorerst was ich dazu zu sagen habe. Mich würde interessieren, was ihr euch denkt.

Liebe Grüße,
Florian


On 22/02/2026 11:17, Florian Thaler wrote:

Liebe Leute,

Ich habe bis jetzt gebraucht (ich war eine Weile ziemlich krank), jetzt konnte ich mich aber endlich dransetzten, ein Analyseskript zu schreiben! Es ist noch in Arbeit, im Anhang habe aber ich einen Graphen zur Vorschau angehängt.  :)

Bitte darum, dass alle Leute, die Daten gesammelt haben, sie mir zu schicken! Bitte...
1. Die generierten Files
2. Das verwendete Layout
3. (Falls klar vorhanden) in welchem Kontext hauptsächlich getippt wurde
4. Ob ich die Daten auch auf GitHub veröffentlichen darf
5. Was auch immer sonst noch relevant erscheint.

(Und danke an die Person, die bereits Daten beigesteuert hat!)

Liebe Grüße,
Florian
_______________________________________________
Diskussion mailing list -- [email protected]
To unsubscribe send an email to [email protected]

Antwort per Email an