Hallo Chris,

Am 21.08.25 um 10:56 schrieb Chris K via Diskussion:
Um adäquate Statistiken (Bigramme, Trigramme) zu erhalten, für die dann optimiert wird, müsste man nicht alltäglichere Textquellen nehmen? So etwas wie (Kurz-)Nachrichten, und Posts und Kommentare in sozialen Medien, also z.B. Email, Slack, Teams, Mastodon, Youtube?

guter Punkt!

Ich denke dass es sich bei der Auswahl der Korpora und Sprachen um ein eigenes Thema handelt, da es hier bei der Sammlung der ngramme ja stark um die Gedankenpausen-Frage geht?

In diesem Sinne: Möchtest du deine Idee vllt. im Sinne von qwertfischs Vorschlag, die Betreffzeilen zu beachten, nochmal als neues Thema starten?

Viele Grüße,

Jakob

_______________________________________________
Diskussion mailing list -- [email protected]
To unsubscribe send an email to [email protected]

Antwort per Email an