Hallo Chris,
Am 21.08.25 um 10:56 schrieb Chris K via Diskussion:
Um adäquate Statistiken (Bigramme, Trigramme) zu erhalten, für die dann
optimiert wird, müsste man nicht alltäglichere Textquellen nehmen? So
etwas wie (Kurz-)Nachrichten, und Posts und Kommentare in sozialen
Medien, also z.B. Email, Slack, Teams, Mastodon, Youtube?
guter Punkt!
Ich denke dass es sich bei der Auswahl der Korpora und Sprachen um ein
eigenes Thema handelt, da es hier bei der Sammlung der ngramme ja stark
um die Gedankenpausen-Frage geht?
In diesem Sinne: Möchtest du deine Idee vllt. im Sinne von qwertfischs
Vorschlag, die Betreffzeilen zu beachten, nochmal als neues Thema starten?
Viele Grüße,
Jakob
_______________________________________________
Diskussion mailing list -- [email protected]
To unsubscribe send an email to [email protected]