Bonjour,

Le 10/05/2021 à 16:27, Jean-Michel COSTE a écrit :
> Le 10/05/2021 à 08:48, Nicolas Abel a écrit :
>>  j'aurais besoin de*trouver les mots les plus fréquents* et de compter
>> le nombre d' occurrences.
> 
> Bonjour,
> 
> Si les chaînes de caractères contiennent plusieurs mots et Si tu ne sais
> pas par avance quels mots chercher/compter, les expressions régulières
> et les outils bash proposés par Bernard ne te seront d'aucun secours.
> 
> Et je ne vois pas d'outils simples pour réaliser ça....
> 
> Cordialement,
> 
J'ai trouvé cela si tu utilises Linux (je ne sais pas s'il y a
l'équivalent de sed sous windows...) :
https://unix.stackexchange.com/questions/2244/how-do-i-count-the-number-of-occurrences-of-a-word-in-a-text-file-with-the-comma
C'est la quatrième réponse qui détaille la méthode.

Il faut extraite la colonne que tu veux analyser et la copier dans un
fichier .csv puis y appliquer la commande suivante en la collant dans un
terminal :
sed -e 's/[^[:alpha:]]/ /g' ton_fichier.csv | tr '\n' " " |  tr -s " " |
tr " " '\n'| tr 'A-Z' 'a-z' | sort | uniq -c | sort -nr | nl
tu peut rediriger le résultat vers un fichier .txt en ajoutant à la fin
> decompte.txt
Et ça marche...

Amicalement,

Jean-Pierre Giraud

-- 
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Répondre à