[HS] Re: [HS] A la recherche d'un encodage
Le Fri, May 29, 2020 at 02:44:12PM +0200, Fabrice Delvallée a écrit : > > PS: j'utilise pas google :p J'évite aussi Google autant que possible... DuckDuckGo a une syntaxe très pratique qui fait que quand on ajoute !g dans le champ de recherche on renvoie la recherche chez Google. C'est pratique quand DuckDuckGo a fait choux blanc. https://duckduckgo.com/bang Bonne journée, -- Charles Plessy Akano, Uruma, Okinawa, Japon
Re: [HS] A la recherche d'un encodage
salut, autre façon de faire: * j'ai demandé le fichier source à Fabrice * j'ai vu que ca contenait un __MACOSX du coup icon -l|grep -iMAC .. essayons MACINTOSH .. iconv -f MACINTOSH -t utf-8 fichier.txt bingo ... par contre ca contient des ^U pour préfixer les urls donc iconv -f MACINTOSH -t utf-8 fichier.txt | tr -d "^U" > final.txt (le ^U s'obtient en tappant ctrl-v ctrl-u) hth marc
Re: [HS] A la recherche d'un encodage
Bravo Merci beaucoup PS: j'utilise pas google :p Le 29/05/2020 à 14:17, Charles Plessy a écrit : https://www.google.com/search?q="ç; "8d" "é" "8e" À la deuxième page, bingo:) http://www.columbia.edu/kermit/mltbl.html Amicalement, Charles -- Charles Plessy Akano, Uruma, Okinawa, Japon
Re: [HS] A la recherche d'un encodage
Le Fri, May 29, 2020 at 01:46:30PM +0200, Fabrice Delvallée a écrit : > > J'ai récupéré un fichier en ".txt" dont je ne parviens pas à trouver > l'encodage. > Je suppose donc que le code "215" (8d) correspond au ç et le 216 (8e) au é https://www.google.com/search?q="ç; "8d" "é" "8e" À la deuxième page, bingo :) http://www.columbia.edu/kermit/mltbl.html Amicalement, Charles -- Charles Plessy Akano, Uruma, Okinawa, Japon
Re: [HS] A la recherche d'un encodage
Je l'ai trouvé sur internet... 2001 peut être Le 29/05/2020 à 14:00, Haricophile a écrit : Le Fri, 29 May 2020 13:46:30 +0200, Fabrice Delvallée a écrit : Auriez-vous des pistes... Il date de quand ton fichier ?
Re: [HS] A la recherche d'un encodage
Le Fri, 29 May 2020 13:46:30 +0200, Fabrice Delvallée a écrit : > Auriez-vous des pistes... Il date de quand ton fichier ?
[HS] A la recherche d'un encodage
Bonjour la liste J'ai récupéré un fichier en ".txt" dont je ne parviens pas à trouver l'encodage. Extrait de la sortie de 'od -xc --endian=big' 0005469747265206f726967696e616c0954 T i t r e o r i g i n a l \t T 02069747265206672616e8d61697309528e i t r e f r a n 215 a i s \t R 216 040616c6973617465757209436f756c6575 a l i s a t e u r \t C o u l e u 0607220657420466f726d617409416e6e8e r e t F o r m a t \t A n n 216 100652065742050617973095675203f2066 e e t P a y s \t V u ? f Je suppose donc que le code "215" (8d) correspond au ç et le 216 (8e) au é J'ai tenté quelques commandes : file -> data file -bi -> application/octet-stream; charset=binary chardetect -> Windows-1254 with confidence 0.549694044361 Ne trouvant pas l'encodage j'ai tenté de faire un peu de brute force : for f in $(iconv --list); do c=$(echo "$f" | cut -d'/' -f 1); iconv -f $c -t utf8 f.txt &> /dev/null | grep français && echo $c;done donne rien, en revanche j'ai avec : for f in $(iconv --list); do c=$(echo "$f" | cut -d'/' -f 1); iconv -f $c -t utf8 f.txt &> /dev/null | grep franآچais && echo $c;done franآچais CP1256 franآچais CP9448 franآچais CSIBM9448 franآچais IBM-9448 franآچais IBM9448 franآچais MS-ARAB franآچais WINDOWS-1256 Auriez-vous des pistes...