[HS] Re: [HS] A la recherche d'un encodage

2020-05-29 Par sujet Charles Plessy
Le Fri, May 29, 2020 at 02:44:12PM +0200, Fabrice Delvallée a écrit :
> 
> PS: j'utilise pas google :p

J'évite aussi Google autant que possible...

DuckDuckGo a une syntaxe très pratique qui fait que quand on ajoute !g
dans le champ de recherche on renvoie la recherche chez Google.  C'est
pratique quand DuckDuckGo a fait choux blanc.

https://duckduckgo.com/bang

Bonne journée,

-- 
Charles Plessy
Akano, Uruma, Okinawa, Japon



Re: [HS] A la recherche d'un encodage

2020-05-29 Par sujet Marc Chantreux
salut,

autre façon de faire:

* j'ai demandé le fichier source à Fabrice
* j'ai vu que ca contenait un __MACOSX

du coup

icon -l|grep -iMAC

.. essayons MACINTOSH ..

iconv -f MACINTOSH -t utf-8 fichier.txt

bingo ...  par contre ca contient des ^U pour préfixer les urls donc

iconv -f MACINTOSH -t utf-8 fichier.txt | tr -d "^U" > final.txt

(le ^U s'obtient en tappant ctrl-v ctrl-u)

hth

marc







Re: [HS] A la recherche d'un encodage

2020-05-29 Par sujet Fabrice Delvallée

Bravo

Merci beaucoup

PS: j'utilise pas google :p

Le 29/05/2020 à 14:17, Charles Plessy a écrit :

https://www.google.com/search?q="ç; "8d" "é" "8e"

À la deuxième page, bingo:)

http://www.columbia.edu/kermit/mltbl.html

Amicalement,

Charles

-- Charles Plessy Akano, Uruma, Okinawa, Japon




Re: [HS] A la recherche d'un encodage

2020-05-29 Par sujet Charles Plessy
Le Fri, May 29, 2020 at 01:46:30PM +0200, Fabrice Delvallée a écrit :
> 
> J'ai récupéré un fichier en ".txt" dont je ne parviens pas à trouver
> l'encodage.
 
> Je suppose donc que le code "215" (8d) correspond au ç et le 216 (8e) au é

https://www.google.com/search?q="ç; "8d" "é" "8e"

À la deuxième page, bingo :)

http://www.columbia.edu/kermit/mltbl.html

Amicalement,

Charles

-- 
Charles Plessy
Akano, Uruma, Okinawa, Japon



Re: [HS] A la recherche d'un encodage

2020-05-29 Par sujet bidons59

Je l'ai trouvé sur internet... 2001 peut être

Le 29/05/2020 à 14:00, Haricophile a écrit :

Le Fri, 29 May 2020 13:46:30 +0200,
Fabrice Delvallée  a écrit :


Auriez-vous des pistes...


Il date de quand ton fichier ?





Re: [HS] A la recherche d'un encodage

2020-05-29 Par sujet Haricophile
Le Fri, 29 May 2020 13:46:30 +0200,
Fabrice Delvallée  a écrit :

> Auriez-vous des pistes...

Il date de quand ton fichier ?



[HS] A la recherche d'un encodage

2020-05-29 Par sujet Fabrice Delvallée

Bonjour la liste

J'ai récupéré un fichier en ".txt" dont je ne parviens pas à trouver 
l'encodage.


Extrait de la sortie de 'od -xc --endian=big'

0005469747265206f726967696e616c0954
  T   i   t   r   e   o   r   i   g   i   n   a   l  \t   T
02069747265206672616e8d61697309528e
  i   t   r   e   f   r   a   n 215   a   i   s  \t   R 216
040616c6973617465757209436f756c6575
  a   l   i   s   a   t   e   u   r  \t   C   o   u   l   e   u
0607220657420466f726d617409416e6e8e
  r   e   t   F   o   r   m   a   t  \t   A   n   n 216
100652065742050617973095675203f2066
  e   e   t   P   a   y   s  \t   V   u   ?   f

Je suppose donc que le code "215" (8d) correspond au ç et le 216 (8e) au é

J'ai tenté quelques commandes :

file -> data

file -bi -> application/octet-stream; charset=binary

chardetect -> Windows-1254 with confidence 0.549694044361


Ne trouvant pas l'encodage j'ai tenté de faire un peu de brute force :

for f in $(iconv --list); do c=$(echo "$f" | cut -d'/' -f 1); iconv -f 
$c -t utf8 f.txt &> /dev/null | grep français && echo $c;done


donne rien, en revanche j'ai avec : for f in $(iconv --list); do 
c=$(echo "$f" | cut -d'/' -f 1); iconv -f $c -t utf8 f.txt &> /dev/null 
| grep franآچais && echo $c;done


franآچais
CP1256
franآچais
CP9448
franآچais
CSIBM9448
franآچais
IBM-9448
franآچais
IBM9448
franآچais
MS-ARAB
franآچais
WINDOWS-1256


Auriez-vous des pistes...