Re: Encodage de fichiers provenant de système Microsoft

2020-09-22 Par sujet steve

Salut Marc,

Merci pour ce petit cours accéléré :)

Beaucoup plus clair maintenant.

Comme je l'ai dit dans un autre message, je vais voir en amont si on
peut faire quelque chose.

Encore merci !

S



Re: Toujours des plantage Xorg

2020-09-22 Par sujet Daniel Caillibaud
Le 18/09/20 à 19:15, BERTRAND Joël  a écrit :
>   Le dual screen ne serait-il pas pour quelque chose dans le problème ?

Pas chez moi, ça vient de planter sans dual screen…

-- 
Daniel

Il est souvent trop tôt pour savoir s'il n'est pas
trop tard.
Pierre Dac



Re: Encodage de fichiers provenant de système Microsoft

2020-09-22 Par sujet Marc Chantreux
salut,

> > ben du coup c'est pas ton fs qui supporte pas les caractères utf8 dans
> > le fichier?
> Si si, tout mon système est en UTF-8.

c'est ce que disait Nicolas: c'est pas le FS qui est pas utf-8 mais le
nom du fichier qui est probablement en latin9.


> > C  o  m  i  t  ? _  d  e  p  i  l  o  t  a  g  e
> > c'est ce que ls affiche.  2b ae est donc la représentation que ls fait
> > de ton char foireux
> Je ne sais pas comment tu es arrivé à cette conclusion mais je te crois
> sur parole ;-)
> > et j'espérais pouvoir en faire quelque chose pour
> > écrire une macro mutt.

avec xxd c'est plus simple a expliquer:

* un charmap une chaine de caractère, c'est une suite d'octets (souvent
  1 seul octet) associée à un symbole.  quand tu as le problème que tu
* as eu, c'est tout simplement que 2 outils n'utilisent pas le meme charmap
* du coup, regarder la valeur de l'octet et trouver le charmap dans
  lequel ca correspond à la valeur attendue permet souvent de trouver
  une solution

echo -n steve|xxd -b -c1

: 01110011  s
0001: 01110100  t
0002: 01100101  e
0003: 01110110  v
0004: 01100101  e

sauf que tous ces bits, c'est compliqué et long a lire ou a memoriser
alors on utilise une autre notation (hexadecimale) qui a une propriété
intéressante: on peut regrouper les bits par 4 pour 1 seul symbole
hexa.

voilà une table de conversion decimal/hexa/ascii

00 00 00
01 01 01
02 02 10
03 03 11
04 04 000100
05 05 000101
06 06 000110
07 07 000111
08 08 001000
09 09 001001
10 0a 001010
11 0b 001011
12 0c 001100
13 0d 001101
14 0e 001110
15 0f 00
16 10 01
17 11 010001
18 12 010010
19 13 010011
20 14 010100

du coup le s par exemple:

0111 => 7
0011 => 3

echo -n steve|xxd -b -c1

: 73  s
0001: 74  t
0002: 65  e
0003: 76  v
0004: 65  e

> > va renommer 北亰.pdf et تج.xls en Bei Jing .pdf et tj.xls

> Un mv le permet aussi presque toujours.

oui mais avec mv t'es obligé de deviner le nom des symboles.

bon de toute façon ca colle plus trop puisque comme le signalait
Nicolas: le problème est l'exact inverse: c'est ton fichier qui est
nommé avec des caractères non-utf.

a+
marc