Salut Aldo,
Il n'y a pas de fichier texte généré car je n'ai pas codé proprement. En
fait le script modifie directement le fichier docx. Pour fixer rapidement ce
problème, tu peux rajouter les trois lignes suivantes au début du script :
nom=`basename $1 .docx`.txt
cp $1 $nom
set - `basename $1 .docx`.txt
Explication :
ligne 1 : crée une variable shell qui contient le nom du fichier d'origine
dans lequel l'extension .docx est remplacé par l'extension .txt
ligne 2 : recopier le contenu du fichier docx dans un nouveau fichier avec
l'extension .txt
ligne 3 : faire pointer la variable shell $1 vers le nouveau fichier pour
laisser le reste du script intact
Sinon pour faire les choses proprement, il y a un article qui explique en
détail le format XML de Open Office à cette adresse
http://www.ibm.com/developerworks/xml/library/x-think15/
L'article cite également un outil qui répond exactement à ce que tu veux
faire Aldo : il s'agit de l'outil 4xslt de la suite
http://4suite.org/index.xhtml
Cordialement
Tarik
----- Original Message -----
From: "Osvaldo La Rosa" <[EMAIL PROTECTED]>
To: "Carrefour BLinux francophone, pour les non- et mal-voyants."
<carrefourblinux@lists.freearchive.org>
Sent: Friday, February 08, 2008 9:37 AM
Subject: Re: [CBLX] docx: impossibilité de lire...
Salut Tarik,
On Wed, Feb 06, 2008 at 07:42:56AM +0000, Tarik Fdil wrote:
Salut Aldo,
Voici un script qui fait le travail de manière automatique :
vi -E $1 << FIN
1,\$s/<[^>]*>/\r/g
1,\$g/^$/d
w
q
FIN
echo fichier docx conerti
Tu lui passes le nom du fichier docx en paramètre. Le script appelle vi
avec
l'option -E pour qu'il passe automatiquement en mode commande. On
redirige
l'entrée standard de vi vers le script en cours.
ça n'a pas l'air de fonctionner comme souhaité;:
- j'obtiens aucun fichier en sortie (.txt)
- sur ce pc je suis en Debian Sarge avec un vim v. 6.3-071+1sarge: es-ce
que ça peut poser problème?
- enfin j'ai essayé d'ajouter au-dessus de tes ligne #!/bin/bash, mais ça
ne fonctionne pas, à ceci pèrs que le message dans ton "echo" apparaît
bien, avant de me redonner le prompt.
Pour ce qui est des phrases collées les unes aux autres, oui car tu
utilises
lynx en forçant le html. Or le html ne connaît pas les retours chariot
(\r)
que j'ai mis dans le script. Donc il colle toutes les lignes. Donc soit
tu
enlèves l'option --force de lynx soit dans le script tu transformes le \r
en
<br>, le retour chariot de html.
Oui pour lynx, en effet, j'aurais dû y penser :)
Cordialement
Tarik
Aldo.
_______________________________________________
Liste de diffusion CarrefourBLinuX
CarrefourBLinuX@lists.freearchive.org
http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu
Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi
Pour s'inscire par courriel :
'mailto:[EMAIL PROTECTED]'
Pour se desinscrire par courriel :
'mailto:[EMAIL PROTECTED]'
_______________________________________________
Liste de diffusion CarrefourBLinuX
CarrefourBLinuX@lists.freearchive.org
http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu
Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi
Pour s'inscire par courriel :
'mailto:[EMAIL PROTECTED]'
Pour se desinscrire par courriel :
'mailto:[EMAIL PROTECTED]'