Salut Aldo,

Il n'y a pas de fichier texte généré car je n'ai pas codé proprement. En fait le script modifie directement le fichier docx. Pour fixer rapidement ce problème, tu peux rajouter les trois lignes suivantes au début du script :

nom=`basename $1 .docx`.txt
cp $1 $nom
set - `basename $1 .docx`.txt

Explication :
ligne 1 : crée une variable shell qui contient le nom du fichier d'origine dans lequel l'extension .docx est remplacé par l'extension .txt

ligne 2 : recopier le contenu du fichier docx dans un nouveau fichier avec l'extension .txt

ligne 3 : faire pointer la variable shell $1 vers le nouveau fichier pour laisser le reste du script intact

Sinon pour faire les choses proprement, il y a un article qui explique en détail le format XML de Open Office à cette adresse http://www.ibm.com/developerworks/xml/library/x-think15/

L'article cite également un outil qui répond exactement à ce que tu veux faire Aldo : il s'agit de l'outil 4xslt de la suite http://4suite.org/index.xhtml

Cordialement
Tarik

----- Original Message ----- From: "Osvaldo La Rosa" <[EMAIL PROTECTED]> To: "Carrefour BLinux francophone, pour les non- et mal-voyants." <carrefourblinux@lists.freearchive.org>
Sent: Friday, February 08, 2008 9:37 AM
Subject: Re: [CBLX] docx: impossibilité de lire...


Salut Tarik,

On Wed, Feb 06, 2008 at 07:42:56AM +0000, Tarik Fdil wrote:
Salut Aldo,

Voici un script qui fait le travail de manière automatique :

vi -E $1 << FIN
1,\$s/<[^>]*>/\r/g
1,\$g/^$/d
w
q
FIN
echo fichier docx conerti

Tu lui passes le nom du fichier docx en paramètre. Le script appelle vi avec l'option -E pour qu'il passe automatiquement en mode commande. On redirige
l'entrée standard de vi vers le script en cours.

ça n'a pas l'air de fonctionner comme souhaité;:
- j'obtiens aucun fichier en sortie (.txt)
- sur ce pc je suis en Debian Sarge avec un vim v. 6.3-071+1sarge: es-ce
que ça peut poser problème?
- enfin j'ai essayé d'ajouter au-dessus de tes ligne #!/bin/bash, mais ça
ne fonctionne pas, à ceci pèrs que le message dans ton "echo" apparaît
bien, avant de me redonner le prompt.

Pour ce qui est des phrases collées les unes aux autres, oui car tu utilises lynx en forçant le html. Or le html ne connaît pas les retours chariot (\r) que j'ai mis dans le script. Donc il colle toutes les lignes. Donc soit tu enlèves l'option --force de lynx soit dans le script tu transformes le \r en
<br>, le retour chariot de html.

Oui pour lynx, en effet, j'aurais dû y penser :)

Cordialement
Tarik

Aldo.

_______________________________________________
Liste de diffusion CarrefourBLinuX
   CarrefourBLinuX@lists.freearchive.org
   http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu
Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
   http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi
Pour s'inscire par courriel :

'mailto:[EMAIL PROTECTED]'
Pour se desinscrire par courriel :

'mailto:[EMAIL PROTECTED]'


_______________________________________________
Liste de diffusion CarrefourBLinuX CarrefourBLinuX@lists.freearchive.org
   http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu
Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
   http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi
Pour s'inscire par courriel : 'mailto:[EMAIL PROTECTED]' Pour se desinscrire par courriel : 'mailto:[EMAIL PROTECTED]'

Répondre à