Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Patrick Auclair

Bonjour,

Perso je n'installe pas PDFCreator car totalement inutile.
Sur Win j'utilise ce qui existe : Imprimer -> imprimante : Microsoft 
print to PDF.
D'ailleurs, et cela m'a fait sourire, à partir du PDF téléchargé sur le 
site de la mairie : on l'ouvre avec Acrobat Reader puis on l'imprime 
avec cette imprimante (crosoft).

Et, on peut alors ouvrir le nouveau fichier avec draw sans peine, LOL ;).
Je n'avais pas pensé à cette méthode.
Cordialement

Patrick

Le 13/01/2020 à 22:13, Stéphane Santon a écrit :

Bonjour,

Le 13/01/2020 à 21:12, Patrick Auclair a écrit :
Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec 
notepad ++) :



Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Stéphane Santon

Bonjour,

Le 13/01/2020 à 21:12, Patrick Auclair a écrit :
Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec 
notepad ++) :



Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Stéphane Santon

Bonjour,

Le 13/01/2020 à 16:58, Ocleyr2lalune a écrit :

Y-a-t-il une volonté quelconque des auteurs de protéger le texte ?


Je pense que non. Plutôt un manque d'info sur les moyens utilisés.


--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Patrick Auclair

Bonsoir,

Il existe une solution pour modifier ce fichier et obtenir quelque chose 
d'à peu près "potable" qu'il est possible de retravailler avec Draw.
Pour cela il faut avoir installé au préalable le logiciel Inkscape. J'ai 
utilisé la version : Inkscape Portable 0.92.4 fr pour windows, pas testé sur
ma distri Linux (Debian 10) mais cela devrait fonctionner aussi avec une 
version Linux de Inkscape.
Petit lien pour récupérer cette version : 
http://www.netfox2.net/modules/wfdownloads/singlefile.php?cid=252=1462


Processus appliqué :
1 - J'ai téléchargé le PDF original sur le site de la mairie de Bussac 
sur Charente.
2 - Ouvert Inkscape, puis "fichier - ouvrir" et on sélectionne  le 
document précédemment téléchargé.

3 - Une fenêtre "Préférences pour l'importation d'un fichier PDF" s'ouvre.
  Par défaut  2 cases à cocher sont activées :
   Remplacer les polices du Pdf ..
   Incorporer les images ...
  * Les décocher.
  * Puis sélectionner le bouton radio " Import Poppler / Cairo" à 
la place de "Importation interne".

  * Mettre la "précision" en bas à 2.
4 - Valider et attendre un petit moment. Et, c'est magique on obtient le 
document avec le texte.
  (Attention il n'y a pas de zone de texte, c'est du caractère par 
caractère.
5 - Ensuite il faut "enregistrer sous"  .PDF et dans la fenêtre qui 
s'ouvre sélectionner Pdf 1.4 à la place de 1.5.
 (J'ai pas testé cette dernière version - à voir). On peut aussi 
choisir d'enregistrer en . SVG.

 Ne surtout pas prendre le format .ODG, ça ne fonctionne pas.
6 - Ouvrir avec draw (pour moi cela a parfaitement fonctionné).

Pour info voici ce que l'on trouve à la fin du fichier (ouvert avec 
notepad ++) :

2 0 obj
>endobj

Bon courage, cordialement,
Patrick

Le 13/01/2020 à 09:21, Stéphane Santon a écrit :

Bonjour,

Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre 
avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont 
bien dans des zones de texte mais remplacés par différents caractères 
sans sens de phrase ?

(pourtant ce ne sont pas des PDF issus de scans)

D'ailleurs dans ces mêmes documents, les recherches de texte dans un 
lecteur PDF sont toujours sans résultat.


En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB

Merci




--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Robert Cabane

Bonjour,
Oui, l'export par pdfcreator est peut-être responsable du souci, pas 
sûr. La police de type 3 est dans l'ordi et incorporée dans le fichier 
pdf ; quand on imprime cette police est envoyée à l'imprimante (ça peut 
être long).
Essaye de faire composer le texte dans une police assez standard (genre 
Arial, Helvetica) pour voir si ça sort mieux.

RC

Merci pour ces infos.

Donc une police "de type 3" :
- est-elle sur l'ordi car imprimante Postscript, donc sur le soft de 
mise en page, et il vaut mieux ne pas la choisir ?

- est-ce une gamme de polices utilisées par un soft en particulier ?
- est-ce un format d'export PDF seulement ?





--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Landron Gérard

Le 13/01/2020 à 10:36, Bernard Schoenacker a écrit :



- Mail original -

De: "Stéphane Santon" 
À: "Liste libOo" 
Envoyé: Lundi 13 Janvier 2020 09:21:55
Objet: [fr-users] [Draw] Import PDF, texte introuvable

Bonjour,

Pourquoi est-ce que dans certains documents PDF "externes" que
j'ouvre
avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont
bien dans des zones de texte mais remplacés par différents caractères
sans sens de phrase ?
(pourtant ce ne sont pas des PDF issus de scans)

D'ailleurs dans ces mêmes documents, les recherches de texte dans un
lecteur PDF sont toujours sans résultat.

En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB

Merci




hello la période est échue pour toi (noel et les santons)

plus sérieusement, ce document doit être sorti de la tête
d'un macounet pervers utilisant des produits daubés ...
PDFCreator Version 0.9.5, c'est plutôt windows... d'aillerus pas très à 
jour pour un fichier de 2018 !

C'est une police type 3 incluse dans le pdf


désolé, mais j'ai essayé en ligne de commande et je n'ai rien
obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr

de fait rien d'exploitable

bonne journée

@+
bernard

Gérard

--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Stéphane Santon

Merci pour ces infos.

Donc une police "de type 3" :
- est-elle sur l'ordi car imprimante Postscript, donc sur le soft de 
mise en page, et il vaut mieux ne pas la choisir ?

- est-ce une gamme de polices utilisées par un soft en particulier ?
- est-ce un format d'export PDF seulement ?

Merci


Le 13/01/2020 à 10:06, Bob a écrit :

Bonjour,
Ce document utilise des polices de type 3, encodées de manière 
non-standard. On ne peut en extraire aucun texte, ni dans Draw ni même 
dans le lecteur PDF. Il se peut que les auteurs de ce document aient 
volontairement employé des polices spéciales ou des sous-ensembles 
incomplets de polices afin d'empêcher le copier-coller de texte ou la 
réédition du pdf.

Le problème est à la source, et Libreoffice n'y peut rien du tout.
RC



- Mail original -

De: "Stéphane Santon" 
À: "Liste libOo" 
Envoyé: Lundi 13 Janvier 2020 09:21:55
Objet: [fr-users] [Draw] Import PDF, texte introuvable

Bonjour,

Pourquoi est-ce que dans certains documents PDF "externes" que
j'ouvre
avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont
bien dans des zones de texte mais remplacés par différents caractères
sans sens de phrase ?
(pourtant ce ne sont pas des PDF issus de scans)

D'ailleurs dans ces mêmes documents, les recherches de texte dans un
lecteur PDF sont toujours sans résultat.

En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB

Merci


plus sérieusement, ce document doit être sorti de la tête
d'un macounet pervers utilisant des produits daubés ...

désolé, mais j'ai essayé en ligne de commande et je n'ai rien
obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr







--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Stéphane Santon


Le 13/01/2020 à 09:36, Bernard Schoenacker a écrit :

- Mail original -

De: "Stéphane Santon" 
À: "Liste libOo" 
Envoyé: Lundi 13 Janvier 2020 09:21:55
Objet: [fr-users] [Draw] Import PDF, texte introuvable

Bonjour,

Pourquoi est-ce que dans certains documents PDF "externes" que
j'ouvre
avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont
bien dans des zones de texte mais remplacés par différents caractères
sans sens de phrase ?
(pourtant ce ne sont pas des PDF issus de scans)

D'ailleurs dans ces mêmes documents, les recherches de texte dans un
lecteur PDF sont toujours sans résultat.

En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB

Merci


hello la période est échue pour toi (noel et les santons)


:-)


plus sérieusement, ce document doit être sorti de la tête
d'un macounet pervers utilisant des produits daubés ...

désolé, mais j'ai essayé en ligne de commande et je n'ai rien
obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr


Merci.

Je ne cherche pas à récupérer le texte, mais simplement à comprendre 
pourquoi (et peut-être pour conseiller l'adjoint à ma commune).


Est-ce un problème de format, de polices manquantes, de codage 
spécifique à des logiciels propriétaires (daube ou haut de gamme je ne 
sais pas...), ... ?


Merci


--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Bob

Bonjour,
Ce document utilise des polices de type 3, encodées de manière 
non-standard. On ne peut en extraire aucun texte, ni dans Draw ni même 
dans le lecteur PDF. Il se peut que les auteurs de ce document aient 
volontairement employé des polices spéciales ou des sous-ensembles 
incomplets de polices afin d'empêcher le copier-coller de texte ou la 
réédition du pdf.

Le problème est à la source, et Libreoffice n'y peut rien du tout.
RC



- Mail original -

De: "Stéphane Santon" 
À: "Liste libOo" 
Envoyé: Lundi 13 Janvier 2020 09:21:55
Objet: [fr-users] [Draw] Import PDF, texte introuvable

Bonjour,

Pourquoi est-ce que dans certains documents PDF "externes" que
j'ouvre
avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont
bien dans des zones de texte mais remplacés par différents caractères
sans sens de phrase ?
(pourtant ce ne sont pas des PDF issus de scans)

D'ailleurs dans ces mêmes documents, les recherches de texte dans un
lecteur PDF sont toujours sans résultat.

En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB

Merci


plus sérieusement, ce document doit être sorti de la tête
d'un macounet pervers utilisant des produits daubés ...

désolé, mais j'ai essayé en ligne de commande et je n'ai rien
obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr




--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


Re: [fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Bernard Schoenacker


- Mail original -
> De: "Stéphane Santon" 
> À: "Liste libOo" 
> Envoyé: Lundi 13 Janvier 2020 09:21:55
> Objet: [fr-users] [Draw] Import PDF, texte introuvable
> 
> Bonjour,
> 
> Pourquoi est-ce que dans certains documents PDF "externes" que
> j'ouvre
> avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont
> bien dans des zones de texte mais remplacés par différents caractères
> sans sens de phrase ?
> (pourtant ce ne sont pas des PDF issus de scans)
> 
> D'ailleurs dans ces mêmes documents, les recherches de texte dans un
> lecteur PDF sont toujours sans résultat.
> 
> En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB
> 
> Merci
> 


hello la période est échue pour toi (noel et les santons)

plus sérieusement, ce document doit être sorti de la tête 
d'un macounet pervers utilisant des produits daubés ...

désolé, mais j'ai essayé en ligne de commande et je n'ai rien 
obtenu d'exploitable, il ne reste plus qu'à passer par de l'ocr

bonne journée

@+
bernard

-- 
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy


[fr-users] [Draw] Import PDF, texte introuvable

2020-01-13 Par sujet Stéphane Santon

Bonjour,

Pourquoi est-ce que dans certains documents PDF "externes" que j'ouvre 
avec Draw, je ne peux pas retrouver les textes corrects, ceux-ci sont 
bien dans des zones de texte mais remplacés par différents caractères 
sans sens de phrase ?

(pourtant ce ne sont pas des PDF issus de scans)

D'ailleurs dans ces mêmes documents, les recherches de texte dans un 
lecteur PDF sont toujours sans résultat.


En lien un exemple de pdf : https://www.cjoint.com/c/JAniunAGujB

Merci

--
Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy