Re: [fr-users] Convertir un pdf en calc

Ocleyr2lalune Fri, 04 Jul 2025 10:26:43 -0700

Bonjour 

votre méthode de départ est fastidieuse et effectivement cela peut venir d'une 
méconnaissance de Calc et de LibreOffice


De façon historique Star Office (le grand-père de LibreOffice) avait un 
navigateur web. Il en a conservé quelques outils utiles :
Les documents dans Writer peuvent être enregistrés en html.
Les tables html peuvent être importées dans Calc jusqu'à proposer une 
actualisation reguliere du contenu.

Vous pouvez donc déjà simplement faire un copier coller du tableau d'une page 
web vers calc. En utilisant le collage special. Les options de menus sont 
différentes. Il vous suffit de les essayer. Il n'y en a pas tant que ça pour 
voir ce qui convient à votre besoin. 
Et puis il y a 
https://help.libreoffice.org/latest/fr/text/scalc/guide/webquery.html
Faites plusieurs essais là aussi. Ça peut être intéressant en première approche 
de choisir comme import "html_all" , plus qu'une table spécifique. Puis ensuite 
vous pouvez sélectionner un import plus précis. Cela vous donnera un import 
plus propre (juste parce qu'il n'y aura pas à aligner plusieurs tables sur une 
même colonne).

En résumé vous avez un contenu textuel/chiffre, donc des données que vous 
supprimez en faisant une capture pour faire ensuite de l'ocr et recuperer les 
données que vous aviez au départ. 
Au moins vous savez faire de l'ocr mais vous perdez du temps et de l'énergie.

N'hésitez pas a créer votre propre sujet pour que l'on vous guide sur cet usage 
(ou un autre lié à LibreOffice !) avec un lien vers une page dont vous voulez 
récupérer un tableau.

Enfin au risque de me répéter, sur la question de ce fil posée par Étienne, il 
est important de garder en tête que si LibreOffice ne fait pas d'OCR, il 
proposera l'édition (légère) de PDF dès lors qu'ils ne sont pas issus d'images 
(scan, capture). Ce que ne fait pas une visionneuse PDF, Okular compris. 

Toute solution qui passe par de l'OCR, est une analyse d'image. C'est donc 
comme si on exploitait le scan d'un fichier.
alors que le pdf, s'il est créé a partir d'un export d'un fichier bureautique 
contient des informations plus riches et directement exploitables. Or Étienne a 
précisé que les pdf provenaient d'un export depuis Excel. Cela devrait rendre 
l'OCR inutile. A moins que des protections supplémentaires aient ete ajoutées à 
la creation du PDF pour éviter la récupération du contenu.

(Oui ce message est long... Comme souvent, désolée)

Claire
⁣

Le 4 juil. 2025, 13:06, à 13:06, Pierre-Jean Raugel 
<[email protected]> a écrit:
>Bonjour,
>
>Pour ce qui me concerne, j'ai adopté la procédure suivante:
>
>  * Traiter le pdf en OCR puissant,
>      o Copier le tableau ligne à ligne dans Calc en utilisant Collage
>        Spécial > Collage Spécial > Utiliser le dialogue d'importation
>    (Collage Spécial > Collage Spécial peut être obtenu Ctrl + Maj + V)
>    o Remplacer les points par des virgules dans le résultat du collage
>      o Corriger manuellement les erreurs
>
>A noter que j'ai essayé:
>
>  * avec Chat GPT: le résultat était plutôt correct, mais la procédure
>    était un peu plus lourde
>  * avec Excel: je n'ai pas trouvé de procédure comparable à Collage
>    Spécial > Collage Spécial > Utiliser le dialogue d'importation(mais
>    je maîtrise moins bien Excel que Calc)
>
>Précisions:
>
>  * Je pars en fait de tableaux sur navigateur, que je copie avec
>    capture d'écran, que j'enregistre en pdf.
>  * Les procédures proposées ne m'ont pas semblé convaincantes:
>      o Tabula n'a pas fonctionné après installation (sur Win 11)
>      o Je n'ai pas compris comment utiliser Okular
>
>Cordialement
>
>Le 03/07/2025 à 11:53, Etienne a écrit :
>> Bonjour à tous,
>>
>> C'est un fichier d'un de leurs fournisseurs créé avec excel et 
>> converti en pdf.
>>
>> J'ai demandé à m fille qu'elle m'envoie le fichier tarif pour faire 
>> des essais de conversion.
>> J'essaierai aussi le copier coller mais sans grand espoir. En effet, 
>> il y a toujours des fioritures qui vont venir perturber le copier
>coller.
>>
>> En tout cas, merci pour vos réponses.
>> Cordialement,
>>
>>
>>
>> Le 02/07/2025 à 18:13, Paul sur Wanadoo a écrit :
>>> Bonjour
>>>
>>> Je crois que la 1ère question à se poser porte sur le pdf à traiter.
>>> Est-ce un fichier généré par un export vers PDF à partir d’une 
>>> application bureautique ou autre, ou bien est-ce une simple image 
>>> obtenue par un scanner par exemple ?
>>>
>>> Si c’est un export PDF depuis une application, on peut au moins
>faire 
>>> du copier-coller plus ou moins fastidieux entre les données du pdf
>et 
>>> un fichier LibreOffice, mais la question du volume des données n’est
>
>>> pas négligeable !
>>>
>>> Cordialement
>>>
>>> Paul AMIET
>>> [email protected]
>>> Ligne fixe sur box Internet 01 46 30 03 13
>>> Afin de faciliter la lecture, je n'ai pas utilisé l'écriture 
>>> inclusive. Il est donc entendu que derrière les noms masculins 
>>> (éducateurs, salariés, bénévoles, tous, etc.), il peut y avoir aussi
>
>>> bien des femmes que des hommes.
>>> Si vous éprouvez une difficulté quelconque à lire ce message ou une 
>>> de ses éventuelles pièces jointes, n'hésitez pas à me le signaler de
>
>>> suite.
>>
>-- 
>Envoyez un mail à [email protected] pour vous
>désinscrire
>Les archives de la liste sont disponibles à
>https://listarchives.libreoffice.org/fr/users/
>Privacy Policy: https://www.documentfoundation.org/privacy

-- 
Envoyez un mail à [email protected] pour vous désinscrire
Les archives de la liste sont disponibles à 
https://listarchives.libreoffice.org/fr/users/
Privacy Policy: https://www.documentfoundation.org/privacy

Re: [fr-users] Convertir un pdf en calc

Répondre à