Salut Claude Je suis désolée si j'ai pu te faire penser le contraire, mon idée est plutôt de multiplier les solutions proposées. Comme je l'écrivais hier on est plus familier avec une solution ou l'autre. Ensuite c'est à la personne qui a posé la question de voir ce qui lui convient, là où ça répond le mieux à son besoin. Et dans d'autres situations, la préférence ira ailleurs. C'est l'intérêt de la discussion. On peut tout à fait partager nos pratiques... Ça permet d'avancer : Ensemble on va plus loin comme on dit !
Claire Le 5 sept. 2023 à 09:07, à 09:07, "prog.amat...@free.fr" <prog.amat...@free.fr> a écrit: >Bonjour à tous, >Moi je ne veux rien faire de particulier, la discussion est venue de la > >demande initiale pour laquelle j'avais proposé une idée. Puis >apparemment et sans le vouloir, j'ai déclenché une "bronca" contre >Alt-search. >Cela m'arrive de traiter ce genre de problème sur des fichiers qui sont > >mal scannés mais je me suis fait mes petites macros et routines de >remplacement et tout va bien pour moi. >Donc désolée pour le bruit que j'ai occasionné sans le vouloir. >Bonne journée à tous >Claude > > >Le 04/09/2023 à 21:57, Ocleyr2lalune a écrit : >> >> précisément que veux tu faire ? >> >> Pour supprimer la marque de paragraphe (= fusionner 2 paragraphes) : >> - Rechercher $ >> - remplacer (par rien = laisser vide) puis tout remplacer >> >> c'est écrit dans la 3e ligne du tableau de ce lien, déjà donné à midi > >> >https://help.libreoffice.org/latest/fr/text/shared/01/02100001.html?&DbPAR=SHARED > >> ><https://help.libreoffice.org/latest/fr/text/shared/01/02100001.html?&DbPAR=SHARED> >> >> Pour remplacer un saut de ligne par un saut de paragraphe : >> - Recherche /n >> - Remplacer /n >> >> /n est particulier et a une signification différente selon qu'il est >> en recherche ou en remplacement. >> >> Pour supprimer les sauts de lignes (retour chariot, comme sur la >> touche entrée du clavier, ce que l'on obtient par un maj + entrée) >> - Rechercher /n >> - remplacer (par rien = laisser vide) puis tout remplacer >> >> Généralement à l'import d'un fichier généré par ocr, on a à supprimer > >> soit des "retours chariots / sauts de ligne", soit des sauts de >> paragraphes. >> >> Quand les sauts de paragraphes ne sont pas justifiés et que le texte >> est à peu près correct, oui on peut estimer qu'un paragraphe qui >> commence par une minuscule n'est pas un nouveau paragraphe et que ce >> sont ceux là qu'il faut supprimer... >> >> Après tout cela est assez bien documenté. Il faut consulter les liens > >> fournis ce midi. "libreoffice expression régulière" et le moindre >> moteur de recherche vous amènera sur ces pages... >> >> Et en cas de besoin demander ici. On progresse tous par des essais >> selon les cas que l'on doit gérer.... >> >> >> à noter, enfin qu'un PDF ouvert dans Draw, s'il n'est pas le produit >> d'un scan peut être modifié directement. >> Chaque ligne de texte est une une zone de texte distincte. Mais il >est >> possible de les fusionner depuis quelques années (forme / consolider >> le texte) >> >> Enfin, vraiment, sur la question posée au départ, je crois que >> l'utilisation de pandoc n'est pas à écarter. Elle demande moins de >> manip que le redressement d'un fichier via des regexp ou altsearch ! >> >> Claire >> >> Le 2023-09-04 21:14, prog.amat...@free.fr a écrit : >> >>> Ok j'ai compris pour le bloquant, mais Alt-search comme la boite de >>> dialogue du recherche et remplace n'est pas bloquant >>> Par contre pour le recherche et remplace que tu m'indiques, cela ne >>> fonctionne pas comme je voudrais car cela ne supprime pas la marque >>> de fin de paragraphe. Ou alors j'ai encore tout compris de travers ? >>> >>> Le 04/09/2023 à 19:27, Landron Gérard a écrit : >>>> Le 04/09/2023 à 18:19, prog.amat...@free.fr a écrit : >>>>> Je ne comprends pas quand tu dis que le recherche et remplace >n'est >>>>> pas bloquante et le Alt-search l'est ? >>>> Je ne sais plus pour alt-search mais par exemple la boite >>>> d'impression empêche l'accès au texte, de même les boites d'export >>>> ce qui est normal puisque le texte ne doit plus être modifié à ce >>>> moment là. >>>> Pour vos exemples, le premier est facile, il faut simplement >>>> inverser la logique : >>>> rechercher la minuscule en débute de phrase >>>> ^[:lower:] >>>> et la remplacer en mettant >>>> $0 >>>> et un format majuscule dans la zone de recherche >>>> >>>> les autres supposent une boucle que en fait pas la boite native >donc >>>> à mon avis Alt-search est adapté >>>> >>>>> >>>>> >>>>> Le 04/09/2023 à 15:55, Landron Gérard a écrit : >>>>>> Le 04/09/2023 à 16:08, prog.amat...@free.fr a écrit : >>>>>>> Re-bonjour, >>>>>>> Nous avions eu la même discussion, il n'y a pas si longtemps.... > >>>>>>> Personnellement l'avantage que j'apprécie avec Alt-Search c'est >>>>>>> de pouvoir sauvegarder mes chaines de recherche. Mais si on peut > >>>>>>> le faire en natif, je suis preneuse de la solution. >>>>>> tu peux toujours faire une autotext pour les stocker et les >>>>>> appeler quand tu en as besoin, ce qui est bien avec la boite de >>>>>> dialogue de recherche est qu'elle n'est pas bloquante pour le >>>>>> logiciel, on peut copier dans le texte pour mettre dans la zone >de >>>>>> recherche ou de remplacement >>>>>>> Claude >>>>>> Gérard >>>>>>> >>>>>>> >>>>>>> Le 04/09/2023 à 12:40, Ocleyr2lalune a écrit : >>>>>>>> Voui, j'ai tendance aussi à trouver que la fonction native est >>>>>>>> suffisante. >>>>>>>> D'autant que les expressions régulières les plus simples >>>>>>>> permettent entre autre >>>>>>>> De détecter des paragraphes vides >>>>>>>> De detecter des débuts ou fin de paragraphe (pour rechercher >des >>>>>>>> termes spécifiquement placés au début ou à la fin >>>>>>>> De remplacer des retours chariots par des fins de paragraphes >ou >>>>>>>> de les supprimer ( ce qui me semble être proche de la demande >>>>>>>> initiale) >>>>>>>> >>>>>>>> Peut-être que la différence essentielle est d'être plus ou >moins >>>>>>>> familier avec la syntaxe des regex ou celle d'alt search (le >>>>>>>> gouts et les couleurs). >>>>>>>> Les expressions régulières ont l'avantage d'avoir une syntaxe >>>>>>>> "universelle" >>>>>>>> >https://help.libreoffice.org/latest/fr/text/swriter/guide/search_regexp.html > >>>>>>>> pour la doc sur la recherche >>>>>>>> >>>>>>>> >https://help.libreoffice.org/latest/fr/text/shared/01/02100001.html?&DbPAR=SHARED > >>>>>>>> ><https://help.libreoffice.org/latest/fr/text/shared/01/02100001.html?&DbPAR=SHARED> > >>>>>>>> Pour la liste des regex >>>>>>>> >>>>>>>> >https://help.libreoffice.org/latest/fr/text/scalc/guide/wildcards.html?&DbPAR=SHARED > >>>>>>>> ><https://help.libreoffice.org/latest/fr/text/scalc/guide/wildcards.html?&DbPAR=SHARED> > >>>>>>>> Pour les caractères génériques dans la recherche ce qui est >>>>>>>> souvent suffisant dans la plupart des cas... >>>>>>>> >>>>>>>> >>>>>>>> Tout ça sans exclure les réponses déjà faites il y a quelques >>>>>>>> jours sur la façon de redresser un fichier word importé dans >writer. >>>>>>>> Et, à l'appui de l'idée de Bernard d'utiliser pandoc pour faire > >>>>>>>> ces conversions....(pdf>html>odt) >>>>>>>> >>>>>>>> >>>>>>>> Claire >>>>>>>> >>>>>>>> Le 4 sept. 2023 à 12:22, à 12:22, "Landron >>>>>>>> Gérard"<cornos...@palendriai.lt> a écrit: >>>>>>>>> Le 04/09/2023 à 11:27,prog.amat...@free.fr a écrit : >>>>>>>>>> Bonjour, >>>>>>>>>> Personnellement je fais cela avec Alt-Search (merci >>>>>>>>>> Pierre-Yves). Les >>>>>>>>>> >marques de fin de paragraphes inutiles sont en général suivis d'une >>>>>>>>>> minuscule. J'ai enregistré ces recherches. >>>>>>>>> L'inconvénient de altsearch est qu'il traite l'un après >l'autre >>>>>>>>> ce qui >>>>>>>>> >est long et surtout ne permet pas, selon le nombre d'opération, de >>>>>>>>> faire >>>>>>>>> une annulation contrairement à l'option 'Expressions >>>>>>>>> régulières' native >>>>>>>>> >Sauf changement récent car il a longtemps que je ne l'ai pas utilisé >>>>>>>>> Gérard >>>>>>>>>> Rechercher : \p([a-z]) >>>>>>>>>> Remplacer : \1 >>>>>>>>>> Cocher Respecter la casse >>>>>>>>>> Cocher Expressions régulières >>>>>>>>>> >>>>>>>>>> Rechercher : \p([éèàùêâîôûçäëïöü?!:]) >>>>>>>>>> Remplacer : \1 >>>>>>>>>> Cocher Respecter la casse >>>>>>>>>> Cocher Expressions régulières >>>>>>>>>> ou >>>>>>>>>> Rechercher : \p([éèàùêâîôûçäëïöü?!:])([a-z]) >>>>>>>>>> Remplacer : \2 >>>>>>>>>> Cocher Respecter la casse >>>>>>>>>> Cocher Expressions régulières >>>>>>>>>> >>>>>>>>>> >>>>>>>>>> >Explication : on recherche une marque de paragraphe suivie d'une >>>>>>>>>> minuscule. Les parenthèses permettent de définir un "groupe" >>>>>>>>>> qui sera >>>>>>>>>> >utilisé dans la zone de remplacement (s'il y a deux groupes de >>>>>>>>>> parenthèses on utiliset \2 pour faire référence au second). >>>>>>>>>> >>>>>>>>>> Claude >>>>>>>>>> >>>>>>>>>> >>>>>>>>>> >>>>>>>>>> Le 03/09/2023 à 11:59, Michel Rudelle - Listes LibO a écrit : >>>>>>>>>>> Bonjour, >>>>>>>>>>> >>>>>>>>>>> >Il y a probablement des possibilités en utilisant un OCR, mais je >>>>>>>>> n'en >>>>>>>>>>> >ai pas l'expérience. Peut-être d'autres contributeurs auront des >>>>>>>>> idées >>>>>>>>>>> à ce sujet. >>>>>>>>>>> >>>>>>>>>>> Je suppose que vous avez fait un copier-coller du texte du >>>>>>>>>>> PDF dans >>>>>>>>> le >>>>>>>>>>> >document Writer. Dans ce cas, d'après mon expérience, chaque ligne >>>>>>>>> lue >>>>>>>>>>> dans le PDF est vue comme un paragraphe et donc toutes les >>>>>>>>>>> lignes se >>>>>>>>>>> terminent par le signe représentant une fin de paragraphe. >>>>>>>>>>> >>>>>>>>>>> On peut remplacer facilement ces fins de paragraphe par une >>>>>>>>>>> espace: >>>>>>>>>>> >>>>>>>>>>> Edition > Rechercher et remplacer : cocher dans les options >>>>>>>>>>> >"Expressions régulières", dans Rechercher entrer le caractère $ et >>>>>>>>>>> >dans Remplacer entrer le caractère espace, ensuite deux solutions: >>>>>>>>>>> >>>>>>>>>>> >1/ cliquer sur "Rechercher le suivant" et s'il s'agit d'une fin de >>>>>>>>>>> >ligne et non d'une fin de paragraphe, cliquer sur "Remplacer" - ce >>>>>>>>>>> sera long pour 300 pages mais moins qu'avec la méthode que >>>>>>>>>>> vous avez >>>>>>>>>>> mentionnée. >>>>>>>>>>> >>>>>>>>>>> 2/ cliquer sur "Tout remplacer", mais dans ce cas les vrais >>>>>>>>>>> sauts de >>>>>>>>>>> >paragraphe disparaîtront ! Pour les rétablir (en supposant que les >>>>>>>>>>> paragraphes se terminent bien par un point): >>>>>>>>>>> >>>>>>>>>>> Edition > Rechercher et remplacer : cocher dans les options >>>>>>>>>>> >"Expressions régulières", dans Rechercher entrer les caractères \. >>>>>>>>>>> >suivis du caractère espace et dans Remplacer entrer les caractères >>>>>>>>> .\n >>>>>>>>>>> Cliquer sur "Rechercher le suivant" et si vous estimez qu'il > >>>>>>>>>>> s'agit >>>>>>>>>>> d'une fin de paragraphe, cliquer sur "Remplacer" - ça peut >>>>>>>>>>> être plus >>>>>>>>>>> rapide que la 1ère méthode. >>>>>>>>>>> >>>>>>>>>>> Méthode testée avec un format ODT >>>>>>>>>>> >>>>>>>>>>> >Voir dans l'aide les expressions régulières pour comprendre la >>>>>>>>>>> signification des entrées proposées. >>>>>>>>>>> >>>>>>>>>>> Cordialement, >>>>>>>>>>> >>>>>>>>>>> Michel >>>>>>>>>>> >>>>>>>>>>> PS: Si vous répondez, merci d'utiliser la fonction "répondre > >>>>>>>>>>> à tous" >>>>>>>>>>> de votre logiciel >>>>>>>>>>> de courrier électronique de façon que la liste reçoive >>>>>>>>>>> une copie >>>>>>>>>>> de votre réponse. >>>>>>>>>>> >>>>>>>>>>> Le 02/09/2023 à 11:48, Jennifer Muller a écrit : >>>>>>>>>>>> Bonjour >>>>>>>>>>>> >Je galère avec un fichier PDF converti en Word afin de pouvoir le >>>>>>>>>>>> retravailler. La mise en page d'origine est un format >>>>>>>>>>>> personnalisé >>>>>>>>> et je >>>>>>>>>>>> >souhaite le passer en A4. Or une fois chose faite, le texte lui >>>>>>>>>>>> demeure en >>>>>>>>>>>> >format personnalisé et chaque fin de phrase est donc déliée du >>>>>>>>> début >>>>>>>>>>>> de la >>>>>>>>>>>> phrase suivante. Le seul moyen trouvé est d'aller en fin de > >>>>>>>>>>>> phrase >>>>>>>>> et de >>>>>>>>>>>> >faire une "suppr" d'espace. Mais sur un document plein de 300 >>>>>>>>>>>> pages....moyen >>>>>>>>>>>> Y a-t-il une fonction qui reformate le texte entier >>>>>>>>>>>> proprement ? Le >>>>>>>>>>>> faire >>>>>>>>>>>> systématiquement correspondre au format de mise en page. >>>>>>>>>>>> Merci beaucoup pour votre aide >>>>>>>>>>>> >>>>>>>>> -- Envoyez un mail àusers+unsubscr...@fr.libreoffice.org pour >vous >>>>>>>>> désinscrire >>>>>>>>> Les archives de la liste sont disponibles à >>>>>>>>> https://listarchives.libreoffice.org/fr/users/ >>>>>>>>> Privacy Policy:https://www.documentfoundation.org/privacy >>>>>> >>>>>> >> -- Envoyez un mail à users+unsubscr...@fr.libreoffice.org pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy