Le 02.11.2017 07:59, ptilou a écrit : > Bonjour, > > Le mercredi 25 octobre 2017 13:10:02 UTC+2, Christian Quentin a écrit : > >> Le 25.10.2017 10:53, ptilou a écrit : >> >> Bonjour, >> >> Le lundi 23 octobre 2017 12:00:02 UTC+2, Thomas Savary a écrit : >> Enfin une question à laquelle je peux essayer de répondre :-) >> >> Je suis nul en informatique, mais j'ai une relative maîtrise des expressions >> rationnelles. >> Dans ton expression, tu as oublié de protéger le point et le trait d'union. >> Par ailleurs, on peut faire plus simple en utilsant \w. >> >> Essaie : >> [\w\.\-]+@[\w\.\-]{2,}\.[a-z]{2,4} >> >> Cela dit, il faut aussi parfois protéger les contre-obliques, en tout cas >> dans >> sed. Le plus « drôle », c'est que cela dépend aussi du shell utilisé. >> >> Marche pas ! >> >> $ find . -type f -print | xargs egrep -o >> '[\w\.\-]+@[\w\.\-]{2,}\.[a-z]{2,4}' >> xargs: guillemets simple non appairés ; par défaut les guillemets sont >> particuliers à xargs à moins d'utiliser l'option -0 >> grep: ./www._____.com/pics/contents/webzine/communique [1]: No such file or >> directory >> grep: paris: No such file or directory >> grep: design: No such file or directory >> grep: week.pdf: No such file or directory >> grep: ./www._____.com/pics/contents/webzine/vs [2]: No such file or directory >> grep: a: No such file or directory >> grep: glass: No such file or directory >> grep: house.jpg: No such file or directory >> grep: ./www._____.com/pics/webzine/29 [3]: No such file or directory >> grep: citations: No such file or directory >> grep: pour: No such file or directory >> >> Je n'ai même plus les adresses du webmestre ! >> J'ai pas comprie le truc des obliques, moi il faut me donner la bécquée >> comme un oisillion mais en code source, je ne suis pas capable de réfléchire >> .... >> Il faut ce mettre à python, Lxml et BeautifulSoup ? >> >> Je cherche un truc plus simple, sous windows quand je lance une recherche il >> me sort 300 pages avec dans le nom, il y a l'arobase dans le noms, en plus >> une dizaines d'exécutables en DOS, je crois que c'est dans ces fichiers si >> j'ai télécharger les adresses ? >> Je suis le seul à faire du scraping ? >> >> Ptilou >> >> Les raccourcis pour les caractères alphanumériques varient selon le contexte >> dans lequel les regexp sont utilisées, essaie ça en ligne de commande : >> >> egrep -R '[[:alnum:].\-]+@[[:alnum:]]+\.[[:alpha:]]{2,}' > > çà ne marche pas ! j'ai essayé man c la : > http://manpagesfr.free.fr/man/man1/Index.1.html > > j'ai besoin d'aide pour mettre tous çà en corollaire ... > Y a des rhume de binaire en ce moment c'est une épidémie ! > > Ptilou
> Curieux... J'ai essayé ça sous bash et ça donne bien le résultat attendu : egrep -R '[[:alnum:].\-]+@[[:alnum:]]+\.[[:alpha:]]{2,}' egrep -R '[[:alnum:]._\-]+@([[:alnum:]]+\.)+[[:alpha:]]{2,}' est un peu plus complète et repère les emails du type t...@qqpart.co.uk (avec un domaine composé de 2 parties ou plus) Tu lances bien la commande dans un terminal pour faire tes tests ? Christian Links: ------ [1] http://www._____.com/pics/contents/webzine/communique [2] http://www._____.com/pics/contents/webzine/vs [3] http://www._____.com/pics/webzine/29