Bonjour,

Le lundi 23 octobre 2017 12:00:02 UTC+2, Thomas Savary a écrit :
> Enfin une question à laquelle je peux essayer de répondre :-)
> 
> Je suis nul en informatique, mais j’ai une relative maîtrise des expressions 
> rationnelles.
> Dans ton expression, tu as oublié de protéger le point et le trait d’union. 
> Par ailleurs, on peut faire plus simple en utilsant \w.
> 
> Essaie :
> [\w\.\-]+@[\w\.\-]{2,}\.[a-z]{2,4}
> 
> Cela dit, il faut aussi parfois protéger les contre-obliques, en tout cas 
> dans 
> sed. Le plus « drôle », c’est que cela dépend aussi du shell utilisé. 
> 

Marche pas !

$  find . -type f -print | xargs  egrep -o '[\w\.\-]+@[\w\.\-]{2,}\.[a-z]{2,4}'
xargs: guillemets simple non appairés ; par défaut les guillemets sont 
particuliers à xargs à moins d'utiliser l'option -0
grep: ./www._____.com/pics/contents/webzine/communique: No such file or 
directory
grep: paris: No such file or directory
grep: design: No such file or directory
grep: week.pdf: No such file or directory
grep: ./www._____.com/pics/contents/webzine/vs: No such file or directory
grep: a: No such file or directory
grep: glass: No such file or directory
grep: house.jpg: No such file or directory
grep: ./www._____.com/pics/webzine/29: No such file or directory
grep: citations: No such file or directory
grep: pour: No such file or directory

Je n'ai même plus les adresses du webmestre !
J'ai pas comprie le truc des obliques, moi il faut me donner la bécquée comme 
un oisillion mais en code source, je ne suis pas capable de réfléchire ....
Il faut ce mettre à python, Lxml et BeautifulSoup ?

Je cherche un truc plus simple, sous windows quand je lance une recherche il me 
sort 300 pages avec dans le nom, il y a l’arobase dans le noms, en plus une 
dizaines d’exécutables en DOS, je crois que c'est dans ces fichiers si j'ai 
télécharger les adresses ?
Je suis le seul à faire du scraping ?

Ptilou

Répondre à