1. Retrouver des e-mails dans des fichiers
Si nous souhaitons récupérer à partir d’une liste de fichiers toutes les adresses e-mail contenues dans ces fichiers, le script suivant pourra nous être très utile.
chap8_script12.py
def grab_email(files = []):
found = []
if files != None:
mailsrch = re.compile(r'[\w\-][\w\-\.]+@[\w\-][\w\-\.]
+[a-zA-Z]{1,4}')
for file in files:
for line in open(file,'r'):
found.extend(mailsrch.findall(line))
u = {}
for item in found:
u[item] = 1
return u.keys()
file=['texte1.txt','texte2.txt','texte3.txt']
retour=grab_email(file)
print retour
Dans le même répertoire, nous allons placer trois fichiers texte, texte1.txt, texte2.txt et texte3.txt ; voici leur contenu :
::::::::::::::
texte1.txt
::::::::::::::
un petit texte tout sympa
qui contient un mail fasm@acissi.net et pis c'est tout
mais regardons le prochain
::::::::::::::
texte2.txt
::::::::::::::
la il n'y a pas de mail mais que des @ et des .
donc rien en retour
::::::::::::::
texte3.txt
::::::::::::::
la on va mettre...