Les expressions régulières en Python

Name: Expressions régulières Syntaxe et mise en oeuvre (avec exercices et corrigés)
Rating: 4 (1 reviews)

Généralités

Python est un langage de programmation interprété. Il a été conçu par Guido van Rossum à la fin des années 1980 et a été disponible pour le public en février 1991.

C’est un langage structuré, orienté objet, à la syntaxe rigoureuse qui impose le format d’écriture et favorise l’homogénéité de style. L’indentation fait partie intégrante du langage, et l’oubli d’une tabulation devant une instruction peut généralement avoir de sérieuses conséquences.

De nombreuses bibliothèques renforcent la puissance de ce langage.

Python offre la possibilité de manipuler des expressions régulières grâce à un module qu’il faut importer dans le programme souhaitant effectuer ces manipulations. La syntaxe des expressions régulières de Python a été considérablement enrichie par rapport aux expressions régulières étendues classiques, et apporte des possibilités similaires à lex.

Nous ne présenterons dans ce chapitre qu’un aperçu de ce que permettent les expressions régulières en Python. Pour une présentation exhaustive des possibilités du langage et de ses expressions régulières, veuillez vous référer...

Le module de gestion des expressions régulières

1. Utilisation

Pour utiliser des expressions régulières dans un programme Python, il est nécessaire d’importer le module re.

Syntaxe


import re

Exemple


#!/usr/bin/python 
 
import os 
import re

Les expressions peuvent ensuite être utilisées directement avec des fonctions de traitement comme par exemple :

re.match()
re.search()
re.sub()
etc.

ou de préférence compilées avec la fonction re.compile() si elles doivent être utilisées plusieurs fois.

Exemple 1


#!/usr/bin/python  
  
import os  
import re  
  
argv      = os.sys.argv  
argc      = len(argv)  
prgm      = argv[0]  
  
def usage(prgm) :  
     print "Usage: %s regex string" % prgm  
  
if argc != 3 :  
     usage(prgm)  
     exit(1)  
  
expr      = argv[1]  
string    = argv[2]  
s         = re.search(expr, string, 0);  
  
if  s :    
     print "group()   : ", s.group()

Ce script (search_direct.py) ne fait pas appel à la fonction re.compile() : il utilise directement l’expression dans un paramètre d’appel de la méthode re.search().

Exemple 2


#!/usr/bin/python  
  
import os  
import re  
  
argv      = os.sys.argv  
argc      = len(argv)  
prgm      = argv[0]  
  
def usage(prgm) :  
     print "Usage: %s regex string" % prgm  
  
if argc != 3 :  
     usage(prgm)  
     exit(1)  
  
expr      = argv[1]  ...