Sommaire

Principe

Le langage de programmation awk est un outil adapté au traitement de fichiers textes. Il permet d’effectuer des actions sur des enregistrements de données éventuellement structurés en champs. Le nom "awk" a pour origine les initiales du nom de chacun de ses auteurs : Aho, Weinberger et Kernighan. Ce chapitre présente les principales fonctionnalités des versions récentes du langage awk, appelées nawk (new awk) sur certaines plates-formes Unix. Sous Linux, la commande awk est un lien symbolique vers l’interpréteur gawk (GNU awk).

1. Syntaxe

awk [-F] ’{action-awk}’ [ fic1 ... ficn ] 
awk [-F] -f script-awk [ fic1 ... ficn ]

La commande awk prend en argument la liste des fichiers à traiter. En l’absence de noms de fichiers sur la ligne de commande, awk travaille sur les données arrivant sur son entrée standard. Cette commande peut donc être placée derrière un tube de communication.

2. Variables spéciales

a. Variables prédéfinies dès le lancement de awk

Le tableau suivant présente les principales variables internes du langage awk présentes en mémoire dès le lancement de la commande. La valeur de ces variables peut éventuellement être modifiée en fonction de la structure des données à traiter.

Nom de la variable

Valeur par défaut

Rôle de la variable

RS

Newline (\n)

Record Separator : caractère séparateur ...