Sommaire

Traitement de données

1. Comptage de lignes, de mots et de caractères : wc

La commande wc (word count) compte le nombre de lignes, de mots et de caractères. 

Syntaxe

wc   [ options ]    [ fichier ... ] 

Principales options :

-l

Compter le nombre de lignes.

-w

Compter le nombre de mots.

-c

Compter le nombre d’octets.

-m

Compter le nombre de caractères.

-C

Identique à -m.

Exemples

Nombre de lignes, mots et caractères du fichier notes.txt :

$ wc notes.txt 
     5     15     245 notes.txt

Nombre de lignes uniquement :

$ wc -l notes.txt 
      5 notes.txt

Nombre de caractères contenus dans un nom de fichier saisi au clavier (attention au saut de ligne ajouté par la commande echo) :

$ read nomfic 
document.xls 
ˆd 
$ echo "$nomfic\c" | wc -c       (Linux : $ echo -n "$nomfic" | wc -c ) 
12 
$

Voici un fichier encodé en UTF-8 (les caractères accentués sont encodés sur 2 octets), manipulé sur un système dont l’encodage est également UTF-8 :

$ echo $LANG 
fr_FR.utf8

Le fichier contient 2 caractères accentués :

$ cat utf8.txt 
élève

La commande od nous montre que chaque caractère accentué du fichier est encodé sur 2 octets :

$ od -c utf8.txt 
0000000 303 251   l 303 250   v   e  \n 
0000010

Nombre d’octets du fichier :

$ wc -c utf8.txt 
8 utf8.txt

Nombre de caractères du fichier :

$ wc -m utf8.txt 
6 utf8.txt

Les variables d’environnement ...