Traitement de données
1. Comptage de lignes, de mots et de caractères : wc wc
La commande wc (word count) compte le nombre de lignes, de mots et de caractères.
Syntaxe
wc [ options ] [ fichier ... ]
Principales options : |
|
-l |
Compter le nombre de lignes. |
-w |
Compter le nombre de mots. |
-c |
Compter le nombre d’octets. |
-m |
Compter le nombre de caractères. |
Exemples
Nombre de lignes, mots et caractères du fichier notes.txt :
$ wc notes.txt
5 15 245 notes.txt
Nombre de lignes uniquement :
$ wc -l notes.txt
5 notes.txt
Nombre de caractères contenus dans un nom de fichier saisi au clavier (attention au saut de ligne ajouté par la commande echo) :
$ read nomfic
document.xls
ˆd
$ echo "$nomfic\c" | wc -c # Linux : $ echo -n "$nomfic" | wc -c
12
$
Voici un fichier encodé en UTF-8 (les caractères accentués sont encodés sur 2 octets), manipulé sur un système dont l’encodage est également UTF-8 :
$ echo $LANG
fr_FR.utf8
Le fichier contient 2 caractères accentués :
$ cat utf8.txt
élève
La commande od nous montre que chaque caractère accentué du fichier est encodé sur 2 octets :
$ od -c utf8.txt
0000000 303 251 l 303 250 v e \n
0000010
Nombre d’octets du fichier :
$ wc -c utf8.txt
8 utf8.txt
Nombre de caractères du fichier :
$ wc -m utf8.txt
6 utf8.txt
Les variables...