Traitement de données

1. Comptage de lignes, de mots et de caractères : wc wc

La commande wc (word count) compte le nombre de lignes, de mots et de caractères. 

Syntaxe

wc [ options ] [ fichier ... ]  

Principales options :

-l

Compter le nombre de lignes.

-w

Compter le nombre de mots.

-c

Compter le nombre d’octets.

-m

Compter le nombre de caractères.

Exemples

Nombre de lignes, mots et caractères du fichier notes.txt :

$ wc notes.txt 
5  15  245 notes.txt 

Nombre de lignes uniquement :

$ wc -l notes.txt 
5 notes.txt 

Nombre de caractères contenus dans un nom de fichier saisi au clavier (attention au saut de ligne ajouté par la commande echo) :

$ read nomfic 
document.xls 
ˆd 
$ echo "$nomfic\c" | wc -c    # Linux : $ echo -n "$nomfic" | wc -c 
12 
$ 

Voici un fichier encodé en UTF-8 (les caractères accentués sont encodés sur 2 octets), manipulé sur un système dont l’encodage est également UTF-8 :

$ echo $LANG 
fr_FR.utf8 

Le fichier contient 2 caractères accentués :

$ cat utf8.txt 
élève 

La commande od nous montre que chaque caractère accentué du fichier est encodé sur 2 octets :

$ od -c utf8.txt 
0000000 303 251 l 303 250 v e \n 
0000010 

Nombre d’octets du fichier :

$ wc -c utf8.txt 
8 utf8.txt 

Nombre de caractères du fichier :

$ wc -m utf8.txt 
6 utf8.txt 

Les variables...

couv_EI7PRO.png

Découvrez 

le livre :

Aussi inclus dans nos :

Précédent
Visualisation de données
Suivant
Compressions, archivages et conversions