Première partie
Objectifs d'apprentissage
- Concevoir un programme Java pour lire des données du clavier ou d'un fichier texte.
- Concevoir un programme Java pour écrire des données sur la sortie ou dans un fichier texte.
- Modifier un programme Java existant afin de déclarer toutes les exceptions à déclaration obligatoire.
Introduction
Ce laboratoire comporte plusieurs parties. La première partie introduit les concepts de base des entrées-sorties qui seront nécessaires pour réaliser ce laboratoire (conservez ces notes et ces exemples, ça vous sera utile pour le cours structures de données). La seconde partie consiste à modifier l’application PlayListManager afin de lire/écrire les chansons à partir de fichiers.
1. Entrées-sorties (E/S) en Java
Ce document présente les éléments de base pour faire des entrées-sorties (E/S) en Java. Il couvre un sous-ensemble des classes du package java.io. Depuis la version 1.4 de Java, il y a un nouveau package, java.nio (new io), définissant des concepts plus avancés d'E/S tels que les «buffers», «channels», et «memory mapping», ces sujets ne seront pas couverts ici.
Les entrées-sorties en Java semblent assez complexes à première vue. Tout d'abord, il y a un très grand nombre de classes. Ensuite, il faut combiner plusieurs objets pour réaliser les traitements. Pourquoi cette complexité ? Java est un langage moderne, développé au milieu des années 1990s alors que le Web allait devenir une réalité. Ainsi, les données peuvent être lues et écrites à partir de plusieurs sources, dont le clavier, la console, des disques externes, mais aussi le réseau. De plus, la présence du Web a aussi stimulé la création de classes permettant l'internationalisation de programmes (pour les postes de travail anglophones, pour les langues européennes, mais aussi arabes et orientales) ainsi que le traitement de données multimédia.
1.1 Définitions
Un flux (stream) est une séquence ordonnée de données ayant une source ou une destination. Il y a deux genres de flux : les flux de caractères (character streams) et les flux d'octets (byte streams).
Java utilise des Unicodes pour encoder les caractères — les flux de caractères sont en général associés aux entrées-sorties de textes (donc lisible par l'humain). Les flux de caractères s'appellent readers et writers. Ce document traite principalement de ces types de flux. Les flux d'octets (byte streams) sont associés aux entrées-sorties de données (binaires). Les fichiers audio et vidéo, jpeg et mp3, en sont des exemples. Les informations peuvent être lues ou écrites sur un support externe. Pour chaque flux en lecture (ou reader), il existe un flux en écriture (ou writer) correspondant. Il existe aussi un troisième mode d'accès, le mode direct, permettant à la fois les lectures et écritures. Le mode direct n'est pas traité ici.
1.2 Exposé général
Il existe deux genres de flux et trois modes d'accès.
- Flux : caractères ou octets ;
- Accès : lecture, écriture ou direct.
De plus, le support utilisé (clavier, console, disque, mémoire, réseau, etc.) impose aussi ses propres contraintes (faut-il un tampon (buffer) ou pas, par exemple). Le package java.io comporte quelque 50 classes, 10 interfaces et plus de 15 exceptions. Le grand nombre de classes pourrait à lui seul intimider les nouveaux programmeurs. Pour ajouter à cette complexité, il faut généralement combiner des objets de deux ou trois classes afin d'effectuer quelque traitement que ce soit, comme le démontre cet exemple.
InputStreamReader in = new InputStreamReader( new FileInputStream( "data" ) );
Ici “data” est le nom d'un fichier d'entrée. Les sections qui suivent passent en revue les principaux concepts liés aux entrées-sorties en Java. La majorité des concepts sont accompagnés d'exemples et d'exercices. Compilez et exécutez tous les exemples. Complétez tous les exercices.
1.3 Flux
InputStream et OutputStream sont deux classes abstraites définissant les méthodes communes aux flux d'entrée et de sortie.
1.3.1 InputStream
La classe InputStream déclare les trois méthodes suivantes.
- int read() : Lit le prochain octet du flux d'entrée. L'octet lu est retourné dans un entier, intervalle 0 à 255. Si aucun octet n'est disponible, signifiant que la fin du flux a été atteinte, alors la méthode retourne la valeur -1.
- int read( byte[] b ) : Lit plusieurs octets à la fois. Les octets sont sauvegardés dans le tampon (buffer, un tableau) b. La méthode retourne le nombre d'octets lus.
- close() : Fermeture du flux d'entrée. Libère les ressources qui lui sont associées.
La classe InputStream est abstraite. Voici des exemples de ses sous-classes : AudioInputStream, ByteArrayInputStream, FileInputStream, FilterInputStream, ObjectInputStream, PipedInputStream, SequenceInputStream et StringBufferInputStream. Parmi celles-ci, la classe FileInputStream sera présentée ci-bas. Cette classe permet la lecture d'octets à partir d'un fichier.
1.3.2 OutputStream
La classe abstraite OutputStream déclare les méthodes qui suivent.
- write( byte[] b ) : Écrit b.length octets sur la sortie.
- flush() : Vide la mémoire tampon du flux, forçant ainsi l'écriture de tous les octets se trouvant encore dans le tampon.
- close() : Fermeture du flux. Libère les ressources associées à ce flux.
La classe OutputStream est abstraite. Voici des exemples de sous-classes concrètes : ByteArrayOutputStream, FileOutputStream, FilterOutputStream, ObjectOutputStream et PipedOutputStream. Parmi celles-ci, la classe FileOutputStream est utilisée fréquemment et sera étudiée ci-bas. Elle permet l'écriture de l'octet dans un fichier.
1.3.3 System.in et System.out
Deux objets sont prédéfinis par le système. System.in est un flux d'entrée, généralement associé au clavier. System.out est un flux de sortie, généralement associé à la console.
1.4 Étapes
L'écriture dans (ou la lecture depuis) un fichier nécessite en général trois étapes :
- Ouvrir le fichier
- Écriture (ou lecture)
- Fermer le fichier
Il est important de toujours fermer les fichiers afin que les données (possiblement sauvegardées dans un tampon d'écriture) soient sauvegardées dans le fichier, mais aussi afin de libérer les ressources internes et externes associées.
1.5 Lecture
Limitons la portée de cette discussion à la lecture à partir d'un fichier ou la lecture à partir du clavier.
1.5.1 Lecture à partir d'un fichier
Afin de lire des données d'un fichier, il faut créer un objet FileInputStream. Attardons-nous aux deux constructeurs suivants.
- FileInputStream( String name ) : Ce constructeur reçoit le nom du fichier en paramètre. Exemple :
InputStream in = new FileInputStream( "data" );
- FileInputStream( File file ) : Ce constructeur reçoit en paramètre un objet File, un objet représentant le fichier externe.
File f = new File( "data" );
InputStream in = new FileInputStream( f );
L'objet File permet d'effectuer toutes sortes d'opérations sur le fichier. Voici quelques exemples.
f.delete();
f.exists();
f.getName();
f.getPath();
f.length();
FileInputStream est une sous-classe d'InputStream. Tout comme son parent, cette classe ne lit que des octets.
1.5.2 InputStreamReader
La classe InputStreamReader sert de passerelle entre un flux d'octets et un flux de caractères. On l'utilise comme suit.
InputStreamReader in = new InputStreamReader( new FileInputStream( "data" ) );
ou encore,
InputStreamReader in = new InputStreamReader( System.in );
L'objet System.in est généralement associé au clavier du poste de travail.
- int read() : Lecture d'un caractère. Retourne -1 lorsque la fin de l'entrée est atteinte (end-of-file (eof), end-of-stream (eos)). L'entier doit être converti en caractère.
int i = in.read(); if ( i != -1 ) { char c = (char) i; }
Voir Unicode.java et Keyboard.java.
- int read( char [] b ) : Lit plusieurs caractères à la fois. Les caractères sont mis dans le tableau b. La méthode retourne le nombre de caractères lus ou -1 si la fin est atteinte.
char[] buffer = new char[ 256 ]; num = in.read( buffer ); String str = new String( buffer );
Exercice 1 : Concevez une classe afin de lire des caractères au clavier utilisant la méthode read( char[] b ) ; le nombre de caractères lus est déterminé par la taille du tableau (tampon). Utilisez la classe Keyboard comme point de départ. Voici une liste des modifications majeures que vous devrez faire.
- Vous n'avez plus besoin de la variable i pour stocker les valeurs lues. Vous utiliserez plutôt un buffer de type char[] tel que vu précédemment.
- Vous devez changez la condition de votre boucle while. Notamment, la variable i ne fait plus partie de la solution, tandis que vous utiliserez une méthode read( char[] b ) à la place.
- Une fois la lecture faite par la méthode read, l'entrée est stockée dans votre variable tampon (buffer). Vous devez alors la convertir en chaîne de caractères (String).
- Sachez que certains symboles ne sont pas affichables. Vous devez utiliser la méthode trim afin de retirer les caractères non affichables. Notamment, votreString.trim() retourne un nouvel objet de type String sans ces caractères non affichables
- Imprimez maintenant la chaîne de caractère que vous avez obtenue à la console.
- Finalement, vider votre tampon avec la commande suivante: Arrays.fill( buffer, '\u0000' );
Faites quelques tests. Peu importe le nombre de caractères lus, la longueur de la chaîne est toujours 256.
Version initiale deKeyboard.java .
1.5.3 BufferedReader
Certaines applications doivent lire les données ligne par ligne. Pour ces applications, nous utiliserons un (objet) BufferedReader. BufferedReader utilise un objet de la classe InputStreamReader afin de lire les données. Ce dernier, InputStreamReader utilise InputStream afin de lire les octets. Chaque couche (objet) ajoute de nouvelles fonctions. InputStreamReader convertit les octets en caractères. Finalement, BufferedReader regroupe les caractères en chaînes de caractères, par exemple une ligne à la fois.
FileInputStream f = FileInputStream( "data" );
InputStreamReader is = new InputStreamReader( f );
BufferedReader in = new BufferedReader( is );
ou
BufferedReader in = new BufferedReader(
new InputStreamReader(
new FileInputStream("data") ) );
String s = in.readLine();
La classe Copy est un programme qui copie le contenu d'un fichier à votre console.
Notez que le traitement des exceptions est omis dans cet exemple.
import java.io.*;
public class Copy {
public static void copy( String fileName )
throws IOException, FileNotFoundException {
InputStreamReader input;
input = new InputStreamReader( new FileInputStream( fileName ) ); //open file
int c;
while ( ( c = input.read() ) != -1 ) { //we read character by character
System.out.write( c ); //prints on the console
}
input.close(); //close the opened file
}
public static void main( String[] args )
throws IOException, FileNotFoundException {
if ( args.length != 1 ) {
System.out.println( "Usage: java Copy file" );
System.exit( 0 );
}
copy( args[0] );
}
}
Vous pouvez remarquez que le programme Copy copie le contenu du fichier donné en paramètre un caractère à la fois, et ce, jusqu'à ce que la fin du flux de données (eof: end of stream), -1, soit lue par le InputStreamReader. Les trois étapes présentées précédemment y sont aussi respectées, c'est-à-dire l'ouverture du fichier, la lecture, et sa fermeture.
Exercice 2 : Créez un programme affichant toutes les lignes d'un fichier contenant un certain mot. Affichez aussi le numéro de la ligne.
- Vous devrez utiliser la méthode readLine() de la classe BufferedReader. Cette méthode retourne sous forme de chaîne de caractères (un String) le contenu de la ligne ou null si nous avons atteint la fin du fichier.
- Vous devrez ensuite vérifier si le mot donné fait partie du String. Pour ce faire, utilisez la méthode indexOf(votreMot) qui vous retournera la position de votre mot dans la chaîne de caractères ou -1 s'il n'en fait pas partit.
Voici le code à partir duquel vous pouvez résoudre le problème. Find.java
Exercice 3 : Modifier le code de l'exercice précédent afin de calculer le nombre de fois que se trouvent le mot Ottawa dans le fichier suivant : Ottawa.txt
Indice: une fois que vous avez trouvé le premier index du mot Ottawa dans le String, vous pouvez diviser votre String en utilisant a méthode de String substring(int index) qui retourne un nouvel objet de type String contenant la chaîne de caractère commençant par le caractère la position du paramètre index et finissant à la fin du String original.
Plutôt qu’un fichier, il est possible d’utiliser une adresse URL comme source. Dans ce cas il faut importer « java.net.* », puis créer un nouvel objet URL. Lorsque l’on crée le InputStreamReader, il faut aussi s’assurer d’appeler la méthode openStream de l’objet URL pour que l’on puisse lire l’information.
URL address = new URL("http://www.google.ca");
InputStreamReader is = new InputStreamReader(address.openStream());
Exercice 4 : Implémentez une classe afin de télécharger et afficher le contenu d'une page Web. Essayez-la avec plusieurs adresses, notamment avec la page web de ce laboratoire. Comme vous n'utiliserez pas de fichiers pour cet exercice, l'exception FileNotFoundException ne fera pas partie de la déclaration des méthodes parmi les méthodes qui peuvent être lancées (throws).Notez toutefois que l'usage d'objet de la classe URL peut lancer l'exception MalformedURLException.
1.6 Écriture
Considérons maintenant l'écriture sur sortie standard ainsi que l'écriture dans un fichier. Vous remarquerez la similarité avec la lecture.
1.6.1 Écrire dans un fichier
Afin d'écrire dans un fichier, nous utiliserons un (objet) FileOutputStream. Voici deux constructeurs.
- FileOutputStream( String name ) : Crée un flux de sortie pour l'écriture dans un fichier nommé name.
OutputStream out = new FileOutputStream( "data" );
- FileOutputStream( File file ) : Ce constructeur reçoit un objet File.
File f = new File( "data" ); OutputStream out = new FileOuputStream( f );
Tout comme son parent, OutputStream, cette classe ne sert qu'à l'écriture d'octets.
- OutputStreamWriter : Une passerelle pour la conversion de caractères en octets.
OutputStreamWriter out = new OutputStreamWriter( new FileOutputStream( "data " ) );
ou
OutputStreamWriter out = new OutputStreamWriter( System.out ); OutputStreamWriter err = new OutputStreamWriter( System.err );
Les messages d'erreurs sont en général écrits sur System.err, la sortie standard. Voici les méthodes de la classe OutputStreamWriter.
- write( int c ) : Écrit un seul caractère ;
- write( char[] buffer ) : Écrit le contenu du tableau sur la sortie ;
- write( String s ) : Écriture d'une chaîne de caractères.
Exercice 5 : Modifiez le programme Copy.java afin de spécifier un fichier destination. Ainsi, l'application copie le contenu d'un fichier d'entrée dans un fichier en sortie.
- PrintWriter : Cette classe définit un ensemble de méthodes permettant l'écriture de valeurs d'un type primitif ou objet.
print( boolean b ) : Prints a boolean value. print( char c ) : Prints a character. print( char[] s ) : Prints an array of characters. print( double d ) : Prints a double-precision floating-point number. print( float f ) : Prints a floating-point number. print( int i ) : Prints an integer. print( long l ) : Prints a long integer. print( Object obj ) : Prints an object. print( String s ) : Prints a string.
Le méthodes suivantes affichent aussi un séparateur de lignes (le séparateur varie selon le système d'exploitation utilisé, cette difficulté est traitée pour nous par l'objet PrintWriter).
println() : Prints a line separator string. println( boolean b ) : Prints a boolean value. println( char c ) : Prints a character. println( char[] s ) : Prints an array of characters. println( double d ) : Prints a double-precision floating-point number. println( float f ) : Prints a floating-point number. println( int i ) : Prints an integer. println( long l ) : Prints a long integer. println( Object obj ) : Prints an object. println( String s ) : Prints a string.
1.7 Fichiers CSV
Les fichiers à valeurs séparées par virgules (Comma-Separated Values – CSV ) sont des fichiers de texte simple dans lesquels les données sont enregistrées colonne par colonne, et divisées par un séparateur. Le séparateur est généralement une virgule « , ». Les fichiers de format CSV peuvent être importés ou exportés d’un programme qui enregistre ces données sous forme de tableau. Un parseur (analyseur) peut prendre un fichier CSV et convertir le texte CSV dans un tableau ou un objet qui sera utilisé par le programme.
Par exemple, voici un fichier CSV qui contient un bottin des indicatifs régionaux de différent pays :
"1","US","United States"
"2","MY","Malaysia"
"3","AU","Australia"
Dans une application simple, nous utilisons la méthode standard split() pour parser le fichier CSV. L’exemple suivant est un fichier CSV simple, sauvegardé dans le fichier "/Users/admin/csv/country.csv":
"1.0.0.0","1.0.0.255","16777216","16777471","AU","Australia"
"1.0.1.0","1.0.3.255","16777472","16778239","CN","China"
"1.0.4.0","1.0.7.255","16778240","16779263","AU","Australia"
"1.0.8.0","1.0.15.255","16779264","16781311","CN","China"
"1.0.16.0","1.0.31.255","16781312","16785407","JP","Japan"
"1.0.32.0","1.0.63.255","16785408","16793599","CN","China"
"1.0.64.0","1.0.127.255","16793600","16809983","JP","Japan"
"1.0.128.0","1.0.255.255","16809984","16842751","TH","Thailand"
Pour parser le fichier CSV, il suffit de lire le fichier, puis de le diviser par le séparateur (la virgule « , ») en utilisant line.split(","). Vous pouvez ensuite prendre le texte parser et l’utiliser ou le formater comme vous le désirez.
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
public class CSVReader {
public static void main(String[] args) {
String csvFile = "/Users/admin/csv/country.csv";
BufferedReader br = null;
String line = "";
try {
br = new BufferedReader(new FileReader(csvFile));
while ((line = br.readLine()) != null) {
// use comma as separator
String[] country = line.split(",");
System.out.println("Country [code= " + country[4] + " , name=" + country[5] + "]");
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
if (br != null) {
try {
br.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
}
Exécuter le code si dessus nous donne une possibilité de formatage des données, voici la sortie :
Country [code= "AU" , name="Australia"]
Country [code= "CN" , name="China"]
Country [code= "AU" , name="Australia"]
Country [code= "CN" , name="China"]
Country [code= "JP" , name="Japan"]
Country [code= "CN" , name="China"]
Country [code= "JP" , name="Japan"]
Country [code= "TH" , name="Thailand"]
Lorsque l’on parse des fichiers CSV, il y a deux problèmes courants :
- Le séparateur est aussi contenu dans les données. Par exemple : "aaa","b,bb","ccc". Dans ce cas, la virgule « , » est le séparateur, mais elle apparait aussi dans la donne b,bb que nous ne voulons pas séparer.
- Les guillemets anglais « " » sont utilisés pour contenir les données, mais les données contiennent aussi des guillemets anglais. Par exemple : "aaa","b""bb","ccc". Dans ce cas, les guillemets sont contenus dans la donnée b""bb. Notez que pour que le guillemet apparaisse dans la donnée, il doit être échappé en la précédant par un autre guillemet.
Pour ces deux problèmes courants, il existe des solutions plus avancées qui sont requises pour parser les fichiers CSV formatés avec des données contenants des séparateurs ou des guillemets.
Rappel: Les exceptions
Cette section revisite quelques concepts liés aux traitements des exceptions en Java et présente ceux qui sont spécifiques aux traitements des entrées-sorties.
IOException
“Signals that an I/O exception of some sort has occurred. This class is the general class of exceptions produced by failed or interrupted I/O operations.” Cela signifie qu'une exception quelconque d'entrée ou sortie (I/O) s'est produite. Cette classe est la classe générale des exceptions pouvant se produire lors de l'échec ou l'interruption d'action d'entrée/sortie. IOException est une sous-classe d'Exception. Ces exceptions doivent être traitées : à l'aide de blocs try/catch ou d'une déclaration.
FileNotFoundException
Le constructeur FileInputStream(String name) peut lancer une exception de type FileNotFoundException si le fichier name n'est pas trouvé.
Revoyez les exercices précédents et ajoutez les blocs try/catch afin de traiter les exceptions déclarées (throws).