Rheinwerk Computing < openbook > Rheinwerk Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
1 Java ist auch eine Sprache
2 Sprachbeschreibung
3 Klassen und Objekte
4 Der Umgang mit Zeichenketten
5 Eigene Klassen schreiben
6 Exceptions
7 Generics<T>
8 Äußere.innere Klassen
9 Besondere Klassen der Java SE
10 Architektur, Design und angewandte Objektorientierung
11 Die Klassenbibliothek
12 Bits und Bytes und Mathematisches
13 Datenstrukturen und Algorithmen
14 Threads und nebenläufige Programmierung
15 Raum und Zeit
16 Dateien, Verzeichnisse und Dateizugriffe
17 Datenströme
18 Die eXtensible Markup Language (XML)
19 Grafische Oberflächen mit Swing
20 Grafikprogrammierung
21 Netzwerkprogrammierung
22 Verteilte Programmierung mit RMI
23 JavaServer Pages und Servlets
24 Datenbankmanagement mit JDBC
25 Reflection und Annotationen
26 Dienstprogramme für die Java-Umgebung
A Die Begleit-DVD
Stichwort
Ihre Meinung?

Spacer
 <<   zurück
Java ist auch eine Insel von Christian Ullenboom
Das umfassende Handbuch
Buch: Java ist auch eine Insel

Java ist auch eine Insel
geb., mit DVD
1482 S., 49,90 Euro
Rheinwerk Computing
ISBN 978-3-8362-1506-0
Pfeil 17 Datenströme
  Pfeil 17.1 Stream-Klassen und Reader/Writer am Beispiel von Dateien
    Pfeil 17.1.1 Mit dem FileWriter Texte in Dateien schreiben
    Pfeil 17.1.2 Zeichen mit der Klasse »FileReader« lesen
    Pfeil 17.1.3 Kopieren mit »FileOutputStream« und »FileInputStream«
    Pfeil 17.1.4 Das FileDescriptor-Objekt *
  Pfeil 17.2 Basisklassen für die Ein-/Ausgabe
    Pfeil 17.2.1 Die abstrakten Basisklassen
    Pfeil 17.2.2 Übersicht über Ein-/Ausgabeklassen
    Pfeil 17.2.3 Die abstrakte Basisklasse »OutputStream«
    Pfeil 17.2.4 Die Schnittstellen »Closeable« und »Flushable«
    Pfeil 17.2.5 Ein Datenschlucker *
    Pfeil 17.2.6 Die abstrakte Basisklasse »InputStream«
    Pfeil 17.2.7 Ressourcen aus dem Klassenpfad und aus Jar–Archiven laden
    Pfeil 17.2.8 Ströme mit SequenceInputStream zusammensetzen *
    Pfeil 17.2.9 Die abstrakte Basisklasse »Writer«
    Pfeil 17.2.10 Die Schnittstelle »Appendable« *
    Pfeil 17.2.11 Die abstrakte Basisklasse »Reader«
  Pfeil 17.3 Formatierte Textausgaben
    Pfeil 17.3.1 Die Klassen »PrintWriter« und »PrintStream«
    Pfeil 17.3.2 »System.out«, »System.err« und »System.in«
  Pfeil 17.4 Schreiben und Lesen aus Strings und Byte-Feldern
    Pfeil 17.4.1 Mit dem »StringWriter« ein String-Objekt füllen
    Pfeil 17.4.2 CharArrayWriter
    Pfeil 17.4.3 »StringReader« und »CharArrayReader«
    Pfeil 17.4.4 Mit »ByteArrayOutputStream« in ein Byte-Feld schreiben
    Pfeil 17.4.5 Mit »ByteArrayInputStream« aus einem Byte-Feld lesen
  Pfeil 17.5 Datenströme filtern und verketten
    Pfeil 17.5.1 Streams als Filter verketten (verschalen)
    Pfeil 17.5.2 Gepufferte Ausgaben mit »BufferedWriter«/»BufferedOutputStream«
    Pfeil 17.5.3 Gepufferte Eingaben mit »BufferedReader«/»BufferedInputStream«
    Pfeil 17.5.4 »LineNumberReader« zählt automatisch Zeilen mit *
    Pfeil 17.5.5 Daten mit der Klasse »PushbackReader« zurücklegen *
    Pfeil 17.5.6 DataOutputStream/DataInputStream *
    Pfeil 17.5.7 Basisklassen für Filter *
    Pfeil 17.5.8 Die Basisklasse »FilterWriter« *
    Pfeil 17.5.9 Ein LowerCaseWriter *
    Pfeil 17.5.10 Eingaben mit der Klasse »FilterReader« filtern *
    Pfeil 17.5.11 Anwendungen für »FilterReader« und »FilterWriter« *
  Pfeil 17.6 Vermittler zwischen Byte-Streams und Unicode-Strömen
    Pfeil 17.6.1 Datenkonvertierung durch den »OutputStreamWriter«
    Pfeil 17.6.2 Automatische Konvertierungen mit dem »InputStreamReader«
  Pfeil 17.7 Kommunikation zwischen Threads mit Pipes *
    Pfeil 17.7.1 »PipedOutputStream« und »PipedInputStream«
    Pfeil 17.7.2 »PipedWriter« und »PipedReader«
  Pfeil 17.8 Datenkompression *
    Pfeil 17.8.1 Java-Unterstützung beim Komprimieren
    Pfeil 17.8.2 Datenströme komprimieren
    Pfeil 17.8.3 Zip-Archive
    Pfeil 17.8.4 Jar-Archive
  Pfeil 17.9 Prüfsummen
    Pfeil 17.9.1 Die Schnittstelle Checksum
    Pfeil 17.9.2 Die Klasse »CRC32«
    Pfeil 17.9.3 Die Adler32-Klasse
  Pfeil 17.10 Persistente Objekte und Serialisierung
    Pfeil 17.10.1 Objekte mit der Standard-Serialisierung speichern und lesen
    Pfeil 17.10.2 Zwei einfache Anwendungen der Serialisierung *
    Pfeil 17.10.3 Die Schnittstelle »Serializable«
    Pfeil 17.10.4 Nicht serialisierbare Attribute aussparen
    Pfeil 17.10.5 Das Abspeichern selbst in die Hand nehmen
    Pfeil 17.10.6 Tiefe Objektkopien *
    Pfeil 17.10.7 Versionenverwaltung und die SUID
    Pfeil 17.10.8 Wie die »ArrayList« serialisiert *
    Pfeil 17.10.9 Probleme mit der Serialisierung
  Pfeil 17.11 Alternative Datenaustauschformate
    Pfeil 17.11.1 Serialisieren in XML-Dateien
    Pfeil 17.11.2 XML-Serialisierung von JavaBeans mit JavaBeans Persistence *
    Pfeil 17.11.3 Open-Source Bibliothek XStream *
  Pfeil 17.12 Tokenizer *
    Pfeil 17.12.1 StreamTokenizer
  Pfeil 17.13 Zum Weiterlesen


Rheinwerk Computing - Zum Seitenanfang

17.12 Tokenizer *  Zur nächsten ÜberschriftZur vorigen Überschrift

Zu den schon im String-Kapitel vorgestellten Tokenizern Scanner, StringTokenizer und split() aus String gibt es im java.io-Paket eine weitere Klasse StreamTokenizer.


Rheinwerk Computing - Zum Seitenanfang

17.12.1 StreamTokenizer  topZur vorigen Überschrift

Die Klasse StreamTokenizer arbeitet noch spezialisierter als die StringTokenizer-Klasse aus dem util-Paket, und die Klasse Scanner kommt der Klasse StreamTokenizer schon sehr nahe. Im Gegensatz zum Scanner beachtet ein StreamTokenizer keine Unicode-Eingabe, sondern nur Zeichen aus dem Bereich von \u0000 bis \u00FF, kann aber mit Kommentaren umgehen.

Während des Parsens erkennt der Tokenizer bestimmte Merkmale, so unter anderem Bezeichner (etwa Schlüsselwörter), Zahlen, Strings in Anführungszeichen und verschiedene Kommentararten (C-Stil oder C++-Stil). Verschiedene Java-Tools von Oracle verwenden intern einen StreamTokenizer, um ihre Eingabedateien zu verarbeiten, etwa das Policy-Tool für die Rechteverwaltung. Der Erkennungsvorgang wird anhand einer Syntaxtabelle überprüft. Diese Tabelle enthält zum Beispiel die Zeichen, die ein Schlüsselwort identifizieren, oder die Zeichen, die Trennzeichen sind. Jedes gelesene Zeichen wird dann keinem, einem oder mehreren Attributen zugeordnet. Diese Attribute fallen in die Kategorie Trennzeichen, alphanumerische Zeichen, Zahlen, Hochkommata beziehungsweise Anführungszeichen oder Kommen-tarzeichen.

Zur Benutzung der Klasse wird zunächst ein StreamTokenizer-Objekt erzeugt, und dann werden die Syntaxtabellen initialisiert. Ob Kommentarzeilen überlesen werden sollen, wird durch

st.slashSlashComments( true );       // Kommentar
st.slashStarComments( true );        /* Kommentar */

gesteuert. Die erste Methode überliest im Eingabestrom alle Zeichen bis zum Return. Die zweite Methode überliest nur alles bis zum Stern/Slash. Geschachtelte Kommentare sind hier nicht möglich.

Beim Lesen des Datenstroms mit nextToken() kann über bestimmte Flags erfragt werden, ob im Stream ein Wort beziehungsweise Bezeichner (TT_WORD), eine Zahl (TT_NUMBER), das Ende der Datei (TT_EOF) oder das Ende der Zeile (TT_EOL) vorliegt. Wichtig ist, eolIsSignificant(true) zu setzen, da andernfalls der StreamTokenizer nie ein TT_EOL findet. Wurde ein Wort erkannt, dann werden alle Zeichen in Kleinbuchstaben konvertiert. Dies lässt sich über die Methode lowerCaseMode(boolean) einstellen. Nach der Initialisierung eines StreamTokenizer-Objekts wird normalerweise so lange nextToken() aufgerufen, bis die Eingabe keine neuen Zeichen mehr hergibt, also ein TT_EOF-Token erkannt wurde.

Ein Beispiel: Die folgende Klasse liest die Eingabe vom Netzwerk und gibt die erkannten Textteile aus:

Listing 17.39  com/tutego/insel/io/stream/StreamTokenizerDemo.java, main()

URL url = new URL( "http://www.tutego.com/index.html" );
Reader reader = new InputStreamReader( url.openStream() );
StreamTokenizer st = new StreamTokenizer( reader );

//     st.slashSlashComments( true ); */
st.slashStarComments( true );
st.ordinaryChar( '/' );
st.parseNumbers();
st.eolIsSignificant( true );

for ( int tval; (tval = st.nextToken()) != StreamTokenizer.TT_EOF; )
{
  if ( tval == StreamTokenizer.TT_NUMBER )
    System.out.println( "Nummer: " + st.nval );
  else if ( tval == StreamTokenizer.TT_WORD )
    System.out.println( "Wort: " + st.sval );
  else if ( tval == StreamTokenizer.TT_EOL )
    System.out.println( "Ende der Zeile" );
  else
    System.out.println( "Zeichen: " + (char) st.ttype );
}

class java.io.StreamTokenizer


  • StreamTokenizer( Reader r ) Erzeugt einen Tokenizer, der den Datenstrom zerlegt. Der Konstruktor, der das Ganze auch mit einem InputStream macht, ist veraltet.
  • void resetSyntax() Reinitialisiert die Syntaxtabelle des Tokenizers, sodass kein Zeichen eine Sonderbehandlung genießt. Mit ordinaryChar() lässt sich das Verhalten eines Zeichens bestimmen.
  • void wordChars( int low, int hi ) Zeichen im Bereich von low <= c <= hi werden als Bestandteile von Wörtern erkannt, dementsprechend zusammengefasst und als Word-Token übergeben. [Dass der Endwert – wie sonst bei den Intervallangaben üblich – inklusive und nicht exklusive ist, stellt einen Stilbruch dar. ]
  • void whitespaceChars( int low, int hi ) Zeichen im Bereich von low <= c <= hi werden als Trennzeichen erkannt.
  • void ordinaryChars( int low, int hi ) Zeichen im Bereich von low <= c <= hi genießen keine Sonderbehandlung und werden als normale Zeichen einzeln behandelt.
  • void ordinaryChar( int ch ) Das Zeichen besitzt keine zusätzliche Funktion, ist zum Beispiel kein Kommentarzeichen, Trennsymbol oder Nummernzeichen. Spezialform für ordinaryChars(ch, ch).
  • void parseNumbers() Zahlen (Zahl-Literale) sollen vom Tokenizer erkannt werden. In der Syntaxtabelle gelten die zwölf Zeichen 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, . und – als numerisch. Liegt eine Ganz- oder Fließkommazahl vor, wird der Zahlenwert in nval abgelegt, und das Token ergibt im Attribut ttype den Wert TT_NUMBER.
  • void commentChar( int ch ) Gibt das Zeichen an, das einen einzeiligen Kommentar einleitet. Alle nachfolgenden Zeichen werden dann bis zum Zeilenende ignoriert. So ließen sich beispielsweise FORTRAN-Kommentare nach commentChar( 'C' ) überlesen.
  • void slashStarComments( boolean flag ) Der Tokenizer soll Kommentare im C-Stil (/* Müll */) erkennen oder nicht.
  • void slashSlashComments( boolean flag ) Der Tokenizer soll Kommentare im C++-Stil (// Zeile ) erkennen oder nicht.
  • void lowerCaseMode( boolean fl ) Liegt in ttype ein Token vom Typ TT_WORD vor, wird es automatisch in Kleinschreibweise konvertiert, falls fl gleich true ist.
  • int nextToken() throws IOException Liefert den nächsten Token im Datenstrom. Der Typ des Tokens wird im Attribut ttype hinterlegt. Zusätzliche Informationen befinden sich im Attribut nval (Nummer) oder sval (Zeichenkette). In der Regel wird so lange geparst, bis der Token TT_EOF zurückgegeben wird.
  • void pushBack() Legt der aktuelle Token in den Eingabestrom zurück. Ein Aufruf von nextToken() liefert erneut den aktuellen Wert im Attribut ttype und ändert nval oder sval nicht.
  • int lineno() Liefert die aktuelle Zeilennummer in der Eingabedatei.

Erweiterungen und Schwächen

Obwohl die nextToken()-Methode eine ganze Reihe von Konvertierungen durchführt, erkennt sie keine in der Exponentialdarstellung geschriebenen Zahlen. Bei einer Gleitkommazahl wie –31.415E-1 versagt die Konvertierung und liefert nur –31.415 als Token vom Typ TT_NUMBER. Da StreamTokenizer nicht final ist, kann jedoch jeder die Klasse so erweitern, dass sie zum Beispiel TT_FLOAT_NUMBER bei einer Gleitkommazahl liefert. Dazu ist die öffentliche Methode nextToken() zu überschreiben und vielleicht auch noch toString(). Die Erweiterung von nextToken() erfordert jedoch etwas Arbeit, da das Original ein wenig unübersichtlich ist.



Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen. >> Zum Feedback-Formular
 <<   zurück
 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Buchempfehlungen
Zum Katalog: Java ist auch eine Insel






 Java ist auch
 eine Insel


Zum Katalog: Java SE Bibliotheken






 Java SE Bibliotheken


Zum Katalog: Professionell entwickeln mit Java EE 7






 Professionell
 entwickeln mit
 Java EE 7


Zum Katalog: Einstieg in Eclipse






 Einstieg in
 Eclipse


Zum Katalog: Einstieg in Java






 Einstieg in
 Java


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Rheinwerk Verlag GmbH 2011
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


Nutzungsbestimmungen | Datenschutz | Impressum

Rheinwerk Verlag GmbH, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, service@rheinwerk-verlag.de

Cookie-Einstellungen ändern