Rheinwerk Computing < openbook > Rheinwerk Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
1 Neues in Java 7
2 Threads und nebenläufige Programmierung
3 Datenstrukturen und Algorithmen
4 Raum und Zeit
5 Dateien, Verzeichnisse und Dateizugriffe
6 Datenströme
7 Die eXtensible Markup Language (XML)
8 Dateiformate
9 Grafische Oberflächen mit Swing
10 Grafikprogrammierung
11 Netzwerkprogrammierung
12 Verteilte Programmierung mit RMI
13 RESTful und SOAP Web-Services
14 JavaServer Pages und Servlets
15 Applets
16 Datenbankmanagement mit JDBC
17 Technologien für die Infrastruktur
18 Reflection und Annotationen
19 Dynamische Übersetzung und Skriptsprachen
20 Logging und Monitoring
21 Java Native Interface (JNI)
22 Sicherheitskonzepte
23 Dienstprogramme für die Java-Umgebung
Stichwort

Buch bestellen
Ihre Meinung?

Spacer
Java 7 - Mehr als eine Insel von Christian Ullenboom
Das Handbuch zu den Java SE-Bibliotheken
Buch: Java 7 - Mehr als eine Insel

Java 7 - Mehr als eine Insel
Rheinwerk Computing
1433 S., 2012, geb.
49,90 Euro, ISBN 978-3-8362-1507-7
Pfeil 8 Dateiformate
Pfeil 8.1 Einfache Dateiformate für strukturierte Daten
Pfeil 8.1.1 Property-Dateien
Pfeil 8.1.2 CSV-Dateien
Pfeil 8.1.3 JSON-Serialisierung mit Jackson
Pfeil 8.2 Dokumentenformate
Pfeil 8.2.1 (X)HTML
Pfeil 8.2.2 PDF-Dokumente
Pfeil 8.2.3 Microsoft Office-Dokumente
Pfeil 8.2.4 OASIS Open Document Format
Pfeil 8.3 Datenkompression *
Pfeil 8.3.1 Java-Unterstützung beim Komprimieren
Pfeil 8.3.2 Daten packen und entpacken
Pfeil 8.3.3 Datenströme komprimieren
Pfeil 8.3.4 Zip-Archive
Pfeil 8.3.5 Jar-Archive
Pfeil 8.4 Bild-Formate
Pfeil 8.5 Audio-Dateien
Pfeil 8.5.1 Die Arbeit mit AudioClip
Pfeil 8.5.2 MIDI-Dateien abspielen

Rheinwerk Computing - Zum Seitenanfang

8.3 Datenkompression *Zur nächsten Überschrift

Damit Daten weniger Platz auf dem Datenträger einnehmen, werden sie komprimiert. Bei Netzwerkverbindungen ist die logische Konsequenz, dass weniger Daten natürlich auch schneller übertragen werden. Über alle Plattformen hinweg haben sich Standards gebildet. Zwei Kompressionsstandards sollen an dieser Stelle beschrieben werden.

compress/uncompress, GZip/GunZip

Seitdem der LZW-Algorithmus im Juni 1984 im IEEE-Journal beschrieben wurde, gibt es in jedem Unix-System die Dienstprogramme compress und uncompress, die verlustfrei Daten zusammenpacken und wieder auspacken.[61](Interessanterweise wurde danach der LZW-Algorithmus von der Sperry Company patentiert – dies zeigt eigentlich, wie unsinnig das Patentrecht in den USA ist.) gzip und gunzip[62](Gibt es sogar für den C64: http://www.cs.tut.fi/~albert/Dev/gunzip/) sind freie Unix-Tools von compress/uncompress und unterliegen der GNU Public License. Das Format enthält eine zyklische Überprüfung bezüglich defekter Daten. Die Endung einer Datei, die mit gzip gepackt ist, wird mit .gz angegeben, wobei die Endung unter compress nur .Z ist. gzip behält die Rechte und Zeitattribute der Dateien bei.

Zip

Das Dienstprogramm zip bündelt in einem Archiv mehrere Dateien und kann die hierarchische Struktur der Ordner erhalten. Auf jede Datei im Zip-Archiv lässt sich anschließend individuell zugreifen. Programme wie WinZip oder 7-Zip können unter Windows Zip-Dateien verarbeiten. Obwohl Zip und GZip von der Anwendung her unterschiedlich arbeiten – GZip stellt einen Filter dar, der einen Datenstrom komprimiert –, verwenden sie denselben Algorithmus. Beide basieren auf Algorithmen, die im RFC 1952 definiert sind.

Es gibt auch unkomprimierte Zip-Archive (allerdings selten). Ein Beispiel dafür sind die Java-Archive des frühen Internet Explorers. Die größte Datei ist unkomprimiert 5,3 MB groß, gepackt wäre sie 2 MB schwer. Sie wurde aus Gründen der Geschwindigkeit nicht gepackt, da sich die Daten aus unkomprimierten Archiven schneller lesen lassen, weil keine Prozessorleistung für das Entpacken aufzuwenden ist.

Das Archivformat und Archivierungsprogramm tar

Das unter Unix-Systemen bekannte Dienstprogramm tar[63](»tar« steht für tape archiver, was übersetzt Bandarchivierer heißt.) bündelt mehrere Dateien zu einer neuen Datei, ohne sie zu komprimieren. Das Ergebnis, ein Tar-Archiv, wird oft anschließend mit dem Tool gzip beziehungsweise bzip2 gepackt. Die Endung ist dann .tar.Z. Werden mehrere Daten erst in einem Tar-Archiv zusammengefasst und dann gepackt, ist die Kompressionsrate höher, als wenn jede Datei einzeln komprimiert wird. Der Grund ist simpel: Das Kompressionsprogramm kann die Redundanz besser ausnutzen. Der Nachteil ist freilich, dass für eine Datei gleich das ganze Tar-Archiv ausgepackt werden muss.


Rheinwerk Computing - Zum Seitenanfang

8.3.1 Java-Unterstützung beim KomprimierenZur nächsten ÜberschriftZur vorigen Überschrift

Unter Java ist ein Paket java.util.zip eingerichtet, um mit komprimierten Dateien zu operieren. Das Paket bietet zur Komprimierung zwei allgemein gebräuchliche Formate: GZip/GunZip zum Komprimieren beziehungsweise Entkomprimieren von Datenströmen und Zip zum Behandeln von Archiven und zum Komprimieren von Dateien. Auch wird das eigene Archiv-Format Jar (Java Archive) durch das Paket java.util.jar unterstützt. Jar ist eine Erweiterung des Zip-Formats. Speziell Klassendateien in Java-Archiven können durch java.util.jar.Pack200 noch höher komprimiert werden.

Ingesamt finden sich Klassen zum

  • Packen/Entpacken von Bytefeldern,
  • Behandlen von Zip/Jar-Archiven und zum
  • (De)Komprimieren von Datenströmen.

Unterstützung von Tar und BZip2 von Drittanbietern

Tar-Archive werden nicht unterstützt, doch gibt es eine Reihe freier Implementierungen, unter anderem von der Apache Software Foundation: http://tutego.de/go/tarcvs; sie definieren Ein- und Ausgabeströme. Für BZip2 bietet die Apache Foundation Unterstützung über das Paket Commons Compress (http://tutego.de/go/bzip2). Neben der Unterstützung durch das Paket java.util.zip für GZip-Ströme und Zip-Dateien ist TrueZIP (https://truezip.dev.java.net/) eine sehr interessante Open-Source-Bibliothek, die die Archivarbeit stark vereinfacht.


Rheinwerk Computing - Zum Seitenanfang

8.3.2 Daten packen und entpackenZur nächsten ÜberschriftZur vorigen Überschrift

Im Mittelpunkt der Kompression und Dekompression stehen die Klassen java.util.zip.Deflater (komprimieren) und java.util.zip.Inflater (entpacken). Dort sind die zentralen Methoden deflate() und inflate() zu finden. Ein Beispiel zeigt die Nutzung anschaulich:

Listing 8.1: com/tutego/insel/io/zip/InflaterDeflaterDemo.java, main()

byte[] input = { 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1 };

// Komprimieren

byte[] output = new byte[ 100 ];
Deflater compresser = new Deflater( Deflater.BEST_COMPRESSION );
compresser.setInput( input );
compresser.finish();
int compressedBytes = compresser.deflate( output );

// Komprimiertes Ergebnis zur Demonstration ausgeben

for ( int i = 0; i < compressedBytes; i++ )
System.out.printf( "%02x ", output[i] );
// 78 da 63 60 60 60 60 64 64 44 22 01 00 51 00 09
System.out.println();

// Dekomprimieren

Inflater decompresser = new Inflater();
decompresser.setInput( output, 0, compressedBytes );
byte[] result = new byte[ 100 ];
int uncompressedBytes = decompresser.inflate( result );
decompresser.end();

// Dekomprimiertes Ergebnis ist der Eingang

for ( int i = 0; i < uncompressedBytes; i++ )
System.out.printf( "%02x ", result[i] );
// 00 00 00 00 01 01 01 00 00 00 01 01 01 00 00 00 01 01

Dem Deflater kann im Konstruktor eine Kompressionsqualität mitgegeben werden; ohne Angabe ist das DEFAULT_COMPRESSION. Als Nächstes werden dem Deflater die zu komprimierenden Daten übergeben – das übernimmt setInput(), eine Methode, die es auch überladen gibt, um nur einen Ausschnitt eines Arrays beachten zu können. Die finish()-Methode signalisiert, dass die Kompression mit den gegebenen Daten endet. deflate() startet die eigentliche Kompression und schreibt das Ergebnis in das übergebe Byte-Array. Die Rückgabe der Methode sagt etwas über die komprimierten Bytes aus. Die Feldgröße muss für das komprimierte Ergebnis groß genug sein, andernfalls wird das Ergebnis einfach abgeschnitten und die Rückgabe ist gleich der Feldgröße, was wenig nützlich ist.

Das Entpacken ist im Prinzip genauso zu verstehen. Dem Inflater ist nicht die Kompressionsqualität zu übergeben, die steckt im komprimierten Feld selbst. Die Eingabe setzt setInput(), wobei auch diese Methode wieder überladen ist. Da wir hier nur einen Teil des Puffers betrachten, ist die Methode mit dem Feld, Start- und Endwert genau richtig. Abschließend packt inflate() aus und setzt das unkomprimierte Ergebnis in das Feld, das der Methode übergeben wurde. Die Rückgabe ist die Anzahl entpackter Bytes. end() gibt Ressourcen frei.

Die Klassen Deflater und Inflater sind einfach gestrickt und behandeln nur Arrays, sind aber keine Datenstöme (InputStream/OutputStream), mit denen Entwickler oft Daten verarbeiten. Daher bietet die Java-Bibliothek spezielle Stream-Klassen, die im Hintergrund mit den Deflater/Inflater-Klassen arbeiten.


Rheinwerk Computing - Zum Seitenanfang

8.3.3 Datenströme komprimierenZur nächsten ÜberschriftZur vorigen Überschrift

Zum Packen und Entpacken von Strömen wollen wir uns im Folgenden das populäre GZip-Kompressionsformat und die Datenströme java.util.zip.GZIPInputStream (ein spezieller FilterInputStream) und java.util.zip.GZIPOutputStream (ein FilterOutputStream) genauer anschauen.

Abbildung

Abbildung 8.1: UML-Diagramm mit den GZIPXXXStream-Klassen

Daten packen

Das Paket java.util.zip bietet zwei Unterklassen von DeflaterOutputStream (eine Unterklasse von FilterOutputStream), die das Schreiben komprimierter Daten ermöglichen: GZIPOutputStream und ZipOutputStream. Um Daten unter dem GZip-Algorithmus zu packen, müssen wir einfach einen vorhandenen Datenstrom zu einem GZIPOutputStream erweitern. Die Klasse ZipOutputStream dient Zip-Archiven, denen wir uns später widmen werden.

OutputStream fos    = new FileOutputStream( file );
OutputStream zipout = new GZIPOutputStream( fos );

Abbildung

Abbildung 8.2: Klassendiagramm mit Methoden aus GZIPOutputStream und ihrer Oberklasse

class java.util.zip.GZIPOutputStream
extends DeflaterOutputStream
  • GZIPOutputStream(OutputStream out)
    Erzeugt einen packenden Datenstrom mit der voreingestellten Puffergröße von 512 Byte.
  • GZIPOutputStream(OutputStream out, int size)
    Erzeugt einen packenden Datenstrom mit einem Puffer der Größe size.

GZip-Kommandozeilenprogramm

Das folgende Programm soll eine Datei nach dem GZip-Format packen. Es verhält sich in der Arbeitsweise ähnlich wie das unter Unix bekannte Programm gzip:

Listing 8.2: com/tutego/insel/io/zip/gzip.java

package com.tutego.insel.io.zip;

import java.io.*;
import java.util.zip.*;

public class gzip
{
public static void main( String[] args )
{
if ( args.length != 1 ) {
System.err.println( "Benutzung: gzip <source>" );
return;
}

OutputStream os = null;
InputStream is = null;

try
{
os = new GZIPOutputStream( new FileOutputStream( args[0] + ".gz" ) );
is = new FileInputStream( args[0] );

byte[] buffer = new byte[ 8192 ];

for ( int length; (length = is.read(buffer)) != –1; )
os.write( buffer, 0, length );
}
catch ( IOException e )
{
System.err.println( "Fehler: Kann nicht packen " + args[0] );
}
finally
{
if ( is != null )
try { is.close(); } catch ( IOException e ) { e.printStackTrace(); }
if ( os != null )
try { os.close(); } catch ( IOException e ) { e.printStackTrace(); }
}
}
}

Das Programm prüft zuerst, ob ein Argument auf der Kommandozeile vorhanden ist. Aus diesem Argument konstruiert es einen Dateinamen mit der Endung .gz. Den Dateinamen bekommt der Konstruktor von FileOutputStream. Den OutputStream dekoriert anschließend der GZIPOutputStream. Die read()-Methode vom FileInputStream liest Block für Block aus der Datei und schreibt die gelesenen Segmente in den GZIPOutputStream, der die Daten komprimiert.

Daten entpacken

Um die Daten zu entpacken, müssen wir nur den umgekehrten Weg beschreiten. Zum Einsatz kommt hier eine der beiden Unterklassen von DeflaterInputStream (einer direkten Unterklasse von FilterInputStream). Wieder wickeln wir einen GZIPInputStream um einen InputStream und lesen dann daraus.

class java.util.zip.GZIPInputStream
extends InflaterInputStream
  • GZIPInputStream(InputStream in, int size)
    Erzeugt einen auspackenden Datenstrom mit einem Puffer der Größe size.
  • GZIPInputStream(InputStream in)
    Erzeugt einen auspackenden Datenstrom mit der voreingestellten Puffergröße von 512 Byte.

GunZip-Kommandozeilenprogramm

Zum Java-Programm gzip wollen wir eine zweite Anwendung hinzunehmen, die sich so verhält, wie das unter Unix bekannte Kommandozeilenprogramm gunzip:

Listing 8.3: com/tutego/insel/io/zip/gunzip.java

package com.tutego.insel.io.zip;

import java.io.*;
import java.util.zip.*;

public class gunzip
{
public static void main( String[] args )
{
if ( args.length != 1 ) {
System.err.println( "Benutzung: gunzip <source>" );
return;
}

String source, destination;

if ( args[0].toLowerCase().endsWith(".gz") ) {
source = args[0];
destination = source.substring( 0, source.length() – 3 );
}
else {
source = args[0] + ".gz";
destination = args[0];
}

InputStream is = null;
OutputStream os = null;

try
{
is = new GZIPInputStream( new FileInputStream(source) );
os = new FileOutputStream( destination );

byte[] buffer = new byte[ 8192 ];

for ( int length; (length = is.read(buffer)) != –1; )
os.write( buffer, 0, length );
}
catch ( IOException e )
{
System.err.println( "Fehler: Kann nicht entpacken " + args[0] );
}
finally
{
if ( os != null ) try { os.close(); } catch ( IOException e ) {
e.printStackTrace(); }
if ( is != null ) try { is.close(); } catch ( IOException e ) {
e.printStackTrace(); }
}
}
}

Endet die Datei mit .gz, so entwickeln wir daraus den herkömmlichen Dateinamen. Endet sie nicht mit diesem Suffix, so nehmen wir einfach an, dass die gepackte Datei diese Endung besitzt, der Benutzer diese aber nicht angegeben hat. Nach dem Zusammensetzen des Dateinamens holen wir von der gepackten Datei einen FileInputStream und packen einen GZIPInputStream darum. Nun öffnen wir die Ausgabedatei und schreiben in Blöcken zu 8 KiB die Datei vom GZIPInputStream in die Ausgabedatei.


Rheinwerk Computing - Zum Seitenanfang

8.3.4 Zip-ArchiveZur nächsten ÜberschriftZur vorigen Überschrift

Der Zugriff auf die Daten eines Zip-Archivs unterscheidet sich schon deshalb vom Zugriff auf die Daten eines GZip-Streams, weil diese in Form eines Archivs vorliegen. Unter Zip wird jede eingebettete Datei einzeln und unabhängig komprimiert. Wurden etwa über Tar vorher alle Dateien in ein unkomprimiertes Archiv übernommen, kann der Packalgorithmus GZip beim Packen dieser Dateisammlung bessere Ergebnisse erzielen, als wenn – wie beim Zip-Verfahren – alle Dateien einzeln gepackt würden.

Das ursprüngliche Zip-Format behandelt nur Dateien bis 4 GB. Diese Beschränkung behebt ZIP64, was Java ebenfalls ab der Version 7 unterstützt.

Die Klassen ZipFile und ZipEntry

Objekte der Klasse ZipFile repräsentieren ein Zip-Archiv. Die Einträge im Zip-Archiv sind Dateien und Ordner, die Java durch die Klasse ZipEntry darstellt. Liegt einmal ein ZipEntry-Objekt vor, können ihm durch verschiedene Methoden Dateiattribute entlockt werden, beispielsweise die Originalgröße, das Kompressionsverhältnis, das Datum, wann die Datei angelegt wurde, und weitere Informationen. Auch kann ein Datenstrom erzeugt werden, sodass sich eine komprimierte Datei im Archiv lesen und schreiben lässt.

Um auf die Dateien eines Archivs zuzugreifen, muss zunächst ein ZipFile-Objekt erzeugt werden.

Abbildung

Abbildung 8.3: UML-Diagramm von ZipFile und ZipEntry

class java.util.zip.ZipFile
  • ZipFile(String name) throws ZipException, IOException
  • ZipFile(File file) throws ZipException, IOException
    Öffnet ein Zip-Archiv zum Lesen über den Dateinamen oder das File-Objekt.
  • ZipFile(File file, int mode) throws ZipException, IOException
    Öffnet ein Zip-Archiv mit dem gegebenen File-Objekt. Der Modus ZipFile.OPEN_READ oder ZipFile.OPEN_READ|ZipFile.OPEN_DELETE bestimmt den Zugriff auf das Archiv.

Eine ZipException ist eine Unterklasse von IOException.

Die im Zip-Archiv abgelegten Dateien oder Verzeichnisse, also die ZipEntry-Einträge, können auf zwei Arten ermittelt werden:

  • Die Methode entries() von ZipFile liefert eine Aufzählung von ZipEntry-Einträgen. Genauer gesagt ist der Rückgabetyp Enumeration<? extends ZipEntry>.
  • Ist der Name der komprimierten Datei oder des Ordners bekannt, liefert getEntry(String) sofort ein ZipEntry-Objekt.
Beispiel

Iteriere durch die Einträge eines Archivs, und gib die Namen aus:

ZipFile zf = new ZipFile( "foo.zip" );
for ( Enumeration<? extends ZipEntry> e = zf.entries(); e.hasMoreElements(); )
{
ZipEntry entry = e.nextElement();
System.out.println( entry.getName() );
}

Mit Collections.list(Enumeration<T> e) lässt sich die Schleife mit einem erweiterten for verkürzen. Die folgenden Beispiele nutzen diese Möglichkeit.

class java.util.zip.ZipFile
  • ZipEntry getEntry(String name)
    Liefert eine Datei aus dem Archiv. Liefert null, wenn kein Eintrag mit dem Namen existiert.
  • Enumeration<? extends ZipEntry> entries()
    Gibt eine Aufzählung des Zip-Archivs in Form von ZipEntry-Objekten zurück.
  • String getName()
    Liefert den Pfadnamen des Zip-Archivs.
  • int size()
    Gibt die Anzahl der Einträge im Zip-Archiv zurück.
  • void close() throws IOException
    Schließt das Zip-Archiv.

Eine IllegalStateException ist bei getEntry() und entries() die Folge, wenn das Zip-Archiv schon geschlossen wurde.

ZipEntry und die Datei-Attribute

Ein ZipEntry-Objekt repräsentiert eine Datei oder ein Verzeichnis eines Archivs. Diese Datei kann gepackt (dafür ist die Konstante ZipEntry.DEFLATED reserviert) oder auch ungepackt sein (angezeigt durch die Konstante ZipEntry.STORED). Auf dem Objekt können verschiedene Attribute gesetzt und abgefragt werden. Dadurch lassen sich Statistiken über Kompressionsraten und Weiteres ermitteln:

Listing 8.4: com/tutego/insel/io/zip/ZipListDemo.java, main()

ZipFile zipFile = new ZipFile( file );
for ( ZipEntry entry : Collections.list( zipFile.entries() ) )
System.out.printf( "%s%-54s Größe: %6d Gepackt: %6d %tc%n",
entry.isDirectory() ? "+" : " ",
entry.getName(),
entry.getSize(),
entry.getCompressedSize(),
entry.getTime() );

Die Ausgabe könnte zum Beispiel sein:

+a/                Größe:      0   Gepackt:      0   Do Mai 24 10:13:46 CEST 2007
a/a.html Größe: 42924 Gepackt: 6962 Do Mai 24 10:03:20 CEST 2007
a/links.xml Größe: 18900 Gepackt: 1406 Do Mai 24 10:03:20 CEST 2007
class java.util.zip.ZipEntry
implements Cloneable
  • String getName()
    Liefert den Namen des Eintrags.
  • void setTime(long time)
    Ändert die Modifikationszeit des Eintrags.
  • long getTime()
    Liefert die Modifikationszeit des Eintrags oder –1, wenn diese nicht angegeben ist.
  • void setSize(long size)
    Setzt die Größe der unkomprimierten Datei. Wir werden mit einer IllegalArgumentException bestraft, wenn die Größe kleiner 0 oder größer 0xFFFFFFFF ist.
  • long getSize()
    Liefert die Größe der unkomprimierten Datei oder –1, falls diese unbekannt ist.
  • long getCrc()
    Liefert die CRC-32-Checksumme der unkomprimierten Datei oder –1, falls diese unbekannt ist.
  • void setMethod(int method)
    Setzt die Kompressionsmethode entweder auf STORED oder auf DEFLATED.
  • int getMethod()
    Liefert die Kompressionsmethode. Die Rückgabe ist entweder STORED, DEFLATED oder –1, falls unbekannt.
  • void setExtra(byte[] extra)
    Setzt das optionale Zusatzfeld für den Eintrag. Übersteigt die Größe des Zusatzfelds 0xFFFF Byte, dann wird eine IllegalArgumentException ausgelöst.
  • byte[] getExtra()
    Liefert das Extrafeld oder null, falls es nicht belegt ist.
  • void setComment(String comment)
    Setzt einen Kommentar-String, der 0xFFFF Zeichen lang sein darf (sonst wird eine IllegalArgumentException ausgelöst).
  • String getComment()
    Gibt den Kommentar oder null zurück.
  • long getCompressedSize()
    Liefert die Dateigröße nach dem Komprimieren oder –1, falls diese unbekannt ist. Ist der Kompressionstyp ZipEntry.STORED, dann stimmt diese Größe natürlich mit dem Rückgabewert von getSize() überein.
  • boolean isDirectory()
    Liefert true, falls der Eintrag ein Verzeichnis ist. Der Name der Datei endet mit einem Slash (/).

Auch überschreibt ZipEntry die Methoden toString(), hashCode() und clone() aus Object.

Dateien auspacken

Um Dateien auszupacken, bietet die Java-Bibliothek zwei Möglichkeiten. Die erste ist, mittels getInputStream(ZipEntry) ein InputStream-Objekt zu holen und dann auf den Inhalt der Datei zuzugreifen (es ist bemerkenswert, dass getInputStream() keine Methode von ZipEntry ist, sondern von ZipFile). Die andere Variante arbeitet über ZipInputStream, einen Weg, den wir hier nicht weiter beschreiben.

Beispiel

Liegt im Archiv moers.zip die gepackte Datei DerAlteSack.png, dann gelangen wir mit folgenden Zeilen an deren entpackten Inhalt:

ZipFile     zipFile = new ZipFile( "moers.zip" );
ZipEntry entry = zipFile.getEntry( "DerAlteSack.png" );
InputStream is = zipFile.getInputStream( entry );

class java.util.zip.ZipFile
  • InputStream getInputStream(ZipEntry entry) throws IOException
    Gibt einen Eingabestrom zurück, mit dem auf den Inhalt einer Datei zugegriffen werden kann. Es folgt eine IllegalStateException, wenn das Zip-Archiv schon geschlossen wurde.

Ein Archiv Datei für Datei entpacken

Damit ein Java-Programm das gesamte Zip-Archiv entpackt, lässt sich mit der Aufzählung von entries() durch das Archiv laufen und für jeden Eintrag eine Datei oder ein Verzeichnis erzeugen. Das Speichern soll eine eigene Methode extractEntry(ZipFile, ZipEntry, String) übernehmen, die zunächst erkennt, ob es sich bei der Datei im Zip-Archiv um ein Verzeichnis handelt oder nicht:

  • Liefert das ZipEntry-Objekt bei isDirectory() ein true, dann legen wir nur einen Ordner mittels mkdirs() an und keine Datei.
  • Steht das ZipEntry für eine Datei, dann kann diese in einem Unterordner stehen, und es müssen ebenfalls die nötigen Ordner angelegt werden. Nachdem für ein Ziel ein FileOutputStream angelegt wurde, lassen sich alle ZipFile-Bytes von getInputStream(ZipEntry) kopieren:

Listing 8.5: com/tutego/insel/io/zip/unzip.java

package com.tutego.insel.io.zip;

import java.util.zip.*;
import java.io.*;
import java.util.*;

public class unzip
{
private static final byte[] buffer = new byte[ 0xFFFF ];

public static void main( String[] args )
{
if ( args.length != 2 )
System.out.println( "Benutzung: unzip <zipfile> <destination>" );
else
{
try
{
ZipFile zipFile = new ZipFile( args[0] );
for ( ZipEntry entry : Collections.list( zipFile.entries() ) )
{
System.out.print( entry.getName() + "." );
extractEntry( zipFile, entry, args[1] );
System.out.println( ".. entpackt" );
}
}
catch ( FileNotFoundException e )
{
System.err.println( "Fehler: ZipFile nicht gefunden!" );
}
catch ( IOException e )
{
System.err.println( "Fehler: Allgemeiner Ein-/Ausgabefehler!" );
}
}
}

private static void extractEntry( ZipFile zipFile,
ZipEntry entry, String destDir )
throws IOException
{
File file = new File( destDir, entry.getName() );

if ( entry.isDirectory() )
file.mkdirs();
else
{
new File( file.getParent() ).mkdirs();

InputStream is = null;
OutputStream os = null;

try
{
is = zipFile.getInputStream( entry );
os = new FileOutputStream( file );

for ( int len; (len = is.read(BUFFER)) != –1; )
os.write( BUFFER, 0, len );
}
finally
{
if ( os != null ) os.close();
if ( is != null ) is.close();
}
}
}
}

Einträge dem Zip-Archiv hinzufügen

Das Hinzufügen von Dateien zu einem Zip-Archiv unterscheidet sich ein wenig vom Lesen der Dateien, da hier die Klasse ZipFile nicht benötigt wird. Im Mittelpunkt steht die Klasse ZipOutputStream mit zwei Schritten:

  1. Ein ZipOutputStream wird aufgebaut, etwa über new ZipOutputStream(new FileOutputStream(zipfile).
  2. new ZipEntry(String) oder new ZipEntry(ZipEntry) erzeugt einen Archiv-Eintrag, und putNextEntry(ZipEntry) verbindet diesen mit dem ZipOutputStream. Nach dem Schreiben schließt closeEntry() das Hinzufügen ab.

Erzeugt ZipOutputStream eine Datei, lässt sich die Kompressionsrate über die Methode setLevel(int) einstellen. Der Level ist eine Zahl zwischen 0 und 9. Die Kompression übernimmt ein Deflater-Objekt, das im DeflaterOutputStream das ist die Oberklasse von ZipOutputStream) verwaltet wird. So ruft ZipOutputStream lediglich vom Deflater die Methode setLevel() auf.


Rheinwerk Computing - Zum Seitenanfang

8.3.5 Jar-ArchiveZur vorigen Überschrift

Jar-Archive sind mit Zip-Archiven vergleichbar, mit dem Unterschied, dass sie eine Manifest-Datei beinhalten. Die Arbeitsweise und der Zugriff auf die Einträge sind daher denen der Zip-Dateien sehr ähnlich. Die Klasse java.util.jar.JarFile repräsentiert ein Jar-Archiv, und ein java.util.jar.JarEntry ist ein Eintrag in dem Archiv. JarFile ist eine Unterklasse von ZipFile, und JarEntry ist eine Unterklasse von ZipEntry.



Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.

>> Zum Feedback-Formular
<< zurück
  Zum Katalog
Zum Katalog: Java 7 – Mehr als eine Insel
Java 7 – Mehr als eine Insel
Jetzt bestellen


 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Buchempfehlungen
Zum Katalog: Java SE Bibliotheken






 Java SE Bibliotheken


Zum Katalog: Professionell entwickeln mit Java EE 7






 Professionell
 entwickeln mit
 Java EE 7


Zum Katalog: Java ist auch eine Insel






 Java ist auch
 eine Insel


Zum Katalog: Einstieg in Eclipse






 Einstieg in Eclipse


Zum Katalog: Einstieg in Java






 Einstieg in Java


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Rheinwerk Verlag GmbH 2012
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


[Rheinwerk Computing]

Rheinwerk Verlag GmbH, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, service@rheinwerk-verlag.de