Rheinwerk Computing < openbook > Rheinwerk Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
1 Java ist auch eine Sprache
2 Sprachbeschreibung
3 Klassen und Objekte
4 Der Umgang mit Zeichenketten
5 Eigene Klassen schreiben
6 Exceptions
7 Generics<T>
8 Äußere.innere Klassen
9 Besondere Klassen der Java SE
10 Architektur, Design und angewandte Objektorientierung
11 Die Klassenbibliothek
12 Bits und Bytes und Mathematisches
13 Datenstrukturen und Algorithmen
14 Threads und nebenläufige Programmierung
15 Raum und Zeit
16 Dateien, Verzeichnisse und Dateizugriffe
17 Datenströme
18 Die eXtensible Markup Language (XML)
19 Grafische Oberflächen mit Swing
20 Grafikprogrammierung
21 Netzwerkprogrammierung
22 Verteilte Programmierung mit RMI
23 JavaServer Pages und Servlets
24 Datenbankmanagement mit JDBC
25 Reflection und Annotationen
26 Dienstprogramme für die Java-Umgebung
A Die Begleit-DVD
Stichwort
Ihre Meinung?

Spacer
 <<   zurück
Java ist auch eine Insel von Christian Ullenboom
Das umfassende Handbuch
Buch: Java ist auch eine Insel

Java ist auch eine Insel
geb., mit DVD
1482 S., 49,90 Euro
Rheinwerk Computing
ISBN 978-3-8362-1506-0
Pfeil 18 Die eXtensible Markup Language (XML)
  Pfeil 18.1 Auszeichnungssprachen
    Pfeil 18.1.1 Die Standard Generalized Markup Language (SGML)
    Pfeil 18.1.2 Extensible Markup Language (XML)
  Pfeil 18.2 Eigenschaften von XML-Dokumenten
    Pfeil 18.2.1 Elemente und Attribute
    Pfeil 18.2.2 Beschreibungssprache für den Aufbau von XML-Dokumenten
    Pfeil 18.2.3 Schema – eine Alternative zu DTD
    Pfeil 18.2.4 Namensraum (Namespace)
    Pfeil 18.2.5 XML-Applikationen *
  Pfeil 18.3 Die Java-APIs für XML
    Pfeil 18.3.1 Das Document Object Model (DOM)
    Pfeil 18.3.2 Simple API for XML Parsing (SAX)
    Pfeil 18.3.3 Pull-API StAX
    Pfeil 18.3.4 Java Document Object Model (JDOM)
    Pfeil 18.3.5 JAXP als Java-Schnittstelle zu XML
    Pfeil 18.3.6 DOM-Bäume einlesen mit JAXP *
  Pfeil 18.4 Java Architecture for XML Binding (JAXB)
    Pfeil 18.4.1 Bean für JAXB aufbauen
    Pfeil 18.4.2 JAXBContext und die Marshaller
    Pfeil 18.4.3 Ganze Objektgraphen schreiben und lesen
    Pfeil 18.4.4 Validierung
    Pfeil 18.4.5 Weitere JAXB-Annotationen *
    Pfeil 18.4.6 Beans aus XML-Schema-Datei generieren
  Pfeil 18.5 Serielle Verarbeitung mit StAX
    Pfeil 18.5.1 Unterschiede der Verarbeitungsmodelle
    Pfeil 18.5.2 XML-Dateien mit dem Cursor-Verfahren lesen
    Pfeil 18.5.3 XML-Dateien mit dem Iterator-Verfahren verarbeiten *
    Pfeil 18.5.4 Mit Filtern arbeiten *
    Pfeil 18.5.5 XML-Dokumente schreiben
  Pfeil 18.6 Serielle Verarbeitung von XML mit SAX *
    Pfeil 18.6.1 Schnittstellen von SAX
    Pfeil 18.6.2 SAX-Parser erzeugen
    Pfeil 18.6.3 Operationen der Schnittstelle »ContentHandler«
    Pfeil 18.6.4 ErrorHandler und EntityResolver
  Pfeil 18.7 XML-Dateien mit JDOM verarbeiten
    Pfeil 18.7.1 JDOM beziehen
    Pfeil 18.7.2 Paketübersicht *
    Pfeil 18.7.3 Die Document-Klasse
    Pfeil 18.7.4 Eingaben aus der Datei lesen
    Pfeil 18.7.5 Das Dokument im XML-Format ausgeben
    Pfeil 18.7.6 Der Dokumenttyp *
    Pfeil 18.7.7 Elemente
    Pfeil 18.7.8 Zugriff auf Elementinhalte
    Pfeil 18.7.9 Liste mit Unterelementen erzeugen *
    Pfeil 18.7.10 Neue Elemente einfügen und ändern
    Pfeil 18.7.11 Attributinhalte lesen und ändern
    Pfeil 18.7.12 XPath
  Pfeil 18.8 Transformationen mit XSLT *
    Pfeil 18.8.1 Templates und XPath als Kernelemente von XSLT
    Pfeil 18.8.2 Umwandlung von XML-Dateien mit JDOM und JAXP
  Pfeil 18.9 XML-Schema-Validierung *
    Pfeil 18.9.1 SchemaFactory und Schema
    Pfeil 18.9.2 Validator
    Pfeil 18.9.3 Validierung unterschiedlicher Datenquellen durchführen
  Pfeil 18.10 Zum Weiterlesen


Rheinwerk Computing - Zum Seitenanfang

18.3 Die Java-APIs für XML  Zur nächsten ÜberschriftZur vorigen Überschrift

Für XML-basierte Daten gibt es vier Verarbeitungstypen:

  • DOM-orientierte APIs (repräsentieren den XML-Baum im Speicher): W3C-DOM, JDOM, dom4j, XOM …
  • Pull-API (wie ein Tokenizer wird über die Elemente gegangen): Dazu gehören XPP (XML Pull Parser), wie sie der StAX-Standard definiert.
  • Push-API (nach dem Callback-Prinzip ruft der Parser Methoden auf und meldet Elementvorkommen): SAX (Simple API for XML) ist der populäre Repräsentant.
  • Mapping-API (der Nutzer arbeitet überhaupt nicht mit den Rohdaten einer XML-Datei, sondern bekommt die XML-Datei auf ein Java-Objekt umgekehrt abgebildet): JAXB, Castor, XStream, …

Während DOM das gesamte Dokument in einer internen Struktur einliest und bereitstellt, verfolgt SAX einen ereignisorientierten Ansatz. Das Dokument wird in Stücken geladen, und immer dann, wenn ein angemeldetes Element beim Parser vorbeikommt, meldet er dies in Form eines Ereignisses, das für die Verarbeitung abgefangen werden kann.

Klassische Anwendungen für SAX und StAX:

  • Suche nach bestimmten Inhalten
  • Einlesen von XML-Dateien, um eine eigene Datenstruktur aufzubauen

Für einige Anwendungen ist es erforderlich, die gesamte XML-Struktur im Speicher zu verarbeiten. Für diese Fälle ist eine Struktur, wie sie DOM bietet, notwendig:

  • Sortierung der Struktur oder einer Teilstruktur der XML-Datei
  • Auflösen von Referenzen zwischen einzelnen XML-Elementen
  • interaktives Arbeiten mit der XML-Datei

Ob ein eigenes Programm DOM oder StAX einsetzt, ist von Fall zu Fall unterschiedlich. In manchen Fällen ist dies auch Geschmackssache, doch unterscheidet sich das Programmiermodell, sodass eine Umstellung nicht so angenehm ist.


Rheinwerk Computing - Zum Seitenanfang

18.3.1 Das Document Object Model (DOM)  Zur nächsten ÜberschriftZur vorigen Überschrift

DOM ist eine Entwicklung vom W3C und wird von vielen Programmiersprachen unterstützt. Das Standard-DOM ist so konzipiert, dass es unabhängig von einer Programmiersprache ist und eine strikte Hierarchie erzeugt. DOM definiert eine Reihe von Schnittstellen, die durch konkrete Programmiersprachen implementiert werden.


Rheinwerk Computing - Zum Seitenanfang

18.3.2 Simple API for XML Parsing (SAX)  Zur nächsten ÜberschriftZur vorigen Überschrift

SAX ist zum schnellen Verarbeiten der Daten von David Megginson als Public Domain entworfen worden. SAX ist im Gegensatz zu DOM nicht so speicherhungrig, weil das XML-Dokument nicht vollständig im Speicher abgelegt ist, und daher auch für sehr große Dokumente geeignet. Da SAX auf einem Ereignismodell basiert, wird die XML-Datei wie ein Datenstrom gelesen, und für erkannte Elemente wird ein Ereignis ausgelöst. Dies ist aber mit dem Nachteil verbunden, dass wahlfreier Zugriff auf ein einzelnes Element nicht ohne Zwischenspeicherung möglich ist.


Rheinwerk Computing - Zum Seitenanfang

18.3.3 Pull-API StAX  Zur nächsten ÜberschriftZur vorigen Überschrift

Im Gegensatz zu SAX, bei dem Methoden bereitgestellt werden, die beim Parsen aufgerufen werden, wird bei der Pull-API aktiv der nächste Teil eines XML-Dokuments angefordert. Das Prinzip entspricht dem Iterator-Design-Pattern, das auch von der Collection-API bekannt ist. Es werden die beiden grundsätzlichen Verarbeitungsmodelle »Iterator« und »Cursor« unterschieden. Die Verarbeitung mit dem Iterator ist flexibler, aber auch ein bisschen aufwändiger. Die Cursor-Verarbeitung ist einfacher und schneller, aber nicht so flexibel. Beide Formen sind sich sehr ähnlich. Hier werden beide Verfahren vorgestellt.


Rheinwerk Computing - Zum Seitenanfang

18.3.4 Java Document Object Model (JDOM)  Zur nächsten ÜberschriftZur vorigen Überschrift

JDOM ist eine einfache Möglichkeit, XML-Dokumente leicht und effizient mit einer schönen Java-API zu nutzen. Die Entwicklung von JDOM geht von Brett McLaughlin und Jason Hunter aus. [Laut http://www.servlets.com/polls/results.tea?name=doms ]

Im Gegensatz zu SAX und DOM, die unabhängig von einer Programmiersprache sind, wurde JDOM speziell für Java entwickelt. Während das Original-DOM keine Rücksicht auf die Java-Datenstrukturen nimmt, nutzt JDOM konsequent die Collection-API. Auch ermöglicht JDOM eine etwas bessere Performance und eine bessere Speichernutzung als beim Original-DOM.


Warum JDOM im Buch? Das Original-W3C-DOM für Java ist historisch am ältesten und JDOM war eine der ersten alternativen Java-XML-APIs. Mittlerweile steht JDOM nicht mehr alleine als W3C-DOM-Alternative da und APIs wie dom4j (http://www.dom4j.org/) oder XOM (http://www.xom.nu/) gesellen sich dazu.

Obwohl die Entwicklung von JDOM schon lange eingestellt wurde – das letzte Release JDOM 1.1.1 stammt vom Juli 2009 –, zählt JDOM immer noch zu den populärsten3 XML-APIs, wohl auch wegen der üppigen Dokumentation. Hätte ich mich heute für eine Java-XML-DOM-API entscheiden müssen, hätte ich XOM gewählt.



Rheinwerk Computing - Zum Seitenanfang

18.3.5 JAXP als Java-Schnittstelle zu XML  Zur nächsten ÜberschriftZur vorigen Überschrift

Die angesprochenen Technologien wie DOM, SAX, XPath, StAX sind erst einmal pure APIs. Für die APIs sind grundsätzlich verschiedene Implementierungen denkbar, jeweils mit Schwerpunkten, wie Performance, Speicherverbrauch, Unicode-4-Unterstützung und so weiter. Zwei Parser-Implementierungen sind zum Beispiel:

  • Xerces (http://tutego.de/go/xerces): Die Standardimplementierung im aktuellen JDK 5. XSL-Stylesheet-Transformationen werden standardmäßig über einen »Compiling XSLT Processor« (XSLTC) verarbeitet.
  • Crimson (http://tutego.de/go/crimson): Die Referenzimplementierung in Java 1.4.

Java API for XML Parsing (JAXP)

Der Nachteil bei der direkten Nutzung der Parser ist die Abhängigkeit von bestimmten Klassen. Daher wurde eine API mit dem Namen Java API for XML Parsing (JAXP) entworfen, die als Abstraktionsschicht über folgenden Technologien liegt:

  • DOM Level 3
  • SAX 2.0.2
  • StAX
  • XSLT 1.0
  • XPath 1.0

Die unterstützten XML-Standards sind 1.0 sowie 1.1. Die Parser validieren mit DTD oder W3C XML Schema und können mit XInclude Dokumente integrieren. Von DOM wird DOM Level 3 Core und DOM Level 3 Load and Save unterstützt.

JAXP 1.3 ist Teil von Java 5, und die Version JAXP 1.4 ist Teil von Java 6 – in der Version 1.4 ist nicht viel hinzugekommen. Mehr Informationen zu den Versionen und Implementierungen gibt die Webseite https://jaxp.dev.java.net/.

Mit JAXP können Entwickler also einfach zwischen verschiedenen Parsern und XSLT-Transformern wählen, ohne den eigentlichen Code zu verändern. Das ist das gleiche Prinzip wie bei den Datenbanktreibern.


Rheinwerk Computing - Zum Seitenanfang

18.3.6 DOM-Bäume einlesen mit JAXP *  topZur vorigen Überschrift

Um einen DOM-Baum einzulesen, soll unser folgendes Beispiel mit JAXP arbeiten. Eine Fabrik liefert uns einen XML-Parser, sodass wir den DOM-Baum einlesen können:

Listing 18.5  com/tutego/insel/xml/dom/DOMParty.java

package com.tutego.insel.xml.dom;

import java.io.File;
import javax.xml.parsers.*;
import org.w3c.dom.Document;

public class DOMParty
{
  public static void main( String[] args ) throws Exception
  {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse( new File("party.xml") );
    System.out.println( document.getFirstChild().getTextContent() );
  }
}

Die Parser sind selbstständig bei DocumentBuilderFactory angemeldet, und newInstance() liefert eine Unterklasse des DocumentBuilder.



Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen. >> Zum Feedback-Formular
 <<   zurück
 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Buchempfehlungen
Zum Katalog: Java ist auch eine Insel






 Java ist auch
 eine Insel


Zum Katalog: Java SE Bibliotheken






 Java SE Bibliotheken


Zum Katalog: Professionell entwickeln mit Java EE 7






 Professionell
 entwickeln mit
 Java EE 7


Zum Katalog: Einstieg in Eclipse






 Einstieg in
 Eclipse


Zum Katalog: Einstieg in Java






 Einstieg in
 Java


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Rheinwerk Verlag GmbH 2011
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


Nutzungsbestimmungen | Datenschutz | Impressum

Rheinwerk Verlag GmbH, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, service@rheinwerk-verlag.de