Rheinwerk Computing < openbook > Rheinwerk Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.
 
Inhaltsverzeichnis
Vorwort
1 Neues in Java 8 und Java 7
2 Fortgeschrittene String-Verarbeitung
3 Threads und nebenläufige Programmierung
4 Datenstrukturen und Algorithmen
5 Raum und Zeit
6 Dateien, Verzeichnisse und Dateizugriffe
7 Datenströme
8 Die eXtensible Markup Language (XML)
9 Dateiformate
10 Grafische Oberflächen mit Swing
11 Grafikprogrammierung
12 JavaFX
13 Netzwerkprogrammierung
14 Verteilte Programmierung mit RMI
15 RESTful und SOAP-Web-Services
16 Technologien für die Infrastruktur
17 Typen, Reflection und Annotationen
18 Dynamische Übersetzung und Skriptsprachen
19 Logging und Monitoring
20 Sicherheitskonzepte
21 Datenbankmanagement mit JDBC
22 Java Native Interface (JNI)
23 Dienstprogramme für die Java-Umgebung
Stichwortverzeichnis

Jetzt Buch bestellen
Ihre Meinung?

Spacer
<< zurück
Java SE 8 Standard-Bibliothek von Christian Ullenboom
Das Handbuch für Java-Entwickler
Buch: Java SE 8 Standard-Bibliothek

Java SE 8 Standard-Bibliothek
Pfeil 8 Die eXtensible Markup Language (XML)
Pfeil 8.1 Auszeichnungssprachen
Pfeil 8.1.1 Die Standard Generalized Markup Language (SGML)
Pfeil 8.1.2 Extensible Markup Language (XML)
Pfeil 8.2 Eigenschaften von XML-Dokumenten
Pfeil 8.2.1 Elemente und Attribute
Pfeil 8.2.2 Beschreibungssprache für den Aufbau von XML-Dokumenten
Pfeil 8.2.3 Schema – die moderne Alternative zu DTD
Pfeil 8.2.4 Namensraum (Namespace)
Pfeil 8.2.5 XML-Applikationen *
Pfeil 8.3 Die Java-APIs für XML
Pfeil 8.3.1 Das Document Object Model (DOM)
Pfeil 8.3.2 Simple API for XML Parsing (SAX)
Pfeil 8.3.3 Pull-API StAX
Pfeil 8.3.4 Java Document Object Model (JDOM)
Pfeil 8.3.5 JAXP als Java-Schnittstelle zu XML
Pfeil 8.3.6 DOM-Bäume einlesen mit JAXP *
Pfeil 8.4 Java Architecture for XML Binding (JAXB)
Pfeil 8.4.1 Bean für JAXB aufbauen
Pfeil 8.4.2 Utility-Klasse JAXB
Pfeil 8.4.3 Ganze Objektgraphen schreiben und lesen
Pfeil 8.4.4 JAXBContext und Marshaller/Unmarshaller nutzen
Pfeil 8.4.5 Validierung
Pfeil 8.4.6 Weitere JAXB-Annotationen *
Pfeil 8.4.7 Beans aus XML-Schema-Datei generieren
Pfeil 8.5 Serielle Verarbeitung mit StAX
Pfeil 8.5.1 Unterschiede der Verarbeitungsmodelle
Pfeil 8.5.2 XML-Dateien mit dem Cursor-Verfahren lesen
Pfeil 8.5.3 XML-Dateien mit dem Iterator-Verfahren verarbeiten *
Pfeil 8.5.4 Mit Filtern arbeiten *
Pfeil 8.5.5 XML-Dokumente schreiben
Pfeil 8.6 Serielle Verarbeitung von XML mit SAX *
Pfeil 8.6.1 Schnittstellen von SAX
Pfeil 8.6.2 SAX-Parser erzeugen
Pfeil 8.6.3 Operationen der Schnittstelle ContentHandler
Pfeil 8.6.4 ErrorHandler und EntityResolver
Pfeil 8.7 XML-Dateien mit JDOM verarbeiten
Pfeil 8.7.1 JDOM beziehen
Pfeil 8.7.2 Paketübersicht *
Pfeil 8.7.3 Die Document-Klasse
Pfeil 8.7.4 Eingaben aus der Datei lesen
Pfeil 8.7.5 Das Dokument im XML-Format ausgeben
Pfeil 8.7.6 Der Dokumenttyp *
Pfeil 8.7.7 Elemente
Pfeil 8.7.8 Zugriff auf Elementinhalte
Pfeil 8.7.9 Liste mit Unterelementen erzeugen *
Pfeil 8.7.10 Neue Elemente einfügen und ändern
Pfeil 8.7.11 Attributinhalte lesen und ändern
Pfeil 8.7.12 XPath
Pfeil 8.8 Transformationen mit XSLT *
Pfeil 8.8.1 Templates und XPath als Kernelemente von XSLT
Pfeil 8.8.2 Umwandlung von XML-Dateien mit JDOM und JAXP
Pfeil 8.9 XML-Schema-Validierung *
Pfeil 8.9.1 SchemaFactory und Schema
Pfeil 8.9.2 Validator
Pfeil 8.9.3 Validierung unterschiedlicher Datenquellen durchführen
Pfeil 8.10 Zum Weiterlesen
 
Zum Seitenanfang

8.3Die Java-APIs für XML Zur vorigen ÜberschriftZur nächsten Überschrift

Für XML-basierte Daten gibt es vier Verarbeitungstypen:

  • DOM-orientierte APIs (repräsentieren den XML-Baum im Speicher): W3C-DOM, JDOM, dom4j, XOM

  • Pull-API (wie ein Tokenizer wird über die Elemente gegangen): Dazu gehören XPP (XML Pull Parser), wie sie der StAX-Standard definiert.

  • Push-API (nach dem Callback-Prinzip ruft der Parser Methoden auf und meldet Elementvorkommen): SAX (Simple API for XML) ist der populäre Repräsentant.

  • Mapping-API (der Nutzer arbeitet überhaupt nicht mit den Rohdaten einer XML-Datei, sondern bekommt die XML-Datei auf ein Java-Objekt umgekehrt abgebildet): JAXB, XStream, Castor

Während DOM das gesamte Dokument in einer internen Struktur einliest und bereitstellt, verfolgt SAX einen ereignisorientierten Ansatz. Das Dokument wird in Stücken geladen, und immer dann, wenn ein angemeldetes Element beim Parser vorbeikommt, meldet er dies in Form eines Ereignisses, das für die Verarbeitung abgefangen werden kann.

Klassische Anwendungen für SAX und StAX sind:

  • die Suche nach bestimmten Inhalten

  • das Einlesen von XML-Dateien, um eine eigene Datenstruktur aufzubauen

Für einige Anwendungen ist es erforderlich, die gesamte XML-Struktur im Speicher zu verarbeiten. Für diese Fälle ist eine Struktur, wie DOM sie bietet, notwendig:

  • Sortierung der Struktur oder einer Teilstruktur der XML-Datei

  • Auflösen von Referenzen zwischen einzelnen XML-Elementen

  • interaktives Arbeiten mit der XML-Datei

Ob ein eigenes Programm DOM oder StAX einsetzt, ist von Fall zu Fall unterschiedlich. In manchen Fällen ist dies auch Geschmackssache, doch unterscheidet sich das Programmiermodell, sodass eine Umstellung nicht so angenehm ist.

 
Zum Seitenanfang

8.3.1Das Document Object Model (DOM) Zur vorigen ÜberschriftZur nächsten Überschrift

DOM ist eine Entwicklung des W3C und wird von vielen Programmiersprachen unterstützt. Das Standard-DOM ist so konzipiert, dass es unabhängig von einer Programmiersprache ist und eine strikte Hierarchie erzeugt. DOM definiert eine Reihe von Schnittstellen, die durch konkrete Programmiersprachen implementiert werden.

 
Zum Seitenanfang

8.3.2Simple API for XML Parsing (SAX) Zur vorigen ÜberschriftZur nächsten Überschrift

SAX ist zum schnellen Verarbeiten der Daten von David Megginson als Public Domain entworfen worden. SAX ist im Gegensatz zu DOM nicht so speicherhungrig, weil das XML-Dokument nicht vollständig im Speicher abgelegt ist, und daher auch für sehr große Dokumente geeignet. Da SAX auf einem Ereignismodell basiert, wird die XML-Datei wie ein Datenstrom gelesen, und für erkannte Elemente wird ein Ereignis ausgelöst. Dies ist aber mit dem Nachteil verbunden, dass wahlfreier Zugriff auf ein einzelnes Element nicht ohne Zwischenspeicherung möglich ist.

 
Zum Seitenanfang

8.3.3Pull-API StAX Zur vorigen ÜberschriftZur nächsten Überschrift

Im Gegensatz zu SAX, bei dem Methoden bereitgestellt werden, die beim Parsen aufgerufen werden, wird bei der Pull-API wie StAX aktiv der nächste Teil eines XML-Dokuments angefordert. Das Prinzip entspricht dem Iterator-Design-Pattern, das auch von der Collection-API bekannt ist. Es werden die beiden grundsätzlichen Verarbeitungsmodelle Iterator und Cursor unterschieden. Die Verarbeitung mit dem Iterator ist flexibler, aber auch ein bisschen aufwändiger. Die Cursor-Verarbeitung ist einfacher und schneller, aber nicht so flexibel. Beide Formen sind sich sehr ähnlich. Später werden beide Verfahren vorgestellt.

 
Zum Seitenanfang

8.3.4Java Document Object Model (JDOM) Zur vorigen ÜberschriftZur nächsten Überschrift

JDOM ist eine einfache Möglichkeit, XML-Dokumente leicht und effizient mit einer schönen Java-API zu nutzen. Die aktuelle Entwicklung von JDOM geht von Jason Hunter und Rolf Lear aus, die erste Version hat Brett McLaughlin mitgestaltet.

Im Gegensatz zu SAX und DOM, die unabhängig von einer Programmiersprache sind, wurde JDOM speziell für Java entwickelt. Während das Original-DOM keine Rücksicht auf die Java-Datenstrukturen nimmt, nutzt JDOM konsequent die Collection-API. Auch ermöglicht JDOM eine etwas bessere Performance und eine bessere Speichernutzung als das Original-DOM.

Warum behandele ich JDOM in diesem Buch?

Das Original-W3C-DOM für Java ist historisch am ältesten, und JDOM war eine der ersten alternativen Java-XML-APIs. Mittlerweile steht JDOM nicht mehr alleine als W3C-DOM-Alternative da, und APIs wie dom4j (http://dom4j.sourceforge.net/) oder XOM (http://www.xom.nu/) gesellen sich dazu. Obwohl es um die Entwicklung von JDOM lange Zeit still war, zählt JDOM immer noch zu den populärsten[ 86 ](Laut http://www.servlets.com/polls/results.tea?name=doms.) XML-APIs, wohl auch wegen der üppigen Dokumentation.

 
Zum Seitenanfang

8.3.5JAXP als Java-Schnittstelle zu XML Zur vorigen ÜberschriftZur nächsten Überschrift

Die angesprochenen Technologien wie DOM, SAX, XPath, StAX sind erst einmal pure APIs. Für die APIs sind grundsätzlich verschiedene Implementierungen denkbar, jeweils mit Schwerpunkten wie Performance, Speicherverbrauch, Unicode-4-Unterstützung usw. Zwei Parser-Implementierungen sind zum Beispiel:

  • Xerces (http://tutego.de/go/xerces): Die Standardimplementierung ab JDK 5. XSL-Stylesheet-Transformationen werden standardmäßig über einen Compiling XSLT Processor (XSLTC) verarbeitet.

  • Crimson (http://tutego.de/go/crimson): Die Referenzimplementierung in Java 1.4.

Java API for XML Parsing (JAXP)

Der Nachteil bei der direkten Nutzung der Parser ist die Abhängigkeit von bestimmten Klassen. Daher wurde eine API mit dem Namen Java API for XML Parsing (JAXP) entworfen, die als Abstraktionsschicht über folgenden Technologien liegt:

  • XML 1.0, XML 1.1

  • DOM Level 3

  • W3C XML Schema 1.0

  • XSLT 1.0

  • XInclude 1.0

  • XPath 1.0

  • SAX 2.0.2

  • StAX 1.2 (JSR-173)

Die Parser validieren mit DTD oder einem W3C-XML-Schema und können mit XInclude Dokumente integrieren. Von DOM werden DOM Level 3 Core und DOM Level 3 Load and Save unterstützt.

JAXP ist schon lange ein Bestandteil der Java SE. Java 7 aktualisiert auf JAXP 1.4.5 und im Java SE 7 Update 40 auf JAXP 1.5.0, was auch Teil von Java 8 ist. Mehr Informationen zu den Versionen und Implementierungen gibt die Webseite http://jaxp.java.net/.

Mit JAXP können Entwickler also einfach zwischen verschiedenen Parsern und XSLT-Transformern wählen, ohne den eigentlichen Code zu verändern. Das ist das gleiche Prinzip wie bei den Datenbanktreibern.

 
Zum Seitenanfang

8.3.6DOM-Bäume einlesen mit JAXP * Zur vorigen ÜberschriftZur nächsten Überschrift

Um einen DOM-Baum einzulesen, soll unser folgendes Beispiel mit JAXP arbeiten. Eine Fabrik liefert uns einen XML-Parser, sodass wir den DOM-Baum einlesen können:

Listing 8.5com/tutego/insel/xml/dom/DOMParty.java, main()

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
try ( InputStream in = Files.newInputStream( Paths.get( "party.xml" ) ) ) {
Document document = builder.parse( in );
System.out.println( document.getFirstChild().getTextContent() );
}

Die Parser sind selbstständig bei DocumentBuilderFactory angemeldet, und newInstance() liefert eine Unterklasse des DocumentBuilder.

 


Ihre Meinung

Wie hat Ihnen das Openbook gefallen? Wir freuen uns immer über Ihre Rückmeldung. Schreiben Sie uns gerne Ihr Feedback als E-Mail an kommunikation@rheinwerk-verlag.de.

<< zurück
Zum Rheinwerk-Shop
Zum Rheinwerk-Shop: Java SE 8 Standard-Bibliothek Java SE 8 Standard-Bibliothek
Jetzt Buch bestellen

 Buchempfehlungen
Zum Rheinwerk-Shop: Java ist auch eine Insel
Java ist auch eine Insel


Zum Rheinwerk-Shop: Professionell entwickeln mit Java EE 8
Professionell entwickeln mit Java EE 8


Zum Rheinwerk-Shop: Besser coden
Besser coden


Zum Rheinwerk-Shop: Entwurfsmuster
Entwurfsmuster


Zum Rheinwerk-Shop: IT-Projektmanagement
IT-Projektmanagement


 Lieferung
Versandkostenfrei bestellen in Deutschland, Österreich und der Schweiz
InfoInfo

 
 


Copyright © Rheinwerk Verlag GmbH 2018
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das Openbook denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt.
Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

 
Nutzungsbestimmungen | Datenschutz | Impressum

Rheinwerk Verlag GmbH, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, service@rheinwerk-verlag.de

Cookie-Einstellungen ändern