8.10Zum Weiterlesen
Als XML sich etablierte, bildete es mit Java ein gutes Gespann. Einer der Gründe lag in Unicode: XML ermöglicht Dokumente mit beliebigen Zeichenkodierungen, die in Java abgebildet werden konnten. Mittlerweile ist diese Abbildung nicht mehr so einfach, da in XML schnell eine Kodierung mit 32 Bit ausgewählt werden kann, die in Java nur Surrogate abbildet – nun macht die Verarbeitung nicht mehr richtig Spaß.
Das online unter http://tutego.de/go/xmlbook frei verfügbare Buch »Processing XML with Java« von Elliotte Rusty Harold gibt einen guten Überblick über die Funktionen von JDOM und die Verarbeitung von XML mit Java. Genauere Informationen finden sich auf der Website von JDOM (http://www.jdom.org/). Zur JAXB gibt http://jaxb.java.net/tutorial/ tiefere Einblicke. JAXB ist sehr nützlich, insbesondere für eigene XML-Formate; für Standardformate wie RSS-Feeds, SVG, MathML, OpenDocument oder XUL gibt es in der Regel schon Zugriffsklassen, sodass die Daten nicht aus rohen XML-Dokumenten extrahiert werden müssen – eine objektorientierte Vorgehensweise ist immer besser, als in XML-Zeichenketten direkt zu lesen und diese zu verändern. XPath als Anfragesprache für XML auch für beliebige Java-Objekte zu erweitern, hat sich das Apache-Projekt JXPath(http://tutego.de/go/jxpath) zum Ziel gesetzt. Es ist auf jeden Fall einen Blick wert.
XML wird im Internet mehr und mehr durch JSON abgelöst. Die Java SE bringt zur Verarbeitung nichts mit, wohl aber Java EE und auch Jersey, und zwar die REST-API, die in Kapitel 15, »RESTful und SOAP-Web-Services«, vorgestellt wird.