Rheinwerk Computing < openbook > Rheinwerk Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
1 Neues in Java 7
2 Threads und nebenläufige Programmierung
3 Datenstrukturen und Algorithmen
4 Raum und Zeit
5 Dateien, Verzeichnisse und Dateizugriffe
6 Datenströme
7 Die eXtensible Markup Language (XML)
8 Dateiformate
9 Grafische Oberflächen mit Swing
10 Grafikprogrammierung
11 Netzwerkprogrammierung
12 Verteilte Programmierung mit RMI
13 RESTful und SOAP Web-Services
14 JavaServer Pages und Servlets
15 Applets
16 Datenbankmanagement mit JDBC
17 Technologien für die Infrastruktur
18 Reflection und Annotationen
19 Dynamische Übersetzung und Skriptsprachen
20 Logging und Monitoring
21 Java Native Interface (JNI)
22 Sicherheitskonzepte
23 Dienstprogramme für die Java-Umgebung
Stichwort

Buch bestellen
Ihre Meinung?

Spacer
Java 7 - Mehr als eine Insel von Christian Ullenboom
Das Handbuch zu den Java SE-Bibliotheken
Buch: Java 7 - Mehr als eine Insel

Java 7 - Mehr als eine Insel
Rheinwerk Computing
1433 S., 2012, geb.
49,90 Euro, ISBN 978-3-8362-1507-7
Pfeil 11 Netzwerkprogrammierung
Pfeil 11.1 Grundlegende Begriffe
Pfeil 11.2 URI und URL
Pfeil 11.2.1 Die Klasse URI
Pfeil 11.2.2 Die Klasse URL
Pfeil 11.2.3 Informationen über eine URL *
Pfeil 11.2.4 Der Zugriff auf die Daten über die Klasse URL
Pfeil 11.3 Die Klasse URLConnection *
Pfeil 11.3.1 Methoden und Anwendung von URLConnection
Pfeil 11.3.2 Protokoll- und Content-Handler
Pfeil 11.3.3 Im Detail: vom URL zur URLConnection
Pfeil 11.3.4 Der Protokoll-Handler für Jar-Dateien
Pfeil 11.3.5 Basic Authentication und Proxy-Authentifizierung
Pfeil 11.4 Mit GET und POST Daten übergeben *
Pfeil 11.4.1 Kodieren der Parameter für Serverprogramme
Pfeil 11.4.2 Eine Suchmaschine mit GET-Request ansprechen
Pfeil 11.4.3 POST-Request absenden
Pfeil 11.5 Host- und IP-Adressen
Pfeil 11.5.1 Lebt der Rechner?
Pfeil 11.5.2 IP-Adresse des lokalen Hosts
Pfeil 11.5.3 Das Netz ist klasse
Pfeil 11.5.4 NetworkInterface
Pfeil 11.6 Mit dem Socket zum Server
Pfeil 11.6.1 Das Netzwerk ist der Computer
Pfeil 11.6.2 Sockets
Pfeil 11.6.3 Eine Verbindung zum Server aufbauen
Pfeil 11.6.4 Server unter Spannung: die Ströme
Pfeil 11.6.5 Die Verbindung wieder abbauen
Pfeil 11.6.6 Informationen über den Socket *
Pfeil 11.6.7 Reine Verbindungsdaten über SocketAddress *
Pfeil 11.7 Client-Server-Kommunikation
Pfeil 11.7.1 Warten auf Verbindungen
Pfeil 11.7.2 Ein Multiplikationsserver
Pfeil 11.7.3 Blockierendes Lesen
Pfeil 11.7.4 Von außen erreichbar sein *
Pfeil 11.8 Apache HttpComponents und Commons Net *
Pfeil 11.8.1 HttpComponents
Pfeil 11.8.2 Apache Commons Net
Pfeil 11.9 Arbeitsweise eines Webservers *
Pfeil 11.9.1 Das Hypertext Transfer Protocol (HTTP)
Pfeil 11.9.2 Anfragen an den Server
Pfeil 11.9.3 Die Antworten vom Server
Pfeil 11.9.4 Webserver mit com.sun.net.httpserver.HttpServer
Pfeil 11.10 Verbindungen durch einen Proxy-Server *
Pfeil 11.10.1 System-Properties
Pfeil 11.10.2 Verbindungen durch die Proxy-API
Pfeil 11.11 Datagram-Sockets *
Pfeil 11.11.1 Die Klasse DatagramSocket
Pfeil 11.11.2 Datagramme und die Klasse DatagramPacket
Pfeil 11.11.3 Auf ein hereinkommendes Paket warten
Pfeil 11.11.4 Ein Paket zum Senden vorbereiten
Pfeil 11.11.5 Methoden der Klasse DatagramPacket
Pfeil 11.11.6 Das Paket senden
Pfeil 11.12 E-Mail *
Pfeil 11.12.1 Wie eine E-Mail um die Welt geht
Pfeil 11.12.2 Das Simple Mail Transfer Protocol und RFC 822
Pfeil 11.12.3 POP (Post Office Protocol)
Pfeil 11.12.4 Die JavaMail API
Pfeil 11.12.5 E-Mails mittels POP3 abrufen
Pfeil 11.12.6 Multipart-Nachrichten verarbeiten
Pfeil 11.12.7 E-Mails versenden
Pfeil 11.12.8 Ereignisse und Suchen
Pfeil 11.13 Tiefer liegende Netzwerkeigenschaften *
Pfeil 11.13.1 Internet Control Message Protocol (ICMP)
Pfeil 11.13.2 MAC-Adresse
Pfeil 11.14 Zum Weiterlesen

Rheinwerk Computing - Zum Seitenanfang

11.2 URI und URLZur nächsten Überschrift

Die URL (Uniform Resource Locator) ist das Adressenformat für eine Ressource im Web. Eine URL ist formal in RFC 1738 beschrieben und stellt so etwas wie einen Dateinamen für das Dateisystem dar. Eine Adresse wie http://www.tutego.com/seminare/ zeigt eine übliche URL für Webadressen. Die Angaben beginnen mit einem Schema (auch Protokoll genannt), es folgen Doppelpunkt und weitere Angaben wie der Servername und ein Pfad auf das Verzeichnis. Das Protokoll bestimmt die Zugriffsart, und das meistverwendete Protokoll ist HTTP (Hypertext Transfer Protocol), mit dem auf Inhalte des Webs zugegriffen wird.


Rheinwerk Computing - Zum Seitenanfang

11.2.1 Die Klasse URIZur nächsten ÜberschriftZur vorigen Überschrift

Bei der URL geht es darum, dass die Ressource angesprochen werden kann, und daher ist auch immer ein Zugriffsschema mit der URL verbunden, etwa http, ftp oder file. Einfach nur zum Beispiel download.movies/The Fairly OddParents anzugeben reicht nicht aus; erst mit dem Schema kann ein Client auf die Ressource zugreifen, denn ob sie lokal liegt, über HTTP angesprochen wird oder über FTP, das macht einen ziemlich großen Unterschied.

Kommt es aber auf das Protokoll nicht an, und geht es nur darum, eine Ressource eindeutig zu identifizieren, wird der Begriff URI (Uniform Resource Identifier) verwendet. Ein URI hat ebenfalls ein Schema, aber er spricht keine Ressource an, zu der eine Verbindung aufgebaut werden kann. So identifiziert der URI urn:isbn:978-3-8362-1371-4 die Java-Insel, aber keinen Ort. Eine URL ist somit nichts anderes als ein URI mit einer kodierten Zugriffsmöglichkeit. Eigentlich ist der Begriff URL damit veraltet, aber viele Internetbenutzer sind mit dem Begriff aufgewachsen, sodass auch die Insel bei dem Begriff »URL« bleibt.[86](Das Ganze ist schon etwas verwirrend und selbst das W3C hat extra ein Dokument (http://www.w3.org/TR/uri-clarification/) aufgesetzt, das Klarheit schaffen soll.)

In Java wird ein URI durch die Klasse java.net.URI beschrieben. Eine Aufgabe der Klasse ist die Normalisierung, also das Auflösen von relativen Angaben mit »..«.

Abbildung

Abbildung 11.1: UML-Diagramm der Klasse URI


Rheinwerk Computing - Zum Seitenanfang

11.2.2 Die Klasse URLZur nächsten ÜberschriftZur vorigen Überschrift

Um ein URL-Objekt zu erzeugen, ist es am einfachsten, über eine String-Repräsentation der URL-Adresse zu gehen:

URL url = new URL( "http://www.tutego.com/index.html" );

Die URL-Klasse hat zusätzliche Konstruktoren; diese sind nützlich, wenn Komponenten der Adresse – also Zugriffsart (beispielsweise das HTTP), Hostname und Dateireferenz – getrennt angegeben sind. Eine Alternative zur oben genannten Form ist:

URL url = new URL( "http", "www.tutego.com", "index.html" );

Das zweite Argument in diesem Konstruktor ist die Basisadresse der URL, und das dritte Argument ist der Name der Ressource relativ zur Basisadresse. Ist diese Basisadresse null, was möglich ist, dann ist die zweite Angabe absolut zu nehmen. Und ist das zweite Argument in absoluter Notation formuliert, wird alles im ersten String ignoriert.

Da eine URL auch einen entfernten Rechner an einem anderen Port ansprechen kann, existiert dafür ebenfalls ein Konstruktor:

URL url = new URL( "http", "www.tutego.com", 8080, "index.html" );

Die URL des Objekts wurde durch eine absolute Adresse erzeugt. Diese enthält dann alle Informationen, die für den Aufbau zum Host nötig sind. Es können jedoch auch URL-Objekte erzeugt werden, bei denen nur eine relative Angabe bekannt ist. Relative Angaben werden häufig bei HTML-Seiten verwendet, da die Seite so besser vor Verschiebungen geschützt ist. Damit die Erzeugung eines URL-Objekts mit relativer Adressierung gelingt, muss eine Basisadresse bekannt sein. Ein Konstruktor für relative Adressen erwartet diese Basisadresse als Argument:

URL domainUrl = new URL( "http://www.tutego.com/" );
URL indexUrl = new URL( domainUrl, "index.html");

Diese Art und Weise der URL-Objekt-Erzeugung ist besonders praktisch für Referenzen innerhalb von Webseiten (engl. named anchors). Besitzt eine Webseite eine Textmarke lang, so kann der URL-Konstruktor für relative URLs so verwendet werden:

URL url       = new URL( "http:// www.tutego.com" );
URL bottomUrl = new URL( url, "/java/faq.html#lang" );

Ausnahmen bei der URL-Erzeugung

Jeder der Konstruktoren löst eine geprüfte Ausnahme vom Typ MalformedURLException aus, wenn das Argument im Konstruktor entweder null ist oder ein unbekanntes Protokoll (wie in telepatic:\\ullenboom\brain\java) beschreibt. Somit ist der Code in der Regel von einem Block der folgenden Art umgeben:

try
{
URL myURL = new URL( ... );
}
catch ( MalformedURLException e )
{
// Fehlerbehandlung
}

Es ist wichtig, zu erkennen, dass die Ausnahme nicht erzeugt wird, weil der angesprochene Rechner nicht erreicht werden kann. Nur die Schreibweise der URL ist für die Ausnahme ausschlaggebend. Die Konstruktoren bauen keine Internetverbindungen auf.

Abbildung

Abbildung 11.2: UML-Diagramm der Klasse URL

final class java.net.URL
implements Serializable
  • URL(String spec) throws MalformedURLException
    Erzeugt ein Objekt aus der URL-Zeichenkette.
  • URL(String protocol, String host, int port, String file) throws MalformedURLException
    Erzeugt ein URL-Objekt mit dem gegebenen Protokoll, Hostnamen, der Port-Nummer und Datei. Ist die Port-Nummer –1, wird der Standardport verwendet; für das WWW ist der Port zum Beispiel 80.
  • URL(String protocol, String host, String file) throws MalformedURLException
    Das Gleiche wie URL(protocol, host, –1, file).
  • URL(URL context, String spec) throws MalformedURLException
    Erzeugt relativ zur gegebenen URL ein neues URL-Objekt.
Hinweis

Obwohl eine URL ein URI ist, gibt es keine Vererbungsbeziehungen zwischen den Klassen.
Es gilt:

final class URI implements Comparable<URI>, Serializable
final class URL implements Serializable


Rheinwerk Computing - Zum Seitenanfang

11.2.3 Informationen über eine URL *Zur nächsten ÜberschriftZur vorigen Überschrift

Ist das URL-Objekt einmal angelegt, lassen sich Attribute des Objekts erfragen, aber nicht mehr ändern. Es gibt zwar Setter-Methoden, doch sind diese protected und somit den Unterklassen vorbehalten. Uns normalen Klassenbenutzern bietet die URL-Klasse nur Methoden zum Zugriff auf Protokoll, Hostname, Port-Nummer und Dateiname. Es lassen sich jedoch nicht alle URL-Adressen so detailliert aufschlüsseln; außerdem sind manche Zugriffsmethoden nur für HTTP sinnvoll.

final class java.net.URL
implements Serializable
  • String getProtocol()
    Liefert das Protokoll der URL.
  • String getHost()
    Liefert den Hostnamen der URL, sofern dies möglich ist. Für das Protokoll »file« ist dies ein leerer String. Im Falle einer IP-Adresse steht die Angabe in [ eckigen Klammern ].
  • int getPort()
    Liefert die Port-Nummer. Ist sie nicht gesetzt, liefert getPort() eine –1.
  • String getRef()
    Gibt den Anker – alles hinter dem # – zurück. Bei »vorne#anker« liefert getRef() also den String »anker«.
  • String getPath()
    Gibt nur den Pfad der URL ohne Anker zurück.
  • String getFile()
    Gibt den Dateinamen der URL zusammen mit dem Anker zurück.
  • String getQuery()
    Liefert den Anfragestring, also das, was hinter dem Fragezeichen steht.

Das nachfolgende kleine Programm erzeugt ein URL-Objekt für http://www.tutego.com:80/java/faq.html#lang?key=val und gibt die ermittelbaren Attribute aus:

Listing 11.1: com/tutego/insel/net/ParseURL.java, main()

URL url = new URL( "http://www.tutego.com:80/java/faq.html?key=val#Lang" );

System.out.println( url.getProtocol() ); // http
System.out.println( url.getHost() ); // www.tutego.com
System.out.println( url.getPort() ); // 80
System.out.println( url.getFile() ); // /java/faq.html?key=val
System.out.println( url.getPath() ); // /java/faq.html
System.out.println( url.getQuery() ); // key=val
System.out.println( url.getRef() ); // Lang

Verweisen zwei URLs auf die gleiche Seite?

Die URL-Klasse untersucht mit equals(), ob alle Komponenten der einen URL mit der anderen URL übereinstimmen. Zunächst testet die Methode, ob es sich bei dem zu vergleichenden Objekt um ein Exemplar von URL handelt. Wenn ja, untersucht equals() über sameFile() Protokoll, Host, Port, Datei und dann auch noch, ob die Komponenten Referenzen (Anker) besitzen oder nicht.

final class java.net.URL
implements Serializable
  • boolean sameFile(URL other)
    Vergleicht zwei URL-Objekte. Die Methode liefert true, wenn beide Objekte auf die gleiche Ressource zeigen. Der Anker der HTML-Dateien ist unwichtig.
  • boolean equals(Object o)
    Auch equals() vergleicht intern mit sameFile(), doch zusätzlich auch, ob die beiden Anker gleich sind.
Hinweis

equals() führt eine Namensauflösung durch, wenn das nötig ist. Das Gleiche gilt für hashCode(). Das bedeutet: URL-Objekte in Datenstrukturen wie HashMap zu haben, kann sehr teuer werden. Eine gute Alternative stellen URI-Objekte dar.


Rheinwerk Computing - Zum Seitenanfang

11.2.4 Der Zugriff auf die Daten über die Klasse URLZur nächsten ÜberschriftZur vorigen Überschrift

Um auf die auf dem Webserver gespeicherten Dokumente zuzugreifen, gibt es drei Möglichkeiten:

  • Jedes URL-Objekt besitzt die Methode openStream(), die einen InputStream zum Weiterverarbeiten liefert, sodass wir dort die Daten auslesen können.
  • Die API-Beschreibung erwähnt, dass openStream() eigentlich nur eine Abkürzung für openConnection().getInputStream() ist. openConnection() erzeugt ein URLConnection-Objekt, auf dem getInputStream() den Eingabestrom liefert. So können wir natürlich auch mit openConnection() und dem URLConnection direkt arbeiten.
  • Bei der dritten Möglichkeit ist Handarbeit angesagt, weshalb wir sie in Abschnitt 11.6, »Mit dem Socket zum Server«, beschreiben. Dazu brauchen wir auch die URL-Klasse nicht mehr.

Mit dem Scanner und dem InputStream eine Datei aus dem Netz laden

Verweist die URL auf eine Textdatei, dann erweitern wir oft den InputStream zu einem BufferedReader, da dieser eine readLine()-Methode besitzt. Die Scanner-Klasse lässt sich ebenfalls optimal einsetzen, da sie zum einen Zeile für Zeile und zum anderen mit dem passenden Delimiter auch die ganze Eingabe lesen kann. Insofern unterscheidet sich das Lesen einer Datei nicht vom Lesen eines entfernten URL-Objekts:

Listing 11.2: com/tutego/insel/net/ReadAllFromUrl.java

package com.tutego.insel.net;

import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.util.Scanner;

class ReadAllFromUrl
{
public static void main( String[] args )
{
InputStream is = null;

try
{
URL url = new URL( "http://www.tutego.com/aufgaben/bond.txt" );
is = url.openStream();
System.out.println( new Scanner( is ).useDelimiter( "\\Z" ).next() );
}
catch ( Exception e ) {
e.printStackTrace();
}
finally {
if ( is != null )
try { is.close(); } catch ( IOException e ) { }
}
}
}

Wir erzeugen ein URL-Objekt und rufen darauf die openStream()-Methode auf. Diese liefert einen InputStream auf den Dateiinhalt. Sind die Daten gelesen, schließt close() den Datenstrom; close() bezieht sich allerdings nicht auf das URL-Objekt, sondern auf den Datenstrom.

Das Beispiel zeigt auch, dass bei openStream() beziehungsweise openConnection() ein try-Block notwendig ist. Denn geht etwas daneben (zum Beispiel, wenn der Dienst nicht verfügbar ist), wird eine IOException ausgelöst:

try
{
URL url = new URL( "http://www.tutego.com/index.html" );
URLConnection con = url.openConnection();
}
catch ( MalformedURLException e ) { ... } // new URL() ging daneben
catch ( IOException e ) { ... } // openConnection() schlug fehl

Auf das Schließen der Ressourcen ist immer zu achten, Ausnahmen dürfen nicht dazu führen, dass diese Ressourcen offen bleiben.

final class java.net.URL
implements Serializable
  • final InputStream openStream() throws IOException
    Öffnet eine Verbindung zum Server und liefert einen InputStream zurück. Diese Methode ist eine Abkürzung für openConnection().getInputStream().
  • URLConnection openConnection() throws IOException
    Liefert ein URLConnection-Objekt zurück, das die Verbindung zum entfernten Objekt vertritt. openConnection() wird vom Protokoll-Handler immer dann aufgerufen, wenn eine neue Verbindung geöffnet wird.


Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.

>> Zum Feedback-Formular
<< zurück
  Zum Katalog
Neuauflage: Java SE 8 Standard-Bibliothek
Neuauflage: Java SE 8 Standard-Bibliothek
Jetzt bestellen


 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Buchempfehlungen
Zum Katalog: Professionell entwickeln mit Java EE 7






 Professionell
 entwickeln mit
 Java EE 7


Zum Katalog: Java ist auch eine Insel






 Java ist auch
 eine Insel


Zum Katalog: Einstieg in Eclipse






 Einstieg in Eclipse


Zum Katalog: Einstieg in Java






 Einstieg in Java


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Rheinwerk Verlag GmbH 2012
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


Nutzungsbestimmungen | Datenschutz | Impressum

Rheinwerk Verlag GmbH, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, service@rheinwerk-verlag.de