31.4 Temporäre Dateien – tempfile 

Wenn Ihre Programme umfangreiche Daten verarbeiten müssen, ist es oft nicht sinnvoll, alle Daten auf einmal im Arbeitsspeicher zu halten. Für diesen Zweck existieren temporäre Dateien, die es Ihnen erlauben, gerade nicht benötigte Daten vorübergehend auf die Festplatte auszulagern. Allerdings eigenen sich temporäre Dateien nicht dazu, Daten dauerhaft zu speichern.
Für den komfortablen Umgang mit temporären Dateien stellt Python das Modul tempfile bereit.
Die wichtigste Funktion dieses Moduls ist TemporaryFile, die ein geöffnetes Dateiobjekt zurückgibt, das mit einer neuen temporären Datei verknüpft ist. Die Datei wird für Lese- und Schreibzugriffe im Binärmodus ("w+b") geöffnet. Wir als Benutzer der Funktion brauchen uns dabei um nichts weiter als das Lesen und Schreiben unserer Daten zu kümmern. Das Modul sorgt dafür, dass die temporäre Datei angelegt wird, und löscht sie auch wieder, wenn das Dateiobjekt von der Garbage Collection entsorgt wird.
Das Auslagern von Daten eines Programms auf die Festplatte ist ein Sicherheitsrisiko, weil andere Programme die Daten auslesen und damit unter Umständen Zugriff auf sicherheitsrelevante Informationen erhalten könnten. Deshalb versucht TemporaryFile, die Datei sofort nach ihrer Erzeugung aus dem Dateisystem zu entfernen, um sie vor anderen Programmen zu verstecken, falls dies vom Betriebssystem unterstützt wird. Außerdem wird für den Dateinamen ein zufälliger String benutzt, der aus sechs Zeichen besteht, wodurch es für andere Programme schwierig wird, herauszufinden, zu welchem Programm eine temporäre Datei gehört.
Auch wenn Sie TemporaryFile in den meisten Fällen ohne Parameter aufrufen werden, wollen wir die vollständige Schnittstelle besprechen:
TemporaryFile([mode, [bufsize, suffix, prefix, dir])
Die Parameter mode und bufsize entsprechen den gleichnamigen Argumenten der Built-in Function open (Mehr darüber erfahren Sie in Kapitel 6, »Dateien«). Mit suffix und prefix passen Sie bei Bedarf den Namen der neuen temporären Datei an. Das, was Sie für prefix übergeben, wird vor den automatisch erzeugten Dateinamen gesetzt, und der Wert für suffix wird hinten an den Dateinamen angehängt. Zusätzlich können Sie mit dem Parameter dir angeben, in welchem Ordner die Datei erzeugt werden soll. Standardmäßig kümmert sich TemporaryFile automatisch um einen Speicherort für die Datei.
Zur Veranschaulichung der Nutzung von TemporaryFile folgt ein kleines Beispiel, das erst einen String in einer temporären Datei ablegt und ihn anschließend wieder einliest:
>>> import tempfile
>>> tmp = tempfile.TemporaryFile()
>>> tmp.write(b"Hallo Zwischenspeicher")
22
>>> tmp.seek(0)
0
>>> data = tmp.read()
>>> data
b'Hallo Zwischenspeicher'
Beachten Sie im obigen Beispiel, dass wir einen bytes-String übergeben mussten, weil die temporäre Datei im Binärmodus geöffnet wurde. Möchten Sie str-Objekte in temporäre Dateien schreiben, müssen Sie die Datei im Textmodus "w" öffnen oder die Strings beim Speichern mithilfe der encode-Methode in ein bytes-Objekt umwandeln.
Falls Sie nicht wünschen, dass die temporäre Datei verborgen wird, benutzen Sie die Funktion NamedTemporaryFile, die die gleiche Schnittstelle wie TemporaryFile hat und sich auch ansonsten bis auf das Verstecken genauso verhält.
tempfile.TemporaryDirectory([suffix, prefix, dir])
Mithilfe von tempfile.mkdtemp ist es möglich, temporäre Ordner anzulegen, wobei alle vom Betriebssystem angebotenen Mittel genutzt werden, um unberechtigte Zugriffe auf die temporären Daten zu unterbinden. Die Schnittstelle von tempfile.mkdtemp verwenden Sie analog zu tempfile.TemporaryFile.
Als Rückgabewert erhalten Sie den absoluten Pfadnamen des temporären Ordners:
>>> tempfile.mkdtemp()
'/tmp/tmpFvqxTh'