7.4 Lebenszyklus eines Prozesses
Wenn Sie die vergangenen Seiten mit einer etwas lockereren Haltung gelesen haben, dann sollten Sie jetzt wieder etwas aufmerksamer weiterlesen. Es folgt zwar noch ein wenig Theorie, diese fällt allerdings jetzt mehr in den Bereich Systemprogrammierung als in den der Administration.
Um einen neuen Prozess zu erzeugen, wird der Systemaufruf fork() verwendet. Dieser neu erzeugte Prozess ist dann eine Kopie des aufrufenden Prozesses. Er enthält dieselben Daten, offene Dateien, Lese-/Schreibzeiger, Instruktionszeiger der CPU und auch dieselbe Priorität. Der Prozess, der einen neuen erzeugt (mittels fork()), wird Elternprozess genannt. Da das Geschlecht von Prozessen ungeklärt ist – es gibt sogar Dämonen und Zombies –, bleiben wir bei einem Pluralneutrum (»Elternprozess«). Der neu erzeugte Prozess (die Kopie des Elternprozesses) wird somit als Kindprozess bezeichnet.
Der neu erzeugte und gestartete Kindprozess (genauer: fork()) liefert dem Elternteil bei Erfolg gleich seine Prozessnummer (PID) zurück. Der Kindprozess hingegen bekommt die 0 von fork() zurückgegeben. Jetzt laufen beide Prozesse unabhängig voneinander und asynchron weiter.
Soll ein nicht identischer neuer Prozess gestartet werden, können Sie nach der Erzeugung dieses Prozesses im Kindprozess einen exec-Systemaufruf machen. Bei einem exec-Aufruf werden die einzelnen Segmente (s. o.) des aufrufenden Prozesses durch die des neuen Prozesses ersetzt. Der überlagerte neue Prozess behält allerdings die PID des aufrufenden Prozesses und alle Filedeskriptoren, bei denen nicht das close-on-exec-Flag gesetzt wurde (siehe Kap. 2). Diese Art, aus einer Anwendung eine andere Anwendung (Prozess) zu starten, wird häufig verwendet. Es gibt mehrere Formen der exec-Familie, die sich nur geringfügig voneinander unterscheiden. Die wohl bekannteste Funktion ist system(), die den ganzen Prozess einheitlich macht; aber dazu siehe mehr unten.
Beim Starten des Systems werden vom Kernel einige Prozesse selbstständig erzeugt. Der wichtigste davon ist init (mit der PID 1), der Ursprung aller Prozesse. init ist verantwortlich für die Ausführung von Startup-Skripten. Alle anderen, nicht vom Kernel erzeugten Prozesse sind Kindprozesse von init. Einen Überblick über die »Prozesshierarchie« können Sie sich mit dem Kommando pstree oder einem der vielen grafischen Frontends verschaffen.
$ pstree -p | less
init(1)-+-atd(632)
|-bdflush(5)
|-cardmgr(1201)
|-cron(1540)
|-kalarmd(1967)
|-kdeinit(1882)-+-artsd(1906)
| |-kdeinit(1914)
| |-kdeinit(1942)-+-bash(1949)
| | `-bash(1951)---pstree(2586)
| |-kdeinit(1947)
| |-kdeinit(1959)
| |-kdeinit(2246)
...
init spielt eine große Rolle in der Prozessverwaltung. Ein Prozess, der sich freiwillig beendet, benutzt exit(). Ein Prozess, der nicht freiwillig beendet wird, z. B. durch ein Signal, ruft zuerst den libc-Sighandler (sofern nicht ein anderer eingerichtet wurde) auf (der dann z. B. »Segmentation Fault« printet, bevor er abbricht) und dann das Unterstrich-_exit(). _exit() ist allein für den Switch zum Kernelspace verantwortlich und beachtet nicht die Schließung von stdin etc.
Wird der Elternprozess vor dem Kindprozess beendet, so übernimmt init die Patenschaft für das Waisenkind. Beendet sich der Kindprozess (bzw. wird beendet), so werden alle Ressourcen, wie z. B. noch offene Dateien oder belegter Speicher, freigegeben. Die weitere Beendigung des Prozesses wird wieder in die Hand des Elternteils, was auch init sein kann, gegeben. An den Elternprozess wird das Signal SIGCHLD gesendet, das signalisiert, dass der Prozess beendet wurde. Dies allein trägt jedoch den beendeten Prozess noch nicht aus der Tabelle aus, dafür muss der Elternprozess noch die Funktion wait() aufrufen.
Wird der Elternprozess partout nicht über den Verbleib seines Kindes in Kenntnis gesetzt (wurde z. B. »vergessen«, wait() aufzurufen) und beendet sich dieser, wird der Kindprozess als Zombie bezeichnet.
Hinweis Zombie ist der Zustand, den ein Prozess hat, nachdem dieser sich beendet hat, aber noch nicht durch den Elternprozess ge»wait«et() wurde. Man kann daher nicht sagen, dass ein Prozess vergessen wurde, nur weil wait() noch nicht aufgerufen wurde.
|
Der Cron-Dämon z. B. klappert alle prozessbezogenen Ereignisse nur in 60s-Intervallen ab, weshalb man dort des Öfteren defunct sieht.
|
In der Liste des ps-Kommandos finden Sie einen Zombie-Zustand als <defunct> und im »STAT«-Feld mit »Z« gekennzeichnet. Das bedeutet im Klartext, dass der Prozess beendet, jedoch noch nicht aufgeräumt wurde (s. o.).
Natürlich ist dies jetzt nicht die gesamte Theorie zu den Prozessen. Insbesondere Themen wie die Kommunikation und Synchronisation von Prozessen wurden noch nicht angesprochen. Dem werden wir uns in einem anderen Kapitel zuwenden (Signale, Kapitel 7, und IPC, Kapitel 8). Da Sie jetzt Kenntnisse zu den Prozessen besitzen, will ich mit der Praxis beginnen.
|