16.7 Zeichenweise lesen und schreiben – »putc()«/»fputc()« und »getc()«/»fgetc()« 

Die Funktionen getc() und fgetc() sind das dateiorientierte Gegenstück zu getchar(). Sie werden verwendet, um einzelne Zeichen aus einem Stream zu lesen, der zuvor mit fopen() geöffnet wurde. Der Unterschied zwischen getc() und fgetc() besteht darin, dass fgetc() als eine Funktion implementiert ist und getc() ein Makro sein darf. Hier sehen Sie die Syntax dazu:
#include <stdio.h> int getc(FILE *datei); int fgetc(FILE *datei);
Folgende beiden Schreibweisen sind dabei identisch:
// Liest ein Zeichen aus der Standardeingabe. getchar(); // Liest ebenfalls ein Zeichen aus der Standardeingabe. fgetc(stdin);
Dazu folgt ein Listing, das eine Datei zum Lesen öffnet und anschließend den Inhalt der Datei Zeichen für Zeichen auf dem Bildschirm ausgibt. Eingelesen wird so lange, bis das Zeichen für Dateiende oder Fehler erreicht wird (EOF).
/* fgetc1.c */ #include <stdio.h> #include <stdlib.h> int main(void) { int c; FILE *datei; datei=fopen("test.txt", "r"); if(datei != NULL) { while( (c=fgetc(datei)) != EOF) putchar(c); } else { printf("Konnte Datei nicht finden bzw. öffnen!\n"); return EXIT_FAILURE; } return EXIT_SUCCESS; }
Bei diesem Programm wird zuerst versucht, eine Textdatei im Lesemodus zu öffnen. Falls dies gelungen ist, wird der Text zeichenweise ausgelesen mit
while( (c=fgetc(datei)) != EOF)
und mit putchar() zeichenweise auf dem Bildschirm ausgegeben, bis ein Fehler oder EOF auftritt. Das Programm soll nun ein wenig erweitert werden:
/* fgetc2.c */ #include <stdio.h> #include <stdlib.h> void read_char(FILE *stream) { int c; while( (c=fgetc(stream)) !=EOF) putchar(c); } int main(int argc, char **argv) { FILE *datei; char filename[255]; /* Falls die Datei zum Öffnen nicht * als Argument übergeben wurde ... */ if(argc < 2) { printf("Welche Datei wollen Sie öffnen : "); scanf("%s",filename); datei = fopen(filename ,"r"); if(datei != NULL) read_char(datei); else { printf("Fehler beim Öffnen von %s\n",filename); return EXIT_FAILURE; } } else { datei=fopen(argv[1],"r"); if(datei != NULL) read_char(datei); else { printf("Konnte %s nicht öffnen!\n",argv[1]); return EXIT_FAILURE; } } return EXIT_SUCCESS; }
In diesem Beispiel kann die Datei, die es zu öffnen gilt, entweder über die Kommandozeile eingegeben werden oder erst nach dem Start des Programms. Es empfiehlt sich, diese Schreibweise allgemein für Konsolenprogramme zu verwenden. Damit ist zumindest sichergestellt, dass auch Anwender, die mit dem Programm nicht vertraut sind, es bedienen können.
Als Nächstes betrachten wir das Gegenstück der Funktionen getc() und fgetc(). Für die beiden Funktionen putc() und fputc() gilt hinsichtlich ihres Unterschieds dasselbe wie bei getc() und fgetc(). fputc() ist somit als Funktion implementiert, und putc() darf ein Makro sein. Mit putc()/fputc() kann zeichenweise in einen Stream geschrieben werden. Die Syntax dieser Funktionen lautet:
#include <stdio.h> int putc(int quelle, FILE *ziel); int fputc(int quelle, FILE *ziel) ;
Damit wird das Zeichen quelle in den Stream ziel geschrieben. Der Rückgabewert ist das Zeichen in quelle oder bei einem Fehler bzw. am Dateiende EOF.
Dazu ein Listing, mit dem Sie eine Datei zeichenweise kopieren können:
/* copy_char4char.c */ #include <stdio.h> #include <stdlib.h> int main(void) { FILE *quelle, *ziel; int c; char name_q[255], name_z[255]; printf("Name der Quelldatei : "); scanf("%s",name_q); quelle=fopen(name_q,"rb"); if(quelle == NULL) { printf("Konnte %s nicht finden bzw. öffnen!\n",name_q); return EXIT_FAILURE; } else { printf("Name der Zieldatei : "); scanf("%s",name_z); ziel=fopen(name_z,"w+b"); if(ziel==NULL) { printf("Konnte Zieldatei nicht erzeugen!\n"); return EXIT_FAILURE; } else { /* Wir kopieren zeichenweise von quelle nach ziel. */ while( (c=getc(quelle)) != EOF) putc(c,ziel); } } return EXIT_SUCCESS; }
In diesem Beispiel werden zwei Streams verwendet – einer, mit dem die Datei geöffnet wird, um daraus zu lesen, und ein zweiter, mit dem in eine weitere geöffnete Datei geschrieben wird:
FILE *quelle, *ziel;
Passend werden diese Streams quelle und ziel benannt. Zuerst wird eine Datei zum Lesen im "rb"-Modus geöffnet. Anschließend erfolgt eine Abfrage, wie die Zieldatei heißen soll. Falls die Zieldatei nicht existiert, wird diese erzeugt. Andernfalls wird diese Datei einfach überschrieben, da der Modus "w+" verwendet wurde. Hier wird außerdem der binäre Modus eingesetzt, da der Inhalt in diesem Fall beim Kopieren nicht von Interesse ist. Unter UNIX/Linux hat das b für den Binärmodus keine Bedeutung und wird somit ignoriert:
ziel = fopen(name_z, "w+b");
Anschließend wird überprüft, ob die Datei zum Schreiben im Binärmodus geöffnet werden konnte. Danach kann zeichenweise von der Quelldatei gelesen und in die Zieldatei geschrieben werden:
while( (c=getc(quelle)) != EOF) putc(c,ziel);
Wenn alles problemlos verlaufen ist, wurde eine exakte Kopie der Quelldatei erstellt – mit dem Namen, der als Zieldatei angegeben wurde.
Dazu ein weiteres Beispiel, wann eine zeichenweise Abarbeitung von Daten sinnvoller erscheint. Jeder, der an einer Webseite arbeitet, kennt das Problem: Viel Text muss ins HTML-Format konvertiert werden. Wird dabei einmal das Zeichen '<' vergessen, das ein HTML-Tag einleitet, ist manchmal der vollständige Text bis zum nächsten mit '>' schließenden Tag futsch.
Das folgende Programm soll alle Sonderzeichen in das HTML-Format konvertieren. Folgende Regeln gelten:
Ersetze das Zeichen ä durch die Zeichenfolge ä Ersetze das Zeichen Ä durch die Zeichenfolge Ä Ersetze das Zeichen ö durch die Zeichenfolge ö Ersetze das Zeichen Ö durch die Zeichenfolge Ö Ersetze das Zeichen ü durch die Zeichenfolge ü Ersetze das Zeichen Ü durch die Zeichenfolge Ü Ersetze das Zeichen ß durch die Zeichenfolge ß Ersetze das Zeichen < durch die Zeichenfolge < Ersetze das Zeichen > durch die Zeichenfolge > Ersetze das Zeichen & durch die Zeichenfolge & Ersetze das Zeichen " durch die Zeichenfolge "
Der Quellcode dazu lautet:
/* txt2html_example.c */ #include <stdio.h> #include <stdlib.h> /* nchars = Anzahl der Zeichen */ /* tag = Sonderzeichen in HTML */ /* ziel = Datei, in die geschrieben wird */ void sonderzeichen(int nchars, char *tag, FILE *ziel) { int i; char zeichen; for(i = 0; i < nchars; i++) { zeichen = tag[i]; putc(zeichen, ziel); } } int main(int argc, char **argv) { FILE *q, *z; int zeichen; if(argc < 3) { printf("Benutzung : %s quelle ziel\n", *argv); return EXIT_FAILURE; } q = fopen(argv[1], "r"); z = fopen(argv[2], "w"); if(q == NULL || z == NULL) { printf("Fehler bei Oeffnen einer Datei ...\n"); return EXIT_FAILURE; } while((zeichen=getc(q)) != EOF) { if(zeichen=='<') sonderzeichen(4,"<", z); else if(zeichen=='>') sonderzeichen(4,">", z); else if(zeichen=='\"') sonderzeichen(6,""",z); else if(zeichen=='&') sonderzeichen(5,"&",z); else if(zeichen=='ä') sonderzeichen(6 ,"ä",z); else if(zeichen=='Ä') sonderzeichen(6 ,"Ä",z); else if(zeichen=='ö') sonderzeichen(6 ,"ö",z); else if(zeichen=='Ö') sonderzeichen(6 ,"Ö",z); else if(zeichen=='ü') sonderzeichen(6 ,"ü",z); else if(zeichen=='Ü') sonderzeichen(6 ,"Ü",z); else if(zeichen=='ß') sonderzeichen(6 ,"ß",z); else putc(zeichen, z); } return EXIT_SUCCESS; }
Schon haben Sie mit ein paar Zeilen Code die Light-Version eines Text2Html-Konverters geschrieben.
Natürlich gibt es auch bei den byte-orientierten Funktionen fgetc/getc bzw. fputc/putc die Gegenstücke für breite Zeichen. Die Syntax dazu lautet:
#include <wchar.h> // Breite Zeichen lesen wint_t fgetwc( FILE *fp ); wint_t getwc( FILE *fp ); // Breite Zeichen schreiben wint_t fputwc( wchar_t wc, FILE *fp ); wint_t putwc( wchar_t wc, FILE *fp );
Ansonsten gilt für die breiten Gegenstücke dasselbe, was ich schon zuvor bei den Funktionen getwchar() und putwchar() gesagt habe.
Ihre Meinung
Wie hat Ihnen das Openbook gefallen? Wir freuen uns immer über Ihre Rückmeldung. Schreiben Sie uns gerne Ihr Feedback als E-Mail an kommunikation@rheinwerk-verlag.de.