C语言文件操作
对计算机来说,一切皆数据,超女的信息是数据、C语言源代码文件是数据、编译后的可执行程序也是数据,数据的存放方式有很多种,如内存、文件、数据库等,文件是极其重要的一种。
根据文件中数据组织形式的不同,可以把文件分为文本文件和二进制文件,C语言源代码是文本文件,编译后的可执行程序是二进制文件。
一、文本数据和二进制
1、文本数据
文本数据由字符串组成,存放了每个字符的 ASCII码值,每个字符占一个字节,每个字节存放一个字符。
例如数字 123,如果用文本格式存放,数据内容是’1’、‘2’、'3’三个字符,占三个字节,如下表所示。
字符 | ‘1’ | ‘2’ | ‘3’ |
---|---|---|---|
ASCII(十进制) | 49 | 50 | 51 |
ASCII(二进制) | 00110001 | 00110010 | 00110011 |
2、二进制数据
二进制数据是字节序列,数字123的二进制表示是01111011,如果用二进制格式形式存储,字符、短整型、短整型、长整型都可以存储123,存储方式分别如下:
1)字符型一个字节
1 | 01111011 |
2)短整型2个字节
1 | 00000000 01111011 |
3)整型4个字节
1 | 00000000 00000000 00000000 01111011 |
4)长整型8个字节
1 | 00000000 00000000 00000000 00000000 00000000 00000000 00000000 01111011 |
3、文本文件和二进制文件
按文本格式存放数据的文件称为文本文件或ASCII文件,文件可以用vi和记事本打开,看到的都是ASCII字符。
按二进制格式存放数据的文件称为二进制文件,如果用vi打开二进制文件,看到的是乱码,没有意义。
二、打开文件
C 语言对文件进行操作必须先“打开”文件,操作(读和写)完成后,再“关闭”文件。
1、文件指针
打开文件的时候,C语言为打开的文件分配一个文件信息区,该信息区中包含文件描述信息、缓冲区位置、缓冲区大小、文件读写到的位置等基本信息,这些信息保存在一个结构体类型变量中struct_IO_FILE),这个结构体有一个别名FILE(typedef struct _IO_FILE FILE),FILE结构体和对文件操作的库函数在 stdio.h 头文件中声明的。
打开文件的时候,调用fopen函数时会动态分配一个FILE结构体,并把FILE结构体的地址作为函数的返回值,程序中用FILE结构体指针存放这个地址。调用关闭文件的函数fclose时候,除了关闭文件,还会释放文件指针占用的内存空间。
FILE结构体指针习惯称为文件指针。
2、打开文件
我们可以使用 C语言提供的库函数fopen来创建一个新的文件或者打开一个已存的文件,调用fopen函数成功后,返回一个文件指针( FILE *),函数的原型如下:
1 | FILE *fopen( const char * filename, const char * mode ); |
参数filename 是字符串,表示需要打开的文件名,可以包含目录名,如果不包含路径就表示程序运行的当前目录。实际开发中,采用文件的全路径。
参数mode也是字符串,表示打开文件的方式(模式),打开方式可以是下列值中的一个。
方式 | 含 义 | 说 明 |
---|---|---|
r | 只读 | 文件必须存在,否则打开失败。 |
w | 只写 | 如果文件存在,则清除原文件内容;如果文件不存在,则新建文件。 |
a | 追加只写 | 如果文件存在,则打开文件,如果文件不存在,则新建文件。 |
r+ | 读写 | 文件必须存在。在只读 r 的基础上加 ‘+’ 表示增加可写的功能。 |
w+ | 读写 | 在只写w的方式上增加可读的功能。 |
a+ | 读写 | 在追加只写a的方式上增加可读的功能。 |
英文单词:read简写r、write简写w、append简写a。
注意了,不同教材中对文件打开的方式有不同的说法。
有的说打开文本文件的方式要用"rt"、“wt”、“at”、“rt+”、“wt+”、“at+”,"t"是text的简写,"t"可以省略不写。
有的说打开二进制文件的方式要用"rb"、“wb”、“ab”、“rb+”、“wb+”、“ab+”,"b"是binary的简写。
准确的说,在Linux平台下,打开文本文件和二进制文件的方式没有区别。
在windows平台下,如果以“文本”方式打开文件,当读取文件的时候,系统会将所有的"/r/n"转换成"/n";当写入文件的时候,系统会将"/n"转换成"/r/n"写入, 如果以"二进制"方式打开文件,则读和写都不会进行这样的转换,真是罗嗦。
3、关闭文件
fclose库函数用于关闭文件,函数的原型:
1 | int fclose(FILE *fp); |
fp为fopen函数返回的文件指针。
示例(book108.c)
1 | /* |
对初学者来说,以下代码可能难以理解。
1 | if ( (fp=fopen("/home/wucz/demo/book1.c","r")) == 0 ) |
其实(fp=fopen("/home/wucz/demo/book1.c","r"))
表达式的值就是fp,我在讲if分支语句的时候就讨论过了,估计大家都没把它放在心上,我们可以用代码来测试它。
如果还不理解,就这么抄吧,抄多了就熟了。
4、注意事项
1)调用fopen打开文件的时候,一定要判断返回值,如果文件不存在、或没有权限、或磁盘空间满了,都有可能造成打开文件失败。
2)文件指针是调用fopen的时候,系统动态分配了内存空间,函数返回或程序退出之前,必须用fclose关闭文件指针,释放内存,否则后果严重。
3)如果文件指针是空的,用fclose关闭它相当于操作空指针,后果严重。
三、文本文件的读写
在实际开发中,文本文件以行的形式存放字符串,如C程序的源代码,一段文字等,所以一般是按行写入和读取数据。
1、向文件中写入数据
C语言向文件中写入数据库函数有fputc、fputs、fprintf,在实际开发中,fputc和fputs没什么用,只介绍fprintf就可以了。fprintf函数的声明如下:
1 | int fprintf(FILE *fp, const char *format, ...); |
fprintf函数的用法与printf相同,只是多了第一个参数文件指针,表示把数据输出到文件。
程序员不必关心fprintf函数的返回值。
示例(book111.c)
1 | /* |
编译book111.c程序并执行,采用cat命令查看/tmp/test1.txt的内容,如下:
可以看到/tmp/test1.txt中有3行记录,程序book111不管执行多少次,文件/tmp/test1.txt的记录都是3行记录,因为文件打开的方式是"w",每次打开文件的时候都会清空原文件中的记录。
大家可以试一下把文件打开方式设置为"a",看看程序执行的效果。
2、从文件中读取数据
C语言从文件中读取数据的库函数有fgetc、fgets、fscanf,在实际开发中,fgetc和fscanf没什么用,只介绍fgets就可以了。fgets函数的原型如下:
1 | char *fgets(char *buf, int size, FILE *fp); |
fgets的功能是从文件中读取一行。
参数buf是一个字符串,用于保存从文件中读到的数据。
参数size是打算读取内容的长度。
参数fp是待读取文件的文件指针。
如果文件中将要读取的这一行的内容的长度小于size,fgets函数就读取一行,如果这一行的内容大于等于size,fgets函数就读取size-1字节的内容。
调用fgets函数如果成功的读取到内容,函数返回buf,如果读取错误或文件已结束,返回空,即0。如果fgets返回空,可以认为是文件结束而不是发生了错误,因为发生错误的情况极少出现。
示例(book113.c)
1 | /* |
运行效果
需要重点说明的是,在读取到 size-1个字符之前如果出现了换行,或者读到了文件末尾,则读取结束。
不管 size 的值多大,fgets函只读取一行数据,不能跨行。
在实际开发中,可以将 size 的值设置地足够大,确保每次都能读取到一行完整的数据。
四、二进制文件的读写
二进制文件没有行的概念,没有字符串的概念。
我们把内存中的数据结构直接写入二进制文件,读取的时候,也是从文件中读取数据结构的大小一块数据,直接保存到数据结构中。注意,这里所说的数据结构不只是结构体,是任意数据类型。
1、向文件中写入数据
fwrite函数用来向文件中写入数据块,它的原型为:
1 | size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream); |
参数的说明:
ptr:为内存区块的指针,存放了要写入的数据的地址,它可以是数组、变量、结构体等。
size:固定填1。
nmemb:表示打算写入数据的字节数。
fp:表示文件指针。
函数的返回值是本次成功写入数据的字节数,一般情况下,程序员不必关心fwrite函数的返回值。
示例(book115.c)
1 | /* |
编译并运行程序,得到数据文件/tmp/test.dat,用vi命令打开文件,显示如下:
可以看到很多乱码,其实并不是文件的内容乱,而是vi无法识别文件的格式,把内容当成ASCII码显示,如果内容刚好是ASCII码,就能正确显示,如果不是ASCII码(如年龄和身高是整数),就无法正常显示了。
2、从文件中读取数据
fread函数用来从文件中读取数据块,它的原型为:
1 | size_t fread(void *ptr, size_t size, size_t nmemb, FILE *fp); |
ptr:用于存放从文件中读取数据的变量地址,它可以是数组、变量、结构体等。
size:固定填1。
nmemb:表示打算读取的数据的字节数。
fp:表示文件指针。
调用fread函数如果成功的读取到内容,函数返回读取到的内容的字节数,如果读取错误或文件已结束,返回空,即0。如果fread返回空,可以认为是文件结束而不是发生了错误,因为发生错误的情况极少出现。
示例(book117.c)
1 | /* |
运行效果
3、注意事项
1)我对fread和fwrite函数的size和nmemb以及它们的返回值的解释是不准确的,这么做的原因是为了方便大家的学习,正确的解释会把大家搞晕,等您功力提升之候,我们再讨论它的准确含义。
2)fwrite和fread函数也可以写入和读取文本文件,但是没有换行的概念,不管是换行符或其它的特殊字符,无区别对待。
3)一般来说,二进制文件有约定的数据格式,程序必须按约定的格式写入/读取数据,book115.c写入的是超女结构体,book117.c就要用超女结构体来存放读取到的数据。这道理就像图片查看软件无法打开音频文件,音频播放软件也无法打开图片文件,因为音频文件和图片文件的格式不同。
五、文件定位
在文件内部有一个位置指针,用来指向当前读写的位置。在文件打开时,如果打开方式是r和w,位置指针指向文件的第一个字节,如果打开方式是a,位置指针指向文件的尾部。每当从文件里读n个字节或文件里写入n个字节之后位置指针也会向后移动n个字节。
文件位置指针与C语言中的指针不是一回事。位置指针仅仅是一个标志,表示文件读写到的位置,不是变量的地址。文件每读写一次,位置指针就会移动一次,它不需要您在程序中定义和赋值,而是由系统自动设置,对程序员来说是隐藏的。
在实际开发中,偶尔需要移动位置指针,实现对指定位置数据的读写。我们把移动位置指针称为文件定位。
C语言提供了ftell、rewind和fseek三个库函数来实现文件定位功能。
1、ftell函数
ftell函数用来返回当前文件位置指针的值,这个值是当前位置相对于文件开始位置的字节数。它的声明如下:
1 | long ftell(FILE *fp); |
2、rewind函数
rewind函数用来将位置指针移动到文件开头,它的声明如下:
1 | void rewind ( FILE *fp ); |
3、fseek函数
fseek() 用来将位置指针移动到任意位置,它的声明如下:
1 | int fseek ( FILE *fp, long offset, int origin ); |
参数说明:
1)fp 为文件指针,也就是被移动的文件。
2)offset 为偏移量,也就是要移动的字节数。之所以为 long 类型,是希望移动的范围更大,能处理的文件更大。offset 为正时,向后移动;offset 为负时,向前移动。
3)origin 为起始位置,也就是从何处开始计算偏移量。C语言规定的起始位置有三种,分别为:0-文件开头;1-当前位置;2-文件末尾。
1 | fseek(fp,100,0); // 从文件的开始位置计算,向后移动100字节。 |
4、注意事项
当offset是向文件尾方向偏移的时候,无论偏移量是否超出文件尾,fseek都是返回0,当偏移量没有超出文件尾的时候,文件指针式指向正常的偏移地址的,当偏移量超出文件尾的时候,文件指针是指向文件尾的,不会返回偏移出错-1值。
当offset是向文件头方向偏移的时候,如果offset没有超出文件头,是正常偏移,文件指针指向正确的偏移地址,fseek返回值为0,当offset超出文件头时,fseek返回出错-1值,文件指针还是处于原来的位置。
六、文件缓冲区
在操作系统中,存在一个内存缓冲区,当调用fprintf、fwrite等函数往文件写入数据的时候,数据并不会立即写入磁盘文件,而是先写入缓冲区,等缓冲区的数据满了之后才写入文件。还有一种情况就是程序调用了fclose时也会把缓冲区的数据写入文件。
在实际开发中,如果程序员想把缓冲区的数据立即写入文件,可以调用fflush库函数,它的声明如下:
1 | int fflush(FILE *fp); |
函数的参数只有一个,即文件指针,返回0成功,其它失败,程序员一般不关心它的返回值。
七、标准输入、标准输出和标准错误
Linux操作系统为每个程序默认打开三个文件,即标准输入stdin、标准输出stdout和标准错误输出stderr,其中0就是stdin,表示输入流,指从键盘输入,1代表stdout,2代表stderr,1,2默认是显示器。
1 | printf("Hello world.\n"); |
等同于
1 | fprintf(stdout,"Hello world.\n"); |
这几个文件指针没什么用,让大家了解一下就行。在实际开发中,我们一般会关闭这几个文件指针。
八、课后作业
在实际开发中,文件操作极其重要,本章节的课后作业一定要认真完成。
1)编写示例程序,从界面上输入五名超女的数据,存放在struct st_girl结构体数组中,然后把结构体数组以二进制的方式写入文件。
2)编写示例程序,把上一题写入的数据从二进制文件中读取出来,存入struct st_girl结构体中,然后在界面上显示出来。
3)编写示例程序,从界面上输入五名超女的数据,存放在struct st_girl结构体数组中,然后把结构体数组以xml字符串的方式写入文本文件。文件内容的格式如下:
1 | <name>西施</name><age>20</age><height>166</height><sc>一般</sc><yz>漂亮</yz> |
4)编写示例程序,把上一题写入的数据从文本文件中读取出来,并解析xml,存入struct st_girl结构体中,然后在界面上显示出来。
5)编写示例程序,实现文件复制的功能,文本文件用fget和fprintf读写?二进制文件用fread和fwrite读写?用fread和fwrite读写文本文件是什么效果?
6)编写示例程序,测试文件定位函数ftell、rewind和fseek的使用。
7)编写示例程序,测试文件缓冲函数fflush的使用。
九、版权声明
C语言技术网原创文章,转载请说明文章的来源、作者和原文的链接。
来源:C语言技术网(www.freecplus.net)
作者:码农有道