广东省建设见证员网站,太原网站推广优化,怎样推广网站平台,自己动手制作网站目录
一、文件接口
二、感性理解Linux系统下“一切皆文件”
三、C语言文件接口
1、fopen
2、当前路径
3、fwrite、fprintf、fputs
4、fgets 模拟实现cat命令
5、fscanf
五、系统接口
1、open系统调用
2、write系统调用
例#xff1a;O_WRONLY
例#xff1a;O_WR…目录
一、文件接口
二、感性理解Linux系统下“一切皆文件”
三、C语言文件接口
1、fopen
2、当前路径
3、fwrite、fprintf、fputs
4、fgets 模拟实现cat命令
5、fscanf
五、系统接口
1、open系统调用
2、write系统调用
例O_WRONLY
例O_WRONLY|O_CREAT
例O_TRUNC
例O_APPEND
3、read
例O_RDONLY
4、系统调用和库函数 一、文件接口
在探讨文件操作的范畴时我们确实将文件视为内容加属性的集合。操作文件无非是对其内容或属性的操作。这些操作在底层是通过操作系统OS的接口完成的因为只有操作系统有权直接与硬件交互。当我们编写代码来操作文件时实际上是通过进程来实现的。进程是操作系统中能够执行操作的实体它是文件访问的本质执行者。
为什么在学习C/C时没有听过文件类的系统调用接口 封装的复杂性操作系统层面的文件接口相对底层且复杂直接使用它们进行文件操作需要深入理解操作系统的工作原理。为了简化开发过程不同的编程语言对这些系统调用接口进行了封装提供了更易于使用的文件操作API。这种封装隐藏了系统调用接口的复杂性使得开发者在日常开发中很少需要直接接触到这些底层接口。 跨平台性的需求直接使用操作系统的文件接口会使得代码与特定的操作系统绑定从而失去跨平台的能力。编程语言通过提供封装后的文件操作接口使得开发的应用可以在不同的操作系统上运行而无需关心底层的系统调用差异。这种抽象层的存在极大地提高了代码的可移植性。
为什么需要操作系统提供的文件接口 权限限制直接向硬件写入数据需要特定的权限这些权限通常仅操作系统拥有。因此普通用户或应用程序需要通过操作系统提供的接口来进行文件操作。 封装和简化操作系统层面的文件接口通常比较底层且复杂。不同的编程语言通过封装这些系统调用接口提供了更简单易用的文件操作API以适应不同的开发需求和习惯。 跨平台兼容性如果直接使用操作系统的文件接口那么编写的代码将与特定的操作系统绑定失去跨平台的能力。通过使用编程语言提供的封装接口可以实现代码的跨平台运行因为这些语言级别的接口会根据运行平台调用相应的系统接口。
为什么要学习操作系统层面的文件接口
尽管语言级别的封装提供了便利和跨平台能力但学习操作系统层面的文件接口仍然有其价值 统一性操作系统层面的文件接口是统一的每个操作系统提供的接口虽然固定但是了解这些接口可以帮助开发者更深入地理解文件操作的本质以及不同操作系统之间的差异。 高级功能和性能优化某些高级功能或性能优化可能需要直接使用操作系统提供的文件接口来实现尤其是在需要精细控制文件行为的场景中。
显示器和文件操作的比较
显示器作为硬件使用printf进行打印操作时我们通常不会感到奇怪。这是因为printf等函数已经封装了向显示器输出的底层细节。实际上向显示器打印信息与向磁盘文件写入数据在本质上是相似的都涉及到了操作系统层面的硬件访问接口。这种封装隐藏了底层的复杂性使得开发者可以更加专注于应用逻辑的实现。
二、感性理解Linux系统下“一切皆文件” 在计算机系统中文件的概念可以从狭义和广义两个角度来理解 狭义的文件
狭义上的文件通常指的是存储在磁盘上的数据集合这些数据可以是文本、图片、视频等任何形式的信息。这类文件可以通过文件系统进行管理我们可以使用各种编程语言提供的文件操作API如fopen, fread, fwrite等来读取或写入这些文件。例如从文件中读取数据到程序的内存中或者将程序处理的数据写回到磁盘文件中。
广义的文件
从广义上讲文件不仅仅局限于磁盘上的数据集合。在类Unix操作系统中遵循“一切皆文件”的哲学几乎所有的外设如显示器、键盘、网卡、声卡等都可以被抽象为文件。这意味着这些设备的操作也可以通过读写文件的方式来进行。例如向显示器输出信息printf/cout本质上是向一个特殊的文件写入数据从键盘读取输入scanf/cin本质上是从一个特殊的文件中读取数据。
文件的读写操作
从程序的角度看文件操作主要分为读input和写output两种基本操作。无论是操作磁盘上的普通文件还是与外设交互都可以用读写的概念来描述
读操作Input将数据从文件无论是磁盘文件还是代表外设的特殊文件传输到程序的内存中。写操作Output将数据从程序的内存传输到文件中无论这个文件代表的是磁盘上的数据存储还是某种外设。
总结
因此从系统的角度来看任何能够被读取input或能夜被写出output的设备都可以被抽象为文件。这种广义上的文件概念极大地统一了操作系统对硬件的访问方式简化了程序与外设之间的交互逻辑。
三、C语言文件接口
1、fopen
原型FILE *fopen(const char *path, const char *mode);功能打开名为 path 的文件并与之关联一个流。模式 r以文本模式打开文件进行读取。文件指针位于文件开头。r打开文件进行读写。文件指针位于文件开头。w以文本模式打开文件进行写入。如果文件存在则长度截为零。文件指针位于文件开头。w打开文件进行读写。如果文件不存在则创建之。如果文件存在则长度截为零。文件指针位于文件开头。a以追加模式打开文件进行写入。如果文件不存在则创建之。文件指针位于文件末尾。a打开文件进行读取和追加写入。如果文件不存在则创建之。读取时文件指针位于文件开头但写入总是追加到文件末尾。
#include stdio.hint main()
{FILE*fpfopen(log.txt,r);if(fpNULL){perror(fopen);return 1;}return 0;
}[hbrVM-16-9-centos file_system]$ ./myfile
fopen: No such file or directory#include stdio.hint main()
{FILE*fpfopen(log.txt,w);if(fpNULL){perror(fopen);return 1;}return 0;
}[hbrVM-16-9-centos file_system]$ make
gcc -stdc99 -o myfile myfile.c
[hbrVM-16-9-centos file_system]$ ./myfile
[hbrVM-16-9-centos file_system]$ ls
log.txt makefile myfile myfile.c2、当前路径
当前路径Current Working Directory, CWD是指操作系统中一个进程当前所处的目录路径。当一个进程被启动时它会有一个与之关联的目录这个目录就是它的当前工作目录。进程在执行文件操作时如果使用的是相对路径那么这个相对路径就是基于当前工作目录来解析的。
例如如果当前路径是 /home/whb当进程尝试打开或创建一个名为 log.txt 的文件时如果没有指定完整路径操作系统会自动将 log.txt 与当前路径拼接形成完整的文件路径 /home/whb/log.txt然后在该路径下进行文件操作。
在Linux和Unix系统中可以使用 pwd 命令查看当前工作目录而在Windows系统中则可以使用 cd 命令不带任何参数来查看。
#include stdio.hint main()
{FILE*fpfopen(log.txt,w);if(fpNULL){perror(fopen);return 1;}return 0;
}在名为 file_system 的目录下编译并运行了一个C程序该程序的作用是创建或打开如果已存在一个名为 log.txt 的文件。由于指定的文件名是相对路径所以 log.txt 被创建在了当前工作目录下即 file_system 目录。
接着将编译好的可执行文件 myfile 复制到上一级目录 linux 中并在那里运行它。由于此时的当前工作目录是 /home/hbr/linux程序再次执行时根据其当前工作目录创建了一个新的 log.txt 文件这次在 linux 目录下。
[hbrVM-16-9-centos file_system]$ make
gcc -stdc99 -o myfile myfile.c
[hbrVM-16-9-centos file_system]$ ./myfile
[hbrVM-16-9-centos file_system]$ ls
log.txt makefile myfile myfile.c sysmax_process
[hbrVM-16-9-centos file_system]$ cp myfile ..
[hbrVM-16-9-centos file_system]$ cd ..
[hbrVM-16-9-centos linux]$ ls
Development_tool file_system LICENSE process README.md
environment_variable gdb myfile README.en.md
[hbrVM-16-9-centos linux]$ pwd
/home/hbr/linux
[hbrVM-16-9-centos linux]$ ./myfile
[hbrVM-16-9-centos linux]$ ls
Development_tool file_system LICENSE myfile README.en.md
environment_variable gdb log.txt process README.md当你使用相对路径如本例中的 log.txt进行文件操作时实际操作的文件路径是基于当前工作目录的。因此即使是同一个程序在不同的工作目录下运行时操作的文件路径也可能不同。简而言之程序中使用的相对路径 log.txt 被解析为与程序当前工作目录相关的绝对路径导致在不同目录下运行相同的程序会在各自的目录下创建或操作 log.txt 文件。
#include stdio.h
#include unistd.hint main()
{FILE*fpfopen(log.txt,w);if(fpNULL){perror(fopen);return 1;}fclose(fp);while(1){sleep(1);}return 0;
}
[hbrVM-16-9-centos file_system]$ ps axj | head -1 ps axj | grep myfilePPID PID PGID SID TTY TPGID STAT UID TIME COMMAND
17230 27565 27565 17230 pts/0 27565 S 1003 0:00 ./myfile
27409 27958 27957 27409 pts/1 27957 S 1003 0:00 grep --colorauto myfile
[hbrVM-16-9-centos file_system]$ ls /proc/27565 -d
/proc/27565
[hbrVM-16-9-centos file_system]$ ls /proc/27565 -l
total 0
//我们这次只关注下面这行
lrwxrwxrwx 1 hbr hbr 0 Mar 15 21:02 cwd - /home/hbr/linux/file_system
lrwxrwxrwx 1 hbr hbr 0 Mar 15 21:02 exe - /home/hbr/linux/file_system/myfile3、fwrite、fprintf、fputs
这三个函数都是用于向文件中写入数据的C语言函数。
fwrite
fwrite 函数用于将数据块以二进制形式写入文件。它的原型是 size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream)。ptr 是要写入的数据的指针size 是每个数据项的大小以字节为单位nmemb 是要写入的数据项的数量stream 是指向文件的指针。该函数返回实际写入的数据项数目。
fprintf
fprintf 函数用于按照指定的格式将数据写入文件。它的原型是 int fprintf(FILE *stream, const char *format, ...)。stream 是指向文件的指针format 是格式化字符串后面的参数是要写入的数据。该函数返回写入的字符数。
fputs
fputs 函数用于将字符串写入文件。它的原型是 int fputs(const char *str, FILE *stream)。str 是要写入的字符串stream 是指向文件的指针。该函数返回一个非负值表示成功如果发生错误则返回 EOF。
#include stdio.hint main()
{FILE*fpfopen(log.txt,w);if(fpNULL){perror(fopen);return 1;}const char *s1 hello fwrite \n;fwrite(s1,strlen(s1),1,fp);const char *s2 hello fprintf \n;fprintf(fp,%s,s2);const char *s3 hello fputs \n;fputs(s3,fp);fclose(fp);return 0;
}[hbrVM-16-9-centos file_system]$ ./myfile
[hbrVM-16-9-centos file_system]$ cat log.txt
hello fwrite
hello fprintf
hello fputs
[hbrVM-16-9-centos file_system]$ cat myfile.c \0结尾是C语言的规定文件用遵守吗? #include stdio.hint main()
{FILE*fpfopen(log.txt,w);if(fpNULL){perror(fopen);return 1;}const char *s1 hello fwrite \n;fwrite(s1,strlen(s1)1,1,fp);const char *s2 hello fprintf \n;fprintf(fp,%s,s2);const char *s3 hello fputs \n;fputs(s3,fp);fclose(fp);return 0;
}fwrite使用了 strlen(s1)1 作为要写入的字节数。这里 1 是因为你想要包括字符串结束符 \0。在文件中你看到了 hello fprintf 被正确写入了但是输出后面多了一个 ^这是因为 \0 字符在文本编辑器中通常显示为 ^。所以对于文件特别是文本文件\0 结尾并不是必须的因为在文件中通常是根据字符的数量来确定字符串的结束而不是依赖于特殊的结束符
[hbrVM-16-9-centos file_system]$ ./myfile
[hbrVM-16-9-centos file_system]$ cat log.txt
hello fwrite
^ello fprintf
hello fputs
[hbrVM-16-9-centos file_system]$ cat myfile.c
4、fgets
char *fgets(char *str, int n, FILE *stream);
str一个指向字符数组的指针用于存储读取到的文本数据。通常您需要提前声明一个足够大的字符数组来存储读取的数据。fgets 会将读取的数据存储到这个数组中。n要读取的最大字符数包括字符串结尾的 null 终止字符。这个参数可以防止 fgets 读取过多的数据从而导致缓冲区溢出。stream指向要读取的文件流的指针通常通过 fopen 打开文件后获得。 fgets 函数会从文件流 stream 中读取字符直到满足以下条件之一
读取了 n-1 个字符。遇到换行符\n。到达文件的末尾EOF。 一旦满足上述任何条件fgets 就会停止读取字符并将读取的字符存储在 str 指向的字符数组中。如果成功读取一行数据fgets 会在字符串的末尾添加一个 null 终止字符\0以确保字符串正确终止。
#include stdio.hint main()
{FILE *fpfopen(log.txt,r);if(fpNULL){perror(fopen:);return 1;}char line[64];while(fgets(line,sizeof(line),fp)!NULL){fprintf(stdout,%s,line);}fclose(fp);
}[hbrVM-16-9-centos exercise_func]$ cat log.txt
hello
[hbrVM-16-9-centos exercise_func]$ make
gcc -stdc99 -o mytest testC.c
[hbrVM-16-9-centos exercise_func]$ ./mytest
hello 模拟实现cat命令
通过添加命令行参数并读取参数内容实现cat命令功能。
#include stdio.hint main(int argc,char*argv[])
{if(argc!2){printf(argv error\n);return 1;}FILE *fpfopen(argv[1],r);if(fpNULL){perror(fopen:);return 2;}char line[64];while(fgets(line,sizeof(line),fp)!NULL){fprintf(stdout,%s,line);}fclose(fp);
}
[hbrVM-16-9-centos exercise_func]$ ./mytest makefile
mytest:testC.cgcc -stdc99 -o $ $^
.PHONY:clean
clean:rm -f mytest
[hbrVM-16-9-centos exercise_func]$ ./mytest log.txt
hello5、fscanf
fscanf() 是 C 语言标准库 stdio.h 中的一个函数用于从指定的输入流中读取格式化的数据。它的原型如下
int fscanf(FILE *stream, const char *format, ...);
stream 是指向 FILE 结构体的指针指定要从中读取数据的文件流。format 是一个字符串指定了读取数据的格式就像 scanf() 函数中一样。... 表示可变数量的参数用于接收从输入流中读取的数据根据 format 字符串中的格式进行解析。
fscanf() 会按照指定的格式从输入流中读取数据并将其存储到提供的变量中。它会根据 format 字符串中的格式指示符进行解析将相应的输入数据转换为指定的数据类型并存储到相应的变量中。
例如如果你有一个文件 data.txt 包含了一些数据John 25 Alice 30
你可以使用 fscanf() 函数从文件中读取这些数据
#include stdio.hint main() {FILE *file fopen(data.txt, r);if (file NULL) {perror(Error opening file);return 1;}char name[20];int age;// 从文件中读取数据while (fscanf(file, %s %d, name, age) ! EOF) {printf(Name: %s, Age: %d\n, name, age);}fclose(file);return 0;
} 这段代码将会从 data.txt 文件中读取名字和年龄并将它们打印到标准输出。
五、系统接口 系统调用open和write是操作系统提供的两个底层接口它们直接与内核交互用于文件操作。这些调用允许用户空间的程序执行文件系统相关的操作如打开文件、写入数据等。下面分别对这两个系统调用进行解释 1、open系统调用 open系统调用用于打开或创建一个文件并且为程序提供对该文件的访问。当一个文件被打开时操作系统创建一个文件描述符fd这是一个非负整数用于在后续操作中标识这个文件。 语法 int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode); pathname要打开或创建的文件的路径名。flags指定打开文件时的各种选项如O_RDONLY只读、O_WRONLY只写、O_RDWR读写、O_CREAT如果文件不存在则创建它O_TRUNC 文件存在则清空文件文件不存在则创建它O_APPEND将数据追加到文件的末尾。mode当创建新文件时指定文件的权限。这个参数是可选的取决于flags参数中是否包含O_CREAT标志。mode参数通常与权限位结合使用如0644典型的文本文件权限或0755典型的可执行文件权限。 返回值 成功时返回一个非负整数即文件描述符fd。失败时返回-1并设置errno变量以指示错误原因。 2、write系统调用 write系统调用用于将数据写入到一个已经打开的文件中。它通过文件描述符来确定目标文件。 语法 ssize_t write(int fd, const void *buf, size_t count); fd文件描述符指明要写入数据的文件。这个描述符通常是通过open系统调用获取的。buf指向一个内存区域的指针这个内存区域包含了要写入文件的数据。count要写入的字节数。 返回值 成功时返回写入的字节数。如果返回0表示没有写入任何数据。失败时返回-1并设置errno变量以指示错误原因。 write系统调用直接操作底层文件系统绕过了C标准库的缓冲区因此写操作是即时发生的。这两个系统调用是进行文件操作的基础它们提供了一种控制文件访问的方法是构建更高级文件I/O函数如C标准库中的fopen、fwrite等的基石。 例O_WRONLY #include stdio.h
#include string.h
#include fcntl.hint main() {int fdopen(log.txt,O_WRONLY);if(fd0){perror(open);return 1;}printf(open success,fd:%d\n,fd);return 0;
}[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3例O_WRONLY|O_CREAT 当使用 O_CREAT 选项与 open() 函数结合创建新文件时应同时指定文件的权限模式例如0644。这个 mode 参数定义了文件的初始权限。由于您没有提供 mode 参数文件的权限由系统默认值和 umask 值共同决定。 [hbrVM-16-9-centos exercise_func]$ cat testC.c
#include stdio.h
#include unistd.h
#include string.h
#include sys/types.h
#include sys/stat.h
#include fcntl.hint main() {int fdopen(log.txt,O_WRONLY|O_CREAT);if(fd0){perror(open);return 1;}const char *swrite success\n;write(fd,s,strlen(s));printf(open success,fd:%d\n,fd);close(fd);
}
[hbrVM-16-9-centos exercise_func]$ make
gcc -stdc99 -o mytest testC.c
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3
[hbrVM-16-9-centos exercise_func]$ ls
log.txt makefile mytest test1.c test2.c test3.c testC.c
[hbrVM-16-9-centos exercise_func]$ cat log.txt
cat: log.txt: Permission denied
[hbrVM-16-9-centos exercise_func]$ ll
total 36
---xrwx--T 1 hbr hbr 14 Mar 18 22:44 log.txt系统的umask值会影响通过shell或其他程序创建的文件的默认权限由于使用了umask(0)这会覆盖系统umask的影响因此新创建的文件权限不受系统umask的限制。我们将umask设置为0然后指定open的权限参数mode为0664使其权限正常这次就可以创建并打开写入文件了。 umask(0)
int fdopen(log.txt,O_WRONLY|O_CREAT,0664);[hbrVM-16-9-centos exercise_func]$ ll
total 32
-rw-rw-r-- 1 hbr hbr 72 Mar 18 21:19 makefile
-rw-rw-r-- 1 hbr hbr 374 Mar 18 22:52 testC.c
[hbrVM-16-9-centos exercise_func]$ make
make: mytest is up to date.
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3
[hbrVM-16-9-centos exercise_func]$ cat log.txt
write success例O_TRUNC 在这里O_TRUNC标志会将文件截断为零长度即清空文件内容然后再写入新的内容。因此当你运行程序后文件log.txt的内容被清空然后写入了新的字符串O_TRUNC success。 #include stdio.h
#include unistd.h
#include string.h
#include sys/types.h
#include sys/stat.h
#include fcntl.hint main() {umask(0);int fdopen(log.txt,O_WRONLY|O_CREAT|O_TRUNC,0664);if(fd0){perror(open);return 1;}const char *sO_TRUNC success\n;write(fd,s,strlen(s));printf(open success,fd:%d\n,fd);close(fd);
}[hbrVM-16-9-centos exercise_func]$ ls
log.txt makefile mytest test1.c test2.c test3.c testC.c
[hbrVM-16-9-centos exercise_func]$ cat log.txt
write success
[hbrVM-16-9-centos exercise_func]$ make
gcc -stdc99 -o mytest testC.c
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3
[hbrVM-16-9-centos exercise_func]$ cat log.txt
O_TRUNC success例O_APPEND 通过使用O_APPEND标志你告诉系统在每次写入时都将数据追加到文件的末尾而不是覆盖文件中已有的内容。每次你运行程序./mytest时它会打开文件log.txt并将字符串O_APPEND success追加到文件的末尾。 #include stdio.h
#include unistd.h
#include string.h
#include sys/types.h
#include sys/stat.h
#include fcntl.hint main() {umask(0);int fdopen(log.txt,O_WRONLY|O_CREAT|O_APPEND,0664);if(fd0){perror(open);return 1;}// const char *swrite success\n;// const char *sO_TRUNC success\n;const char *sO_APPEND success\n;write(fd,s,strlen(s));printf(open success,fd:%d\n,fd);close(fd);
}[hbrVM-16-9-centos exercise_func]$ make
gcc -stdc99 -o mytest testC.c
[hbrVM-16-9-centos exercise_func]$ cat log.txt
O_TRUNC success
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success,fd:3
[hbrVM-16-9-centos exercise_func]$ cat log.txt
O_TRUNC success
O_APPEND success
O_APPEND success
O_APPEND success3、read #include unistd.hssize_t read(int fd, void *buf, size_t count); fd是已打开文件的文件描述符。buf是用于存储读取数据的缓冲区的指针。count是要读取的字节数。 read函数会尝试从文件描述符fd指向的文件中读取count个字节的数据并将其存储到buf指向的内存区域中。函数返回实际读取的字节数如果出现错误则返回-1。 例O_RDONLY 使用read(fd, buffer, sizeof(buffer))从文件中读取数据。read函数会尝试从文件描述符fd指向的文件在这里是log.txt中读取64个字节的数据并将其存储到buffer数组中。 在运行程序后read函数将文件中的内容读取到buffer数组中然后你通过printf(%s, buffer)将读取的内容输出到控制台。 [hbrVM-16-9-centos exercise_func]$ cat testC.c
#include stdio.h
#include unistd.h
#include string.h
#include sys/types.h
#include sys/stat.h
#include fcntl.hint main()
{umask(0);int fd open(log.txt, O_RDONLY); if (fd 0) {perror(open);return 1;}printf(open success, fd: %d\n, fd);char buffer[64];memset(buffer, 0, sizeof(buffer)); read(fd, buffer, sizeof(buffer)); printf(%s, buffer); // 输出读取的内容close(fd);return 0;
}
[hbrVM-16-9-centos exercise_func]$ make
gcc -stdc99 -o mytest testC.c
[hbrVM-16-9-centos exercise_func]$ ./mytest
open success, fd: 3
O_TRUNC success
O_APPEND success
O_APPEND success 4、系统调用和库函数 在认识open返回值fd之前先来认识一下两个概念: 系统调用 和 库函数 在深入理解函数返回值之前我们需要区分两个核心概念系统调用和库函数。
举例来说fopen, fclose, fread, fwrite 这些函数都属于C标准库因此我们称它们为库函数或libc中的函数。相比之下open, close, read, write, lseek 等则是由操作系统提供的接口我们将这类接口称为系统调用。
通过下面的图中我们可以看到以“f”开头的函数系列实质上是对底层系统调用的封装。这样的封装不仅提供了更丰富的功能和更高级的抽象也极大地简化了开发过程使得开发者能够更加方便地进行二次开发。