一、系统调用
UNIX/Linux系统绝大部分功能都是通过系统调用实现,比如:open/close...
UNIX/Linux把系统调用都封装成了C函数的形式,但他们不是标准C的一部分。
标准库中的函数绝大部分时间都工作在用户态,但部分时间也需要切换到内核(进行了系统调用),比如:malloc/free/fread/fwirte/malloc/free。
我们自己所编写的代码也可以直接调用系统接口进入内核态(进行系统调用),比如brk/sbrk/mmap/munmap
系统调用的功能代码存在于内核中,接口定义在C库中,该接口通过系统中断实现调用,而不是普通函数进行跳转。
注意:从用户态切换到内核态或从内核态返回到用户态都会消耗时间。
time a.out
real 0m0.137s 总执行时间 = 用户态 + 内核态 + 切换消耗的时间
user 0m0.092s 用户态执行时间
sys 0m0.040s 内核态执行时间
strace 程序 可以跟踪系统调用
二、一切皆文件
在UNIX/Linux系统下,几乎所有资源都是以文件形式提供的,所以在UNIX/Linux系统下一切皆文件,操作系统把它的服务、功能、设备抽象成简单的文件,提供一套简单统一的接口,这样程序就可以像访问磁盘上的文件一样访问串口、终端、打印机、网络等功能。
大多数情况下只需要 open/read/write/ioctl/close 就可以实现对各种设备的输入、输出、设置、控制等。
UNIX/Linux下几乎任何对象都可以当作特殊类型的文件,可以以文件的形式访问。
目录文件 里面记录的是一些文件信息,相关条目。
设备文件 在系统的/dev目录下存储了所有的设置文件
stderr
stdin
stdout
普通文件
链接文件
管道文件
socket文件
三、文件相关系统调用
open 打开或创建文件
create 创建文件
close 关闭文件
read 读文件
write 写文件
lseek 设置文件读写位置
unlink 删除链接
remove 删除文件
四、文件描述符
文件描述符是一个非负整数,表示一个打开的文件,由系统调用open/create/socket返回值。
为什么使用文件描述符而不像标准库那样使用文件指针?
因为记录文件相关信息的结构存储在内核中,为了不暴露内存的地址,因此文件结构指针不能直接给用户操作,内核中记录一张表,其中一列是文件描述符,对应一列文件结构指针,文件描述符就相当于获取文件结构指针的下标。
内核中已经有三个已经打开的文件描述符,它们的宏定义在:
stdin 0 STDIN_FILENO
stdout 1 STDOUT_FILENO
stderr 2 STDERR_FILENO
0,1,2 都代表的是终端
dup 复制文件描述符
dup2 复制指定的文件描述符
五、open/creat/close
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
int open(const char *pathname, int flags);
功能:打开文件
pathname:文件的路径
flags:打开的权限
O_RDONLY, 只读
O_WRONLY, 只写
O_RDWR, 读写
O_NOCTTY, 当打开的是终端设备文件,不要把该文件当作主控终端。
O_TRUNC, 清空
O_APPEND, 追加
返回值:文件描述符
int open(const char *pathname, int flags, mode_t mode);
flags:打开的权限
O_CREAT, 文件不存在则创建
O_EXCL, 如果文件存在,则创建失败
mode:设置文件的权限
S_IRWXU 00700 user (file owner) has read, write and execute permission
S_IRUSR 00400 user has read permission
S_IWUSR 00200 user has write permission
S_IXUSR 00100 user has execute permission
S_IRWXG 00070 group has read, write and execute permission
S_IRGRP 00040 group has read permission
S_IWGRP 00020 group has write permission
S_IXGRP 00010 group has execute permission
S_IRWXO 00007 others have read, write and execute permission
S_IROTH 00004 others have read permission
S_IWOTH 00002 others have write permission
S_IXOTH 00001 others have execute permission
int close(int fd);
功能:关闭打开的文件
六、read/write
#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
功能:从文件中读取数据到内存
fd:文件描述符,open函数的返回值
buf:数据的存储位置
count:读取的字节数
返回值:成功读取到的字节数
ssize_t write(int fd,const void *buf, size_t count);
功能:把数据写入到文件
fd:文件描述符,open函数的返回值
buf:要写入的数据内存首地址
count:要写入的字节数
返回值:成功写入的字节数
注意:如果把结构体以文本形式写入到文件,需要先把结构体转换成字符串
七、lseek
off_t lseek(int fd, off_t o_fset, int whence);
功能:设置文件位置指针
o_fset:偏移值
whence:
SEEK_SET
SEEK_CUR
SEEK_END
返回值:文件指针的位置
练习1:实现一个Linux系统下计算文件大小的函数,使用系统调用完成。
练习2:实现带覆盖检查的cp命令。
八、dup/dup2
int dup(int oldfd);
功能:复制文件描述符,操作系统会从末的文件描述符中选择一个返回。
oldfd:被复制的文件描述符
int dup2(int oldfd, int newfd);
功能:复制指定的文件描述符,如果newfd已经被使用,则先关闭,再复制。
九、标准IO与系统IO比较
练习3:分别使用标准IO(文件读写open)比较系统IO(fopen等)随机写入1000000个整数到文件,比较哪一种更快,为什么?
因为标准IO使用了缓冲技术,当数据写入时并没有立即把数据交给内核,而是先存放在缓冲区中,当缓冲区满时,会一次性把缓冲区中的数据交给内核写到文件中,这样就减少了内核态与用户态的切换次数。
而系统IO每写一次数据就要进入一次内核态,这样就浪费了大量时间进行内核态与用户态的切换,因此用时更长
如果为系统IO,设置更大的缓冲区,它会比标准IO更快