Linux下系统调用和文件操作


一、系统调用

   UNIX/Linux系统绝大部分功能都是通过系统调用实现,比如:open/close...
UNIX/Linux把系统调用都封装成了C函数的形式,但他们不是标准C的一部分。
标准库中的函数绝大部分时间都工作在用户态,但部分时间也需要切换到内核(进行了系统调用),比如:malloc/free/fread/fwirte/malloc/free。
我们自己所编写的代码也可以直接调用系统接口进入内核态(进行系统调用),比如brk/sbrk/mmap/munmap   
系统调用的功能代码存在于内核中,接口定义在C库中,该接口通过系统中断实现调用,而不是普通函数进行跳转。
注意:从用户态切换到内核态或从内核态返回到用户态都会消耗时间。

time a.out
real    0m0.137s    总执行时间 = 用户态 + 内核态 + 切换消耗的时间
user    0m0.092s    用户态执行时间
sys     0m0.040s    内核态执行时间
strace 程序 可以跟踪系统调用

二、一切皆文件

在UNIX/Linux系统下,几乎所有资源都是以文件形式提供的,所以在UNIX/Linux系统下一切皆文件,操作系统把它的服务、功能、设备抽象成简单的文件,提供一套简单统一的接口,这样程序就可以像访问磁盘上的文件一样访问串口、终端、打印机、网络等功能。
大多数情况下只需要 open/read/write/ioctl/close 就可以实现对各种设备的输入、输出、设置、控制等。
UNIX/Linux下几乎任何对象都可以当作特殊类型的文件,可以以文件的形式访问。
目录文件    里面记录的是一些文件信息,相关条目。
设备文件    在系统的/dev目录下存储了所有的设置文件
    stderr  
    stdin
    stdout
普通文件    
    链接文件
    管道文件
    socket文件

三、文件相关系统调用

open        打开或创建文件 
create      创建文件
close       关闭文件
read        读文件
write       写文件
lseek       设置文件读写位置
unlink      删除链接
remove      删除文件

四、文件描述符

文件描述符是一个非负整数,表示一个打开的文件,由系统调用open/create/socket返回值。
为什么使用文件描述符而不像标准库那样使用文件指针?
因为记录文件相关信息的结构存储在内核中,为了不暴露内存的地址,因此文件结构指针不能直接给用户操作,内核中记录一张表,其中一列是文件描述符,对应一列文件结构指针,文件描述符就相当于获取文件结构指针的下标。
内核中已经有三个已经打开的文件描述符,它们的宏定义在:
    stdin  0    STDIN_FILENO
    stdout 1    STDOUT_FILENO
    stderr 2    STDERR_FILENO
0,1,2 都代表的是终端

dup 复制文件描述符

dup2 复制指定的文件描述符

五、open/creat/close

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(const char *pathname, int flags);
功能:打开文件
pathname:文件的路径
flags:打开的权限
    O_RDONLY, 只读
    O_WRONLY, 只写
    O_RDWR,   读写
    O_NOCTTY, 当打开的是终端设备文件,不要把该文件当作主控终端。 
    O_TRUNC,  清空
    O_APPEND, 追加
返回值:文件描述符

int open(const char *pathname, int flags, mode_t mode);
flags:打开的权限
    O_CREAT,  文件不存在则创建
    O_EXCL,   如果文件存在,则创建失败
mode:设置文件的权限
    S_IRWXU  00700 user (file owner) has  read,  write  and  execute permission
    S_IRUSR  00400 user has read permission
    S_IWUSR  00200 user has write permission
    S_IXUSR  00100 user has execute permission
    S_IRWXG  00070 group has read, write and execute permission
    S_IRGRP  00040 group has read permission
    S_IWGRP  00020 group has write permission
    S_IXGRP  00010 group has execute permission
    S_IRWXO  00007 others have read, write and execute permission
    S_IROTH  00004 others have read permission
    S_IWOTH  00002 others have write permission
    S_IXOTH  00001 others have execute permission

int close(int fd);
功能:关闭打开的文件

六、read/write

#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
功能:从文件中读取数据到内存
fd:文件描述符,open函数的返回值
buf:数据的存储位置
count:读取的字节数
返回值:成功读取到的字节数

ssize_t write(int fd,const void *buf, size_t count);
功能:把数据写入到文件
fd:文件描述符,open函数的返回值
buf:要写入的数据内存首地址
count:要写入的字节数
返回值:成功写入的字节数
注意:如果把结构体以文本形式写入到文件,需要先把结构体转换成字符串

七、lseek

off_t lseek(int fd, off_t o_fset, int whence);
功能:设置文件位置指针
o_fset:偏移值
whence:
    SEEK_SET
    SEEK_CUR
    SEEK_END
返回值:文件指针的位置

练习1:实现一个Linux系统下计算文件大小的函数,使用系统调用完成。
练习2:实现带覆盖检查的cp命令。

八、dup/dup2

int dup(int oldfd);
功能:复制文件描述符,操作系统会从末的文件描述符中选择一个返回。
oldfd:被复制的文件描述符

int dup2(int oldfd, int newfd);
功能:复制指定的文件描述符,如果newfd已经被使用,则先关闭,再复制。

九、标准IO与系统IO比较

练习3:分别使用标准IO(文件读写open)比较系统IO(fopen等)随机写入1000000个整数到文件,比较哪一种更快,为什么?
因为标准IO使用了缓冲技术,当数据写入时并没有立即把数据交给内核,而是先存放在缓冲区中,当缓冲区满时,会一次性把缓冲区中的数据交给内核写到文件中,这样就减少了内核态与用户态的切换次数。
而系统IO每写一次数据就要进入一次内核态,这样就浪费了大量时间进行内核态与用户态的切换,因此用时更长
如果为系统IO,设置更大的缓冲区,它会比标准IO更快

Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source Love丶伊卡洛斯 !
评论
 Previous
Linux下线程的相关知识 Linux下线程的相关知识
一、线程基本概念1、线程就是进程中的执行路线,即进程内部的控制序列,或者说是进程的子任务(进程就是正在运行的程序,它是一个资源单位) 2、线程就是轻量级的,没有自己独立的内存资源,使用的是进程的代码段、数据段、bss段、堆(注意:没有栈)、
2019-09-09
Next 
Linux下库、静态库、共享库 Linux下库、静态库、共享库
五、库库就是目标文件的集合,我们把不需要升级更新维护的代码打包合并在一起方便使用,也可以对源文件进行保密。 静态库在使用时是把被调用的代码复制到调用模块中,然后再执行程序时,静态库就不需要了。 静态库的执行速度快,但占用空间大,当库中的内容
2019-09-09
  TOC