什么是Epoll

Epoll是什么?按照man手册的说法,是为处理大批量句柄而作了改进的poll。它在Linux2.5.44中被引进。他具备之前的poll/select所具有的优点,又没有它们的缺点,被公认为Linux 2.6下性能最好的多路IO就绪通知方法。

Epoll的相关系统调用

Epoll只有三个调用,分别是 epoll_create, epoll_ctl, epoll_wait

1. `int epoll_create(int size);

创建一个epoll的句柄。自从Linux 2.6.8之后,size参数是被忽略的。需要注意的是,当创建好epoll句柄之后,它就是一个会占用一个fd值,在linux下的/proc/进程id/fd/ 目录下,可以查看到这个fd。所以在使用epoll完成后,必须调用 close关闭它。

2. `int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

epoll的事件注册函数,它不同于 select是在监听事件时,告诉内核需要监听什么类型的事件, 而是再这里先注册 要监听的事件类型。
第一个参数是 epoll_create的返回值。
第二个参数表示动作,用三个宏来表示:

  • EPOLL_CTL_ADD: 注册新的fd到epfd中
  • EPOLL_CTL_MOD: 修改已经注册的fd的监听事件
  • EPOLL_CTL_DEL: 从epfd中删除一个fd

第三个参数是需要监听的fd
第四个参数是告诉内核需要监听什么事, 其中struct epoll_event的结构如下:

typedef union epoll_data {
  void *ptr;
  int fd;
  __uint32_t u32;
  __uint64_t u64;
} epoll_data_t;
struct epoll_event {
  __uint32_t events;
  epoll_data_t data;
};

events可以是以下几个宏的集合:

  • EPOLLIN: 表示对应的文件描述符可以读(包括对端SOCKET正常关闭)
  • EPOLLOUT: 表示对应的文件描述符可以写
  • EPOLLPRI: 表示对应的文件描述符有紧急的数据可读(这里应该表示 有带外数据带来)
  • EPOLLERR: 表示对应的文件描述符发生错误
  • EPOLLHUP: 表示对应的文件描述符被挂断
  • EPOLLET: 表示将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。
  • EPOLLONESHOT: 只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里