F-Stack 之 kqueue 封装为 epoll 介绍

F-Stack是一个全用户态的高性能的网络接入开发包,基于DPDK、FreeBSD协议栈、微线程接口等,适用于各种需要网络接入的业务,用户只需要关注业务逻辑,简单的接入F-Stack即可实现高性能的网络服务器。

F-Stack中使用的FreeBSD协议栈的高性能异步事件通知的API是kqueue,而Linux系统上则是我们熟悉的epoll,大量的Linux网络server都是基于epoll事件通知机制,为降低已有服务器接入F-Stack的修改难度,F-Stack协议栈实现了把kqueue封装为epoll接口,提供的API如下::

  • int ff_epoll_create(int size): 创建epoll fd,底层实际调用freebsd协议栈的kern_kqueue()接口
  • int ff_epoll_ctl(int epfd, int op, int fd, struct epoll_event *event): epoll事件操作函数,添加关心的fd和事件到epoll fd中,底层实际调用了freebsd协议栈的kern_kevent()接口
  • int ff_epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout):epoll事件操作通知函数,底层实际调用了freebsd协议栈的kern_kevent()接口
  • int ff_epoll_close(int epfd):epoll fd的关闭函数,底层调用kern_close()

比较核心的ff_epoll_ctl()ff_epoll_wait()代码实现如下:

int 
ff_epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)
{
	if (!event && op != EPOLL_CTL_DEL) {
        ff_os_errno(ff_EINVAL);
		return -1;
	}

	struct kevent kev[3];
	if (op == EPOLL_CTL_ADD){
		EV_SET(&kev[0], fd, EVFILT_READ,
			EV_ADD | (event->events & EPOLLIN ? 0 : EV_DISABLE), 0, 0, NULL);
		EV_SET(&kev[1], fd, EVFILT_WRITE,
			EV_ADD | (event->events & EPOLLOUT ? 0 : EV_DISABLE), 0, 0, NULL);
		EV_SET(&kev[2], fd, EVFILT_USER, EV_ADD,
			    event->events & EPOLLRDHUP ? 1 : 0, 0, NULL);		
	} else if (op == EPOLL_CTL_DEL) {
		EV_SET(&kev[0], fd, EVFILT_READ, EV_DELETE, 0, 0, NULL);
		EV_SET(&kev[1], fd, EVFILT_WRITE, EV_DELETE, 0, 0, NULL);
		EV_SET(&kev[2], fd, EVFILT_USER, EV_DELETE, 0, 0, NULL);
	} else if (op == EPOLL_CTL_MOD) {
		EV_SET(&kev[0], fd, EVFILT_READ,
		    event->events & EPOLLIN ? EV_ENABLE : EV_DISABLE, 0, 0, NULL);
		EV_SET(&kev[1], fd, EVFILT_WRITE,
		    event->events & EPOLLOUT ? EV_ENABLE : EV_DISABLE, 0, 0, NULL);
		EV_SET(&kev[2], fd, EVFILT_USER, 0,
		    NOTE_FFCOPY | (event->events & EPOLLRDHUP ? 1 : 0), 0, NULL);		
	} else {
		ff_os_errno(ff_EINVAL);
		return -1;
	}

	return ff_kevent(epfd, kev, 3, NULL, 0, NULL);
}

ff_epoll_ctl()核心是把Linux Epoll的事件EPOLLIN、EPOLLOUT(其他的暂未支持)转成成Freebsd的事件标EVFILT_READ、EVFILT_WRITE、EVFILT_USER。

int 
ff_epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout)
{
	if (!events || maxevents < 1) {
		ff_os_errno(ff_EINVAL);
		return -1;
	}
	
	struct kevent *evlist = malloc(sizeof(struct kevent)*maxevents, M_DEVBUF, M_ZERO|M_NOWAIT);
	if(NULL == evlist){
		ff_os_errno(ff_EINVAL);
		return -1;		
	}
	memset(evlist, 0, sizeof(struct kevent)*maxevents);
	
	int ret = ff_kevent(epfd, NULL, 0, evlist, maxevents, NULL);
	if (ret == -1) {
		free(evlist, M_DEVBUF);
		return ret;
	}

	unsigned int event_one = 0;
	for (int i = 0; i < ret; ++i) {
		event_one = 0;
		if (evlist[i].filter & EVFILT_READ) {
			event_one |= EPOLLIN;
		} 
		if (evlist[i].filter & EVFILT_WRITE) {
			event_one |= EPOLLOUT;
		}

		if (evlist[i].flags & EV_ERROR) {
			event_one |= EPOLLERR;
		}

		if (evlist[i].flags & EV_EOF) {
			event_one |= EPOLLIN;		
		}
		events[i].events   = event_one;
		events[i].data.fd  = evlist[i].ident;
	}
	
	free(evlist, M_DEVBUF);
	return ret;
}

ff_epoll_wait()的核心就是struct kevent结构和struct epoll_event的转换,把kqueue返回的fd和事件都封装到struct epoll_event结构中,返回给调用者。

一个实际的Server DEMO代码如下:

int loop(void *arg)
{
    /* Wait for events to happen */

    int nevents = ff_epoll_wait(epfd,  events, MAX_EVENTS, 0);
    int i;

    for (i = 0; i < nevents; ++i) {	
        /* Handle new connect */
        if (events[i].data.fd == sockfd) {
            int nclientfd = ff_accept(sockfd, NULL, NULL);
            assert(nclientfd > 0);
            /* Add to event list */
    	    ev.data.fd = nclientfd;
    	    ev.events  = EPOLLIN;
    	    assert(ff_epoll_ctl(epfd, EPOLL_CTL_ADD, nclientfd, &ev) == 0);
            //fprintf(stderr, "A new client connected to the server..., fd:%d\n", nclientfd);
        } else { 
            if (events[i].events & EPOLLERR ) {
                /* Simply close socket */
        	ff_epoll_ctl(epfd, EPOLL_CTL_DEL,  events[i].data.fd, NULL);
                ff_close(events[i].data.fd);
                //fprintf(stderr, "A client has left the server...,fd:%d\n", events[i].data.fd);
            } else if (events[i].events & EPOLLIN) {
                char buf[256];
                size_t readlen = ff_read( events[i].data.fd, buf, sizeof(buf));
                //fprintf(stderr, "bytes are available to read..., readlen:%d, fd:%d\n", readlen,  events[i].data.fd);
        	if(readlen > 0){
                    ff_write( events[i].data.fd, html, sizeof(html));
        	} else {
        	    ff_epoll_ctl(epfd, EPOLL_CTL_DEL,  events[i].data.fd, NULL);
                    ff_close( events[i].data.fd);
                    //fprintf(stderr, "A client has left the server...,fd:%d\n", events[i].data.fd);		
        	}
            } else {
                fprintf(stderr, "unknown event: %8.8X\n", events[i].events);
            }
        }
    }
}

实际运行结果:

更多具体信息请访问F-Stack的github主页进行查看。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏乐沙弥的世界

日志记录模式(LOGGING 、FORCE LOGGING 、NOLOGGING)

--==================================================

811
来自专栏菩提树下的杨过

内存数据库到底有多快?

并发量太高的应用中(比如10分钟内插入300w条记录),数据库往往难堪重负,在没有银子实现服务器集群/负载均衡/分布式存储的情况下,可以尝试一下把数据库做一个临...

19910
来自专栏运维前线

Zabbix监控Dell服务器硬件状态

OMSA介绍 Dell OpenManage Server Administrator (OMSA)是一款全面的一对一系统管理解决方案。OMSA可分为两种: ...

4206
来自专栏Java学习123

powerdesigner 15 如何导出sql schema

3037
来自专栏我的博客

Sqlite使用说明

安装apt-get install slqite .databases List names and files of attached databases(列...

3204
来自专栏乐沙弥的世界

Oracle 基于用户管理恢复的处理

Oracle支持多种方式来管理数据文件的备份与恢复来保证数据库的可靠与完整。除了使用RMAN工具以及第三方备份与恢复工具之外,基于

482
来自专栏F-Stack的专栏

F-Stack之kqueue封装为epoll介绍

F-Stack是一个全用户态的高性能的网络接入开发包,基于DPDK、FreeBSD协议栈、微线程接口等,适用于各种需要网络接入的业务,用户只需要...

3159
来自专栏一枝花算不算浪漫

MyBatis学习总结(八)——Mybatis3.x与Spring4.x整合

4139
来自专栏Java学习123

powerdesigner 15 如何导出sql schema

2795
来自专栏古时的风筝

Spring集成MyBatis

如果觉得Hibernate不够灵活,可以尝试用Mybatis。相比于Hibernate,Mybatis则显得更加轻量、更加灵活,对于我这种不喜欢被束缚的人,使用...

2247

扫码关注云+社区