前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >System|网络|packet的一生

System|网络|packet的一生

作者头像
朝闻君
修改2021-11-22 10:28:55
1920
修改2021-11-22 10:28:55
举报
文章被收录于专栏:用户9199536的专栏

Linux全流程

既然要讲,那就把一个包的整个包生都说了算了

触发中断

  • 在非虚拟化环境下,网卡通过DMA将packet写入内核的rx_ring环形队列缓冲区,并触发中断。
  • 如果在虚拟化环境下,VMM配置GIC ITS (Interrupt Translation Service) ,建立物理中断与虚拟中断的映射完成中断虚拟化使得网卡能直接向VM发出中断,同时通过IO虚拟化,网卡通过IOMMU将packet直接写入虚拟机内核的rx_ring

Top Half

  • CPU在收到中断之后,调用网卡ISR也就是所谓的中断handler
  • 分配sk_buf并入input_pkt_queue(如果队列已满则丢弃)
  • 发出一个软中断NET_RX_SOFTIRQ,软中断可以被调度例如通过tasklet

Bottom Half

  • sk_buf从input_pkt_queue传入process_queue,根据协议类型调用网络层协议的handler
  • ip_rcv执行包头检查,ip_router_input()进行路由,决定本机/转发/丢弃
  • tcp_v4_rcv执行包头检查,tcp_v4_lookup查询对应的socket和connection,如果正常,tcp_prequeue将skb放进socket接收队列
  • socket随即唤醒所在的进程

Kqueue

因为epoll没有论文,就说说kqueue是怎么做的吧,kqueue会根据socket绑定的knote链表(每个监听的kqueue都可能创建一个knote),将knote通过反向指针获得kqueue,将knote加入kqueue的就绪队列末尾。如果此时恰好有进程正在监听的话,将会唤醒进程,kqueue会被扫描,并从就绪队列处获得所有的event,从而了解已经就绪的所有socket。

  • 唤醒的进程调用socket recv系统调用,如果是TCP则调用tcp_recvmsg从sk_buffer拷贝数据

Batch

代码语言:javascript
复制
netif_receive_skb_list()

Linux的NAPI还会继续延迟软中断的处理,等待其积累足够的skb后进行轮询,一次性处理所有的skb。

SKB

skb并不是直接存储报文,而是存储指针,指针只需要移动,就能完成解包,而本身的报文并不需要修改。上一层的协议栈会在处理当前层的同时设置好下一层的头指针,并且移动data指针。与此同时,skb本身是双向链表实现的队列。qlen为链表元素长度,lock为添加元素时的锁。


谈到指针的用法,这里举个做OS lab时印象深刻的奇淫巧技,也是C的指针变态的地方

代码语言:javascript
复制
#define list_entry(ptr, type, field) \
	container_of(ptr, type, field)
#define container_of(ptr, type, field) \
	((type *)((void *)(ptr) - (u64)(&(((type *)(0))->field))))

(u64)(&(((type *)(0))->field))))指的是field在结构体type中的偏移量,通过减去这个偏移量我们就能找出某个对象所在上级type对象的地址,也就是container。

一般来说,我们都会使用下面这样的方式,让链表节点去包裹数据。

代码语言:javascript
复制
struct page_list_node {
        struct page p;
	struct list_node *prev;
	struct list_node *next;
};

但是,通过指针操作,却可以让数据去包裹链表节点

代码语言:javascript
复制
struct list_head {
	struct list_head *prev;
	struct list_head *next;
};

struct page{
	struct list_head      list_node;
}

在仅仅知道链表节点的情况下,借助成员偏移量即可知道容器对象的位置并取出

代码语言:javascript
复制
list_entry(somenode,struct page,list_node);

list_head本身可以存在于任何对象上,而他们的entry却能根据参数而指向不同的类型,感觉有点泛型的味道了。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 触发中断
  • Top Half
  • Bottom Half
  • Batch
  • SKB
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档