BPF

✍ dations ◷ 2025-11-10 09:33:55 #BPF

伯克利包过滤器(Berkeley Packet Filter,缩写 BPF),是类Unix系统上数据链路层的一种原始接口,提供原始链路层封包的收发。除此之外,如果网卡驱动支持混杂模式,那么它可以让网卡处于此种模式,这样可以收到网络上的所有包,不管他们的目的地是不是所在主机。

另外,BPF支持过滤数据包——用户态的进程可以提供一个过滤程序来声明它想收到哪些数据包。通过这种过滤可以避免从操作系统内核向用户态复制其他对用户态程序无用的数据包,从而极大地提高性能。

BPF有时也只表示过滤机制,而不是整个接口。一些系统,比如Linux和Tru64 Unix,提供了数据链路层的原始接口,而不是BPF的接口,但使用了BPF的过滤机制。

BSD 内核实现例程如 bpf_mtap()bpf_tap(),以BPF_MTAP()BPF_TAP()等宏定义的形式进行包裹由网卡驱动(以及伪驱动pseudo-drivers) 向BPF机制发送进出的封包。

原始的论文由Steven McCanne 和 Van Jacobson于1992年在劳伦斯伯克利国家实验室工作时编写,于1993年在San Diego举办的USENIX冬季会议上正式发表。

许多版本的Unix操作系统提供了用于捕获数据包的设施,使得监控当前网络情况成为了可能。但是,因为网络监控程序运行在用户态,数据包必须被拷贝来通过内核与用户态之间的边界。可以通过使用一种被称为“数据包过滤器”的内核代理来减少拷贝的数量,它会尽量早地丢弃不想要的数据包。早先的数据包过滤器被实现为基于栈的虚拟机,在RISC CPU上性能不佳。BPF使用了一种新的基于寄存器(Register)的虚拟机,在性能上有显著提升。

BPF的过滤功能是以对于BPF虚拟机机器语言的一种解释器的形式实现的,使用这种语言编写的程序可以抓取数据包,对数据包中的数据采取算术操作,并将结果与常量或数据包中的数据或结果中的测试位比较,根据比较的结果决定接受还是拒绝封包。

传统的Unix BPF实现能够被用于用户态,尽管它是为内核态编写。这是通过编译时的条件预处理完成的。

一些项目使用了不同以往的BPF指令集或者执行方法。

包括FreeBSD和WinPcap在内的一些平台,使用即时编译(JIT)编译器来把BPF指令转换为原始字节码,以进一步提高性能。Linux有一个BPF JIT编译器,但被默认禁用。

此虚拟机语言的内核态解释器则被用于其他操作系统的原始数据链路机制,例如Tru64 Unix系统,以及Linux内核中的套接字过滤器,和WinPcap数据包抓取机制。

用户态解释器由实现了pcap API的libpcap/WinPcap提供,因此,在对此过滤机制没有内核态支持的系统上抓取数据包时,数据包可以在内核态过滤,使用pcap API的代码可以工作于此两种模式;在使用用户态过滤的系统上,所有数据包由内核态复制到用户态,包括将被过滤出去的封包。这种解释器也可以用于包含由pcap抓取的封包的文件。

2007年,Robert Watson(英语:Robert Watson (computer scientist))与Christian Peron为FreeBSD操作系统中BPF的实现加入了zero-copy buffer extension,使得驱动程序中断处理器中的内核封包抓取能直接向用户内存写,以避免BPF设备收到的所有封包数据的两次复制需要,一份副本存在于用户进程的接收路径中,这保证了不同BPF设备调用者的独立性,同时使得只把封包头部放入BPF缓冲区,而不是复制整个封包数据。

Will Drewry为seccomp(安全计算)系统调用策略添加了BPF过滤器,这也是BPF第一次在网络领域之外的使用。

从3.18版本开始,Linux 内核提供了一种扩展的BPF虚拟机,被称为“extended BPF”,简称为eBPF。它能够被用于非网络相关的功能,比如附在不同的tracepoints上,从而获取当前内核运行的许多信息。

传统的BPF,现在被称为cBPF(classical BPF)。

eBPF由Alexei Starovoitov在PluMgrid工作时设计,这家公司专注于研究新的方法来设计软件定义网络解决方案。在它只是一个提议时,Daniel Borkmann——Red Hat公司的内核工程师,帮助修改使得它能够进入内核代码并完全替代已有的BPF实现。这是二十年来BPF首次主要的更新,使得BPF成为了一个通用的虚拟机。

eBPF被Linux内核合并的事件线如下:

因为eBPF虚拟机使用的是类似于汇编语言的指令,对于程序编写来说直接使用难度非常大。和将C语言生成汇编语言类似,现在的编译器正在逐步完善从更高级的语言生成BPF虚拟机使用的指令。LLVM在3.7版本开始支持BPF作为后端输出。GCC 10也将会支持BPF作为后端。BCC是IOVisor项目下的编译器工具集,用于创建内核跟踪(tracing)工具。bpftrace是为eBPF设计的高级跟踪语言,在Linux内核(4.x)中提供。

eBPF现在被应用于网络、跟踪、内核优化、硬件建模等领域。

Spectre攻击可以利用Linux内核的eBPF JIT编译器来从其它内核进程提取信息。

相关

  • 通格通格(absolutive case、或称:绝对格)于作-通格语言中表示及物动词宾语与不及物动词主语的一种语法格。如巴斯克语名词mutil(意为“童”),加单数通格屈折-a,可表主词于不及物动词句m
  • 鉴湖鉴湖原名镜湖,相传黄帝铸镜于此而得名,又称长湖、镜湖、庆湖,位于中国浙江省绍兴市西南1.5公里,古为大型农田水利工程之一,现为浙江名湖之一。东汉顺帝永和五年(140年),会稽太守马臻
  • 丸山城志郎丸山城志郎(日语:丸山 城志郎,1993年8月11日-)是日本柔道运动员,曾获得2018年亚洲运动会柔道比赛男子66公斤级银牌。父亲丸山显志(日语:丸山顕志)、兄长丸山刚毅(日语:丸山剛毅)也是柔道
  • 辛桥镇辛桥镇,是中华人民共和国河北省保定市高碑店市下辖的一个乡镇级行政单位。2016年,河北省民政厅批复同意撤销辛桥乡,设立辛桥镇,镇人民政府驻辛桥村政府路1号。辛桥镇下辖以下地
  • 王基笑王基笑(1930年-2006年12月5日),中华人民共和国作曲家、教育工作者,中国共产党党员。王基笑在辽宁丹东出生,祖籍山东青岛,1947年参加部队,在文艺工作团乐队演奏乐器,1950年入中国共产
  • 岑熙岑熙(?-?),南阳郡西棘阳县(今河南省新野县)人。是岑彭的玄孙,岑杞的儿子,爵位为细阳侯。岑杞死后,岑熙继承了他的爵位,并且娶了汉安帝的妹妹涅阳公主刘侍男。岑熙年轻的的时候做过侍中、
  • 麦华陀沃尔特·亨利·梅德赫斯特爵士(英语:Sir Walter Henry Medhurst,1822年-1885年),旧译麦特赫斯脱,汉名麦华陀,英国外交官员。麦华陀是英国著名传教士麦都思之子,1822年出生在荷属东印
  • 摩托化自行车摩托化自行车、或附发动机自行车,是指有发动机做为辅助动力的自行车,现在的摩托车即是从此演变而来。摩托化自行车的发动机种类非常多,从二冲程引擎、四冲程引擎、电动机甚至蒸
  • 刘永春刘永春(?-1926年),清末民初京剧花脸演员,北京大兴人。字鉴衡。工铜锤花脸兼红净(关羽)。刘永春自幼学习唐山皮影戏,后经刘万义介绍入嵩祝成科班,改学京剧。艺成后,随四喜班演出。其嗓音
  • 快打砖块II:DOH的复仇《快打砖块Ⅱ:DOH的复仇》(日文:アルカノイド:DOHの复雠;英文:)是由太东于公元1987年发行的打砖块游戏,属《快打砖块》系列之第二代。与第一代游戏相同,玩家一样是操纵着一台名叫“沃斯”(Vaus)的太空船,以弹珠的来回敲打砖块,直到该关卡能被敲打的砖块被全数敲完,即可过关。继承第一代游戏的“打砖块”元素,第二代新增左右不同之关卡。除原有的胶囊,亦新增许多种类胶囊,也有新增砖块种类。而如同游戏标题“DOH的复仇”,最终关主DOH并非与一代的实力相比,其防御力与攻击度增强许多,考验玩家的反应度。当玩家