BPF

✍ dations ◷ 2025-12-10 16:42:52 #BPF

伯克利包过滤器(Berkeley Packet Filter,缩写 BPF),是类Unix系统上数据链路层的一种原始接口,提供原始链路层封包的收发。除此之外,如果网卡驱动支持混杂模式,那么它可以让网卡处于此种模式,这样可以收到网络上的所有包,不管他们的目的地是不是所在主机。

另外,BPF支持过滤数据包——用户态的进程可以提供一个过滤程序来声明它想收到哪些数据包。通过这种过滤可以避免从操作系统内核向用户态复制其他对用户态程序无用的数据包,从而极大地提高性能。

BPF有时也只表示过滤机制,而不是整个接口。一些系统,比如Linux和Tru64 Unix,提供了数据链路层的原始接口,而不是BPF的接口,但使用了BPF的过滤机制。

BSD 内核实现例程如 bpf_mtap()bpf_tap(),以BPF_MTAP()BPF_TAP()等宏定义的形式进行包裹由网卡驱动(以及伪驱动pseudo-drivers) 向BPF机制发送进出的封包。

原始的论文由Steven McCanne 和 Van Jacobson于1992年在劳伦斯伯克利国家实验室工作时编写,于1993年在San Diego举办的USENIX冬季会议上正式发表。

许多版本的Unix操作系统提供了用于捕获数据包的设施,使得监控当前网络情况成为了可能。但是,因为网络监控程序运行在用户态,数据包必须被拷贝来通过内核与用户态之间的边界。可以通过使用一种被称为“数据包过滤器”的内核代理来减少拷贝的数量,它会尽量早地丢弃不想要的数据包。早先的数据包过滤器被实现为基于栈的虚拟机,在RISC CPU上性能不佳。BPF使用了一种新的基于寄存器(Register)的虚拟机,在性能上有显著提升。

BPF的过滤功能是以对于BPF虚拟机机器语言的一种解释器的形式实现的,使用这种语言编写的程序可以抓取数据包,对数据包中的数据采取算术操作,并将结果与常量或数据包中的数据或结果中的测试位比较,根据比较的结果决定接受还是拒绝封包。

传统的Unix BPF实现能够被用于用户态,尽管它是为内核态编写。这是通过编译时的条件预处理完成的。

一些项目使用了不同以往的BPF指令集或者执行方法。

包括FreeBSD和WinPcap在内的一些平台,使用即时编译(JIT)编译器来把BPF指令转换为原始字节码,以进一步提高性能。Linux有一个BPF JIT编译器,但被默认禁用。

此虚拟机语言的内核态解释器则被用于其他操作系统的原始数据链路机制,例如Tru64 Unix系统,以及Linux内核中的套接字过滤器,和WinPcap数据包抓取机制。

用户态解释器由实现了pcap API的libpcap/WinPcap提供,因此,在对此过滤机制没有内核态支持的系统上抓取数据包时,数据包可以在内核态过滤,使用pcap API的代码可以工作于此两种模式;在使用用户态过滤的系统上,所有数据包由内核态复制到用户态,包括将被过滤出去的封包。这种解释器也可以用于包含由pcap抓取的封包的文件。

2007年,Robert Watson(英语:Robert Watson (computer scientist))与Christian Peron为FreeBSD操作系统中BPF的实现加入了zero-copy buffer extension,使得驱动程序中断处理器中的内核封包抓取能直接向用户内存写,以避免BPF设备收到的所有封包数据的两次复制需要,一份副本存在于用户进程的接收路径中,这保证了不同BPF设备调用者的独立性,同时使得只把封包头部放入BPF缓冲区,而不是复制整个封包数据。

Will Drewry为seccomp(安全计算)系统调用策略添加了BPF过滤器,这也是BPF第一次在网络领域之外的使用。

从3.18版本开始,Linux 内核提供了一种扩展的BPF虚拟机,被称为“extended BPF”,简称为eBPF。它能够被用于非网络相关的功能,比如附在不同的tracepoints上,从而获取当前内核运行的许多信息。

传统的BPF,现在被称为cBPF(classical BPF)。

eBPF由Alexei Starovoitov在PluMgrid工作时设计,这家公司专注于研究新的方法来设计软件定义网络解决方案。在它只是一个提议时,Daniel Borkmann——Red Hat公司的内核工程师,帮助修改使得它能够进入内核代码并完全替代已有的BPF实现。这是二十年来BPF首次主要的更新,使得BPF成为了一个通用的虚拟机。

eBPF被Linux内核合并的事件线如下:

因为eBPF虚拟机使用的是类似于汇编语言的指令,对于程序编写来说直接使用难度非常大。和将C语言生成汇编语言类似,现在的编译器正在逐步完善从更高级的语言生成BPF虚拟机使用的指令。LLVM在3.7版本开始支持BPF作为后端输出。GCC 10也将会支持BPF作为后端。BCC是IOVisor项目下的编译器工具集,用于创建内核跟踪(tracing)工具。bpftrace是为eBPF设计的高级跟踪语言,在Linux内核(4.x)中提供。

eBPF现在被应用于网络、跟踪、内核优化、硬件建模等领域。

Spectre攻击可以利用Linux内核的eBPF JIT编译器来从其它内核进程提取信息。

相关

  • 白体卵巢白体(corpus albicans, atretic corpus luteum, corpus candicans, or simply as albicans)是卵巢黄体的回归形式。当巨噬细胞破坏黄体后,纤维原细胞产生胶原蛋白,并形成卵
  • 麦角二乙胺麦角酸二乙酰胺(Lysergic acid diethylamide,德文 Lyserg-Säure-Diäthylamid),常简称为LSD,是一种强烈的半人工致幻剂。它由麦角酸中合成,对氧气、紫外线与氯十分敏感(尤其是当LS
  • 蒙古八旗蒙古八旗(满语:ᠮᠣᠩᡤᠣᡤᡡᠰᠠ,穆麟德:Monggo gūsa,太清:Monggo gvsa),本称八旗蒙古,简称蒙古或蒙古旗。旗下之人称蒙古、蒙古旗人,是清代八旗制度中的主要组成部分,也是外八旗旗
  • 清太祖大妃孝烈武皇后乌拉那拉氏(1590年-1626年10月1日),名阿巴亥(满语:ᠠᠪᠠᡥᠠᡳ,转写:),清太祖努尔哈赤的大福晋(《清史稿》称大妃),皇太极后母。她的父亲满泰为乌拉部贝勒,故阿巴亥之母称为乌
  • 查亚科略山坐标:20°3′S 68°40′W / 20.050°S 68.667°W / -20.050; -68.667查亚科略山(Ch'alla Qullu),是南美洲的山峰,位于玻利维亚和智利接壤的边境,属于安第斯山脉中玻利维亚西部山脉
  • 全昌哲全昌哲(전창철,1905年4月10日-1982年3月11日),朝鲜政治家,延安派人,曾任职朝鲜劳动党中央委员会委员、万景台革命学院院长和朝鲜职业总同盟委员长。全昌哲出生于咸镜北道,后在中国延
  • 周罗睺周罗睺(542年-605年),字公布,南陈、隋朝将领。九江浔阳人(今江西省九江市)人。开始是南陈的军人,以战功授为开远将军、句容县令,升光远将军、钟离太守,进封始安县侯、太仆卿、豫章内史
  • 余三胜 余三胜(1802年-1866年),本名开龙,字启云,湖北罗田县人,为清中期重要的京剧演员,在清道光年间,与程长庚、张二奎齐名,被称为“老生三杰”、“三鼎甲”。余三胜早年出生于湖北的汉调
  • 旗帜学协会国际联盟旗帜学协会国际联盟(法语:Fédération internationale des associations vexillologiques,英语:International Federation of Vexillological Associations,缩写FIAV)是一个研究
  • 卡拉·博伊德卡拉·博伊德(英语:Carla Boyd,1975年10月31日-),澳大利亚女子篮球运动员。她曾代表澳大利亚国家队参加1996年和2000年夏季奥林匹克运动会篮球比赛,获得一枚银牌和一枚铜牌。