BPF

✍ dations ◷ 2025-01-07 22:32:41 #BPF

伯克利包过滤器(Berkeley Packet Filter,缩写 BPF),是类Unix系统上数据链路层的一种原始接口,提供原始链路层封包的收发。除此之外,如果网卡驱动支持混杂模式,那么它可以让网卡处于此种模式,这样可以收到网络上的所有包,不管他们的目的地是不是所在主机。

另外,BPF支持过滤数据包——用户态的进程可以提供一个过滤程序来声明它想收到哪些数据包。通过这种过滤可以避免从操作系统内核向用户态复制其他对用户态程序无用的数据包,从而极大地提高性能。

BPF有时也只表示过滤机制,而不是整个接口。一些系统,比如Linux和Tru64 Unix,提供了数据链路层的原始接口,而不是BPF的接口,但使用了BPF的过滤机制。

BSD 内核实现例程如 bpf_mtap()bpf_tap(),以BPF_MTAP()BPF_TAP()等宏定义的形式进行包裹由网卡驱动(以及伪驱动pseudo-drivers) 向BPF机制发送进出的封包。

原始的论文由Steven McCanne 和 Van Jacobson于1992年在劳伦斯伯克利国家实验室工作时编写,于1993年在San Diego举办的USENIX冬季会议上正式发表。

许多版本的Unix操作系统提供了用于捕获数据包的设施,使得监控当前网络情况成为了可能。但是,因为网络监控程序运行在用户态,数据包必须被拷贝来通过内核与用户态之间的边界。可以通过使用一种被称为“数据包过滤器”的内核代理来减少拷贝的数量,它会尽量早地丢弃不想要的数据包。早先的数据包过滤器被实现为基于栈的虚拟机,在RISC CPU上性能不佳。BPF使用了一种新的基于寄存器(Register)的虚拟机,在性能上有显著提升。

BPF的过滤功能是以对于BPF虚拟机机器语言的一种解释器的形式实现的,使用这种语言编写的程序可以抓取数据包,对数据包中的数据采取算术操作,并将结果与常量或数据包中的数据或结果中的测试位比较,根据比较的结果决定接受还是拒绝封包。

传统的Unix BPF实现能够被用于用户态,尽管它是为内核态编写。这是通过编译时的条件预处理完成的。

一些项目使用了不同以往的BPF指令集或者执行方法。

包括FreeBSD和WinPcap在内的一些平台,使用即时编译(JIT)编译器来把BPF指令转换为原始字节码,以进一步提高性能。Linux有一个BPF JIT编译器,但被默认禁用。

此虚拟机语言的内核态解释器则被用于其他操作系统的原始数据链路机制,例如Tru64 Unix系统,以及Linux内核中的套接字过滤器,和WinPcap数据包抓取机制。

用户态解释器由实现了pcap API的libpcap/WinPcap提供,因此,在对此过滤机制没有内核态支持的系统上抓取数据包时,数据包可以在内核态过滤,使用pcap API的代码可以工作于此两种模式;在使用用户态过滤的系统上,所有数据包由内核态复制到用户态,包括将被过滤出去的封包。这种解释器也可以用于包含由pcap抓取的封包的文件。

2007年,Robert Watson(英语:Robert Watson (computer scientist))与Christian Peron为FreeBSD操作系统中BPF的实现加入了zero-copy buffer extension,使得驱动程序中断处理器中的内核封包抓取能直接向用户内存写,以避免BPF设备收到的所有封包数据的两次复制需要,一份副本存在于用户进程的接收路径中,这保证了不同BPF设备调用者的独立性,同时使得只把封包头部放入BPF缓冲区,而不是复制整个封包数据。

Will Drewry为seccomp(安全计算)系统调用策略添加了BPF过滤器,这也是BPF第一次在网络领域之外的使用。

从3.18版本开始,Linux 内核提供了一种扩展的BPF虚拟机,被称为“extended BPF”,简称为eBPF。它能够被用于非网络相关的功能,比如附在不同的tracepoints上,从而获取当前内核运行的许多信息。

传统的BPF,现在被称为cBPF(classical BPF)。

eBPF由Alexei Starovoitov在PluMgrid工作时设计,这家公司专注于研究新的方法来设计软件定义网络解决方案。在它只是一个提议时,Daniel Borkmann——Red Hat公司的内核工程师,帮助修改使得它能够进入内核代码并完全替代已有的BPF实现。这是二十年来BPF首次主要的更新,使得BPF成为了一个通用的虚拟机。

eBPF被Linux内核合并的事件线如下:

因为eBPF虚拟机使用的是类似于汇编语言的指令,对于程序编写来说直接使用难度非常大。和将C语言生成汇编语言类似,现在的编译器正在逐步完善从更高级的语言生成BPF虚拟机使用的指令。LLVM在3.7版本开始支持BPF作为后端输出。GCC 10也将会支持BPF作为后端。BCC是IOVisor项目下的编译器工具集,用于创建内核跟踪(tracing)工具。bpftrace是为eBPF设计的高级跟踪语言,在Linux内核(4.x)中提供。

eBPF现在被应用于网络、跟踪、内核优化、硬件建模等领域。

Spectre攻击可以利用Linux内核的eBPF JIT编译器来从其它内核进程提取信息。

相关

  • 麦地那麦地那(阿拉伯语:المدينة المنورة‎ al-Madīnah al-Munawwarah,意谓“光芒四射的城市”)原名雅特里布,伊斯兰教第二大圣城,后又称圣城(مَـديـنـة الـن
  • 碧山岩开漳圣王庙碧山岩开漳圣王庙位于台湾台北市内湖区碧山路24号碧山之尖峰,也称“尖顶开漳圣王庙”。是台湾最大的开漳圣王庙之一,亦是内湖大庙。香火鼎盛。庙内主祀开发漳州的唐代民族英雄
  • 格林尼治半岛坐标:51°29′53″N 0°00′23″E / 51.498131°N 0.006317°E / 51.498131; 0.006317格林威治半岛(Greenwich Peninsula)是英格兰伦敦东南部的一个地区,位于皇家格林威治伦敦自
  • 鸦片类药物泛滥鸦片类药物泛滥(The opioid epidemic)指2010年代美国和加拿大对经处方和非经处方的鸦片类药物的使用急剧上升所造成的健康灾难。鸦片类药物除了吗啡和海洛因外,也包括羟二氢可
  • 赤卫队区 (圣彼得堡)坐标:59°58′N 30°28′E / 59.967°N 30.467°E / 59.967; 30.467赤卫队区(俄语:Красногварде́йский райо́н,罗马化:Krasnogvardeysky rayon)是俄罗斯
  • 微生姓微生姓是汉字复姓之一,在明朝《百家姓续编》中排第469位。在现代是极罕见的姓氏。微生姓出自姬姓,是鲁国公族后代。《路史》中载:春秋时鲁国有公族微生氏。鲁郡:三国曹魏及晋朝
  • 颜兰权颜兰权(1963年-),台湾纪录片导演,东吴大学哲学系和社会学系本科毕业,英国雪菲尔大学剧情片电影、电视制作硕士毕业。1999年入行拍摄纪录片,代表作品《七日狂想》、《牵阮的手》、《
  • 1040阳光工程1040阳光工程又名1040工程、纯资本运作、自愿连锁经营业、民间互助理财、虚拟经济、商务商会运作、亮点经济、经济邪教、民间资本重新分配等,是中国内地一个层压式推销骗局,1998年起源于广东佛山和广西来宾,2007年蔓延到广西北海市,及后扩展至全国超过20个省,包括广东、山西、广西、四川、贵阳、武汉、南昌、云南、重庆等。* 类似典型金字塔式庞氏骗局,但1040阳光工程是等腰梯形,最顶层会因“出局制”离开根据《中华人民共和国刑法》224条,传销活动在内地是违法行为,如果诱使他人参与,要负刑责:“如果引诱或者
  • 东急多摩川线 */?)是一条连结多摩川站与蒲田站、由东急电铁(东急)运营的铁路线。全线位于东京都大田区内。线路图与车站编号使用的线路颜色为紫色,线路记号为TM。与池上线共通运用。截至2015年9月30日使用车辆如下。为了田园调布开发而设立的目黑蒲田电铁的最初开业的路线部分,也是东急电铁的起源。※仅记录了多摩川 - 蒲田间的车站的新建、废弃、改称。另请参照分割前的东急目蒲线。
  • 日本最高电影票房收入列表下列为电影作品在日本电影院上映的票房收入相关列表。配给收入(发行收入)是指发行商从电影院兴行收入(票房收入)中所得到的收入,基本占到兴行收入的50-60%。1999年以前,日本电影票房公开的是配给收入。粗体字为历代票房纪录。