0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于VFIO的详细研究解析

Linux阅码场 来源:博客园 作者:EwanHai 2021-05-02 11:20 次阅读

主要研究VFIO在虚拟化中的应用,但VFIO的应用不止于虚拟化。

VFIO的全称是Virtual Function IO,但这个名字并不能反应它的特点,以下两个假名字更能反应VFIO的特点:

Very Fast IO

由于VFIO是将设备直接透传给虚拟机,所以Guest中与该设备相关的IO性能会大幅提高,接近native性能。

Versatile Framework for userspace IO

这个名字反映了VFIO的功能,即能够将device安全地映射到用户空间,使用户能够对device进行操作。

研究目的

研究利用-device vfio-pci的方式将PCI透传到虚拟机中后,在虚拟机中访问PCI设备的配置空间,MMIO寄存器,IO Port的流程是怎样的。

VFIO原理

VFIO把设备通过IOMMU映射的DMA物理内存地址映射到用户态中,让用户态程序可以自行操纵数据的传输,还可以自行注册中断处理函数,从而在用户态下实现设备的驱动程序。

因此VFIO的基础是IOMMU.

IOMMU

基础功能

地址翻译

IOMMU可以将能直接访问memory的IO总线(DMA–capable)连接到RAM中。

与传统的MMU功能类似,MMU能将CPU使用的虚拟地址转化为物理地址,而IOMMU能将device使用的虚拟地址(也称为设备地址或者IO地址)转化为物理地址。

如果没有IOMMU,DMA也能直接访问RAM中的内容,但是让DMA没有限制地访问RAM是一件很危险的事情,而IOMMU能够对这个过程加以限制,当DMA访问的地址合法时,IOMMU才返回正确的数据。

硬件中断重映射

除了翻译地址的功能,IOMMU还能对硬件中断进行重映射,达到屏蔽部分中断,或自定义中断处理函数的目的。

设备隔离

基于地址翻译和硬件中断重映射两大功能,IOMMU就具有了隔离设备的能力,这提高了设备访问RAM时和设备发出中断时的安全性。

除了将单个设备隔离的功能外,IOMMU还能隔离一组设备,如隔离PCI桥上的几个设备,所以IOMMU还有一个概念,叫做IOMMU_GROUP, 代表一组被隔离的设备的集合。

通过把host的device和对应driver解绑,然后绑定在VFIO的driver上,就会在/dev/vfio/目录下出现一个group,这个group就是IOMMU_GROUP号,如果需要在该group上使用VFIO,需要将该group下的所有device与其对应的驱动解绑。

VFIO Container

在IOMMU_GROUP的基础上,VFIO封装了一层Container Class,Container的作用是,当我们想在不同的IOMMU_GROUP之间共享TLB和page tables(用于地址翻译的页表)时,就将这些group放到同一个container中,因此Container可以看做是IOMMU_GROUP的集合。

虚拟化中VFIO的应用

这里演示一个将网卡设备利用VFIO透传到虚拟机中的例子。需要注意的是,利用VFIO将PCI设备透传到虚拟机之后,Host将无法使用该设备。

虚拟机默认网卡

首先利用默认qemu选项启动虚拟机后,查看lspci的输出,看看虚拟机默认使用的网卡是什么?

11c76f90-9e23-11eb-8b86-12bb97331649.png

可以看到虚拟机默认的网卡是Intel的82540EM,是由Qemu-kvm软件模拟出来的一款网卡。

将Host的PCI网卡透传到虚拟机

首先在Host上使用lspci查看拥有的PCI网卡型号,可以看到Realtek的一款网卡,该网卡的PCI标记为06:00.0.

11d31ac0-9e23-11eb-8b86-12bb97331649.png

要使用VFIO,必须在Linux启动时添加启动项intel_iommu=on,因为VFIO的底层依赖IOMMU.

加载VFIO-PCI module

sudo modprobe vfio-pci

如果加载成功,可以在dmesg中看到相关log.

11ff38da-9e23-11eb-8b86-12bb97331649.png

查看网卡所在的IOMMU Group

$ readlink /sys/bus/pci/devices/000000.0/iommu_group.。/.。/.。/.。/kernel/iommu_groups/3

可以看到该Realtek网卡位于iommu_group的group3.

查看设备所在iommu_group的所有设备

$ ls /sys/bus/pci/devices/000000.0/iommu_group/devices/000005.0 000005.1 000000.0

可以看到在iommu_group3中,除了该Realtek网卡,还有2个设备。

将设备与对应的驱动解绑

为了将设备透传到虚拟机中,需要将设备与其对应的驱动解绑,这样该设备就可以使用VFIO的驱动了。注意,不仅要将要透传的设备解绑,还要将与设备同iommu_group的设备都解绑,才能透传成功。

$ echo 000000.0 | sudo tee /sys/bus/pci/devices/000000.0/driver/unbind000000.0$ echo 000005.0 | sudo tee /sys/bus/pci/devices/000005.0/driver/unbind000005.0 $ echo 000005.1 sudo tee /sys/bus/pci/devices/000005.1/driver/unbind000005.1

查看设备的Vendor和DeviceID

$ lspci -n -s 06:00.0 06:00.0 0200: 10ec:8168 (rev 15)

可以看到该Realtek网卡的Vendor为10ec,DeviceID为8168.

将设备绑定到vfio-pci module

$ echo 10ec 8168 | sudo tee /sys/bus/pci/drivers/vfio-pci/new_id10ec 8168

可以通过ls /dev/vfio查看是否绑定成功,如果绑定成功,/dev/vfio目录下会出现该device所属的iommu_group号。

121b8a6c-9e23-11eb-8b86-12bb97331649.png

这里的3就是我们要透传的Realtek网卡所在的iommu_group号。

启动虚拟机

$ sudo x86_64-softmmu/qemu-system-x86_64 -m 4096 -smp 4 -hda ~/ewan/Workspace/img/Ubuntu18.04_loop.img-enable-kvm -cpu host -device vfio-pci,host=06:00.0

这里我使用的是从源码编译的qemu,但是从apt-get安装的的qemu也是可以的。

进入guest之后运行lspci,可以看到相比之前的PCI设备,多了一个Realtek网卡,这个网卡和host上的信息一模一样,证明将网卡透传到Guest成功!。

1224b880-9e23-11eb-8b86-12bb97331649.png

编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dma
    dma
    +关注

    关注

    3

    文章

    561

    浏览量

    100555
  • 虚拟机
    +关注

    关注

    1

    文章

    914

    浏览量

    28163
  • guest
    +关注

    关注

    0

    文章

    3

    浏览量

    3244

原文标题:VFIO(Virtual Function IO)研究

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    衍射级次偏振态的研究

    分析提供了通用和方便的工具。为此,复杂的一维或二维周期结构可以使用界面和调制介质进行配置,这允许任何类型的光栅形貌进行自由的配置。在此用例中,详细讨论了衍射级次的偏振态的研究。 任务说明 简要介绍
    发表于 12-18 13:45

    4G模组Air780E的LuatOS开发之位运算(bit)示例

    本文我要说的是低功耗4G模组Air780E的LuatOS开发,关于位运算(bit)示例,我将详细解析分享给大家。
    的头像 发表于 12-02 14:33 164次阅读
    4G模组Air780E的LuatOS开发之位运算(bit)示例

    深度解析 4G模组GPIO编程技巧篇

    本文将解析4G模组GPIO编程技巧,从概述、软硬件环境准备、示例等详细道来:
    的头像 发表于 11-20 23:08 171次阅读
    深度<b class='flag-5'>解析</b>  4G模组GPIO编程技巧篇

    TSMI252012PMX-3R3MT功率电感详细解析

    TSMI252012PMX-3R3MT功率电感详细解析 一、引言 在现代电子设备的不断小型化和高性能化的趋势下,功率电感作为电路中的关键元件,其性能的好坏直接影响到整个电路的稳定性和效率
    的头像 发表于 11-04 17:57 265次阅读
    TSMI252012PMX-3R3MT功率电感<b class='flag-5'>详细</b><b class='flag-5'>解析</b>

    TSMI252012PMX-R47MT贴片功率电感详细解析

    TSMI252012PMX-R47MT贴片功率电感详细解析 一、引言 在现代电子技术的迅猛发展背景下,电感器作为电路系统中的核心元件,其性能的稳定性和可靠性对于整个电路的运行至关重要。由深圳市时源芯
    的头像 发表于 11-04 17:05 204次阅读
    TSMI252012PMX-R47MT贴片功率电感<b class='flag-5'>详细</b><b class='flag-5'>解析</b>

    ZCAN PRO解析的DBC Singal 起始位与XNET解析的起始位不同;解析的信号不符合大端逻辑

    上图中的DBC文件使用记事本打开,Data_Field信号,起始位为23,长度为48,大端方式存储;(按照这个方式存储,明显已经溢出) 上图为该信号在ZCANPRO软件中打开,解析的起始位为23
    发表于 10-18 13:53

    电源常用ic脚位解析方法 7脚电源芯片怎么看型号

    详细的数据手册,其中包含了引脚功能、电气特性、应用电路等关键信息。这是解析IC脚位最直接、最准确的方法。 识别引脚编号 : 大多数IC都会在其封装上标注引脚编号,这些编号通常按照一定的顺序排列,如顺时针或逆时针。识别引脚编号是解
    的头像 发表于 10-07 17:10 1874次阅读

    薄膜发电技术到底是什么_薄膜发电最忌三种东西

    薄膜发电技术是一种先进的能源转换技术,它主要依靠具有轻、薄、柔特点的薄膜太阳能电池芯片来提供清洁电力。以下是关于薄膜发电技术的详细解析
    的头像 发表于 10-03 16:26 432次阅读

    自动售货机MDB协议中文解析(七)MDB-RS232控制纸币器的详细流程和解析

    自动售货机MDB协议中文解析(七)MDB-RS232控制纸币器的详细流程和解析
    的头像 发表于 09-09 10:04 553次阅读

    深度神经网络(DNN)架构解析与优化策略

    堆叠多个隐藏层,逐步提取和转化输入数据的特征,最终实现复杂的预测和分类任务。本文将对DNN的架构进行详细解析,并探讨其优化策略,以期为相关研究和应用提供参考。
    的头像 发表于 07-09 11:00 1804次阅读

    频率特性测试仪的详细解析

    将对频率特性测试仪进行全面详细解析,包括其定义、工作原理、应用领域、类型以及特点等方面,以期为读者提供全面的了解和认识。
    的头像 发表于 05-21 17:59 1411次阅读

    波形发生器的详细解析

    在电子工程、通信、教育与研究等多个领域中,波形发生器都扮演着不可或缺的角色。它作为一种重要的电子测试设备,可以产生各种类型、频率、幅度和相位的电子信号,为各种电子设备和系统的测试、测量、校准和研究
    的头像 发表于 05-15 14:39 1366次阅读

    蓄电池内阻测试仪的详细解析

    设备,能够快速准确地测量蓄电池的健康状态和荷电状态,为蓄电池的维护和管理提供了有力的支持。本文将对蓄电池内阻测试仪的原理、功能、使用方法、应用场景以及优缺点进行详细解析
    的头像 发表于 05-14 17:15 1197次阅读

    求助,关于串口数据解析疑问求解

    现在手上有一个串口模块要开发,比较复杂, 功能:接收各种类型不定长度的 字符串,然后解析做出反馈 字符串基本规格: 单条命令 : CMD(X,Y,\'ABC或者中文字符不定长\',W
    发表于 04-29 06:34

    详细解析二相电机反转的改变方法

    详细解析二相电机反转的改变方法  二相电机反转是指通过改变电机的工作方式和接线方式来改变电机的旋转方向。以下是对二相电机反转的改变方法的详细解析。 首先,要了解二相电机的工作原理。二相
    的头像 发表于 01-23 14:45 2697次阅读