平台人生
作者平台人生·2016-12-27 09:41
软件开发工程师·平台人生

网卡绑定模式浅析与自动网卡绑定初探

字数 4188阅读 5961评论 0赞 0

作者:王彦天,张丽影
文章来自微信公众号平台人生


日常工作生产环境的x86服务器都使用了双网卡接入模式,无论是出于增加网络带宽的考虑,还是冗余,高可用的考虑,双网卡绑定都能带来非常多的裨益,双网卡即把两块网卡虚拟成为一块网卡,具有相同的IP地址,可看做一个单独的以太网接口设备。正常情况下,网卡只接收目的MAC地址是自身MAC的以太网帧。但处于绑定模式下的两个网卡运行在混杂模式下,会接受所有的以太网帧,并且将驱动程序中两块网卡的 MAC地址改成相同,可以接收特定MAC的数据帧并处理。日常工作中使用的双网卡绑定模式主要有A/S主备模式,AA静态聚合模式,AA 802.3ad动态聚合模式三种,下面详细分析一下他们的特点和适用场景。

一. 三种绑定模式浅析

(1). A/S主备模式
顾名思义,主备模式下只有一个网络设备处于活动状态,当主网卡down掉以后,备网卡会切换为主设备。此模式提供比较高的容错能力,并且mac地址在交换机等设备看来是可见并唯一的,但是资源利用率不高,也不能满足高带宽的需求。
主备模式的实现原理是将做绑定的两个slave网口的MAC地址都改为虚拟网卡的MAC地址,而虚拟网卡的MAC地址是Bond创建启动后,主网口的MAC地址。如下示意图。

而当主网卡故障时,Bond会切换到备用网口,切换过程中,上层的应用是无感知不受影响的,因为bond驱动程序会接管上层应用的数据包,缓存起来等备用网卡起来后再通过备用网卡发送出去。但是缓冲区容量有限,如果切换时间过长会造成缓冲区溢出并丢包。
主备模式的容错能力决定这种网卡绑定模式适用于对网络链路带宽不是很敏感,但是要求高冗余性的场景下,比如部署应用的机器。
(2). AA静态聚合绑定模式
AA静态聚合绑定模式,即轮询模式,做绑定的两个网卡的数据传输是按顺序进行的,第一个包走网卡一,第二个包走网卡二,第三个包走网卡三,依次类推。该模式下,由于绑定的所有网卡的IP都被修改为同一个MAC地址。此时交换机收到发往该MAC地址的数据包时,将不知道从对应的哪个端口转发该数据,为了解决交换机的这个问题,交换机应做端口绑定,将数据发往逻辑聚合端口,之后由聚合端口从多个端口转发数据。此绑定模式在比较大的网络压力下,性能提升并不会很明显,因为一个连接或者会话的数据包如果从不同的接口发出的话,中途再经过不同的链路,在客户端很有可能会出现数据包无序到达的问题,而无序到达的数据包需要重新要求被发送,这样网络的吞吐量就会下降。并且,交换机端需要设置成 Link Aggregation Group (LAG) 群組,且由于是静态设定,所有的链路都不能出错,如果出错,将会造成网络失败的情况。所以静态聚合模式虽然能够增加带宽,但是不能提供容错能力。
因此此绑定模式适用于网络压力没有那么大的场景下。日常工作中一般应用比较少,主要用在ESXI主机上,主要原因是ESXI主机对流量要求很高,但是hypervisor本身不支持LACP协议。
(3). AA动态聚合绑定模式
动态聚合绑定模式,即802.3ad 动态容错,与Windows中的SLB绑定模式基本相同,但是要求交换机必须支持802.3ad中的链路聚合控制协议(LACP),动态聚合模式能够提升网络带宽,并提供容错能力。与上面的静态AA模式不同,动态聚合模式会通过查询的方式检查是否加入了LAG组,如果加入了就开启LACP协议,如果没有加入则略过此协议。如果有连接down了,就会自动脱离LACP控制,不会影响其他的链路,因此动态聚合模式提供了较高的容错能力。同时,动态聚合模式所有流量的分发基于hash算法,理论上,不同两台PC的网络链接会通过不同的网络连线传输通讯帧,因此总带宽就增加了一倍,但是实际情况并不会有这么大的提升,但是此绑定模式还是能够带来可观的带宽提升,以及比较好的容错能力。此种绑定关系适用于高容错性,高带宽的场景下,比如部署数据库。

二. 网卡绑定的实现

(1). Linux下网卡绑定
1.在/etc/sysconfig/network-scripts/下创建网卡绑定配置文件ifcfg-bond1
其中BOOTPROTO参数值可以为dhcp,static和none。对应DHCP自动获取IP地址和分配静态IP地址,行内标准一般设置为none,分配静态IP。

ONBOOT参数值表示此虚拟设备及绑定的物理设备开机会自动启动和初始化
TYPE参数值代表网络类型,除了默认的以太网,还可能有桥接等类型
BONDING_OPTS绑定参数主要区别在于绑定模式,行内常用的三种模式为
Mode=0对应上面介绍的静态AA模式
Mode=1对应上面介绍的轮询AS模式
Mode=4对应上面介绍的动态LACP模式
Miion参数表示监视网络链接的频度,单位是毫秒,行内标准为100毫秒
Xmit_hash_policy参数定义传输帧的分发策略,值为layer3+4可以形成一个个端口到端口的流,负载更加均衡.仅在LACP模式时需要配置
2.在/etc/sysconfig/network-scripts/下修改对应网卡的配置文件
把跟虚拟绑定组对应的网卡参数修改如下

  1. 修改/etc/modprobe.d/bonding
    添加alias bond0 bonding
    声明bond0设备使用bonding驱动配置
  2. 重启网络服务生效
    (2). Windows下网卡绑定
    Windows下的网卡绑定方法与Linux下大同小异,日常工作中主要使用的Intel网卡和Marvell的网卡都提供了图形化工具用于双网卡绑定配置。
  3. 创建网卡组
  4. 选择绑定模式
    适配器容错即AS主备绑定模式,通过主备适配器的切换来提供冗余
    静态链接聚合即AA静态聚合模式
    IEEE 802.3ad即LACP动态聚合模式
  5. 对网卡组配置IP等参数
    三.自动网卡绑定探索
    日常工作中的Linux网卡绑定使用了绑定脚本,根据不同的生产用途自动写入参数,但是绑定为网卡组的网卡编号需要手动选择,而网卡编号会根据机型网卡型号,插槽,操作系统版本,内核识别顺序的不同而不同,比如机型A可能是eth0和eth2绑定为bond0.而机型B可能是eth1和eth3绑定为bond0。起初我们的想法是记录下常用机型的网卡绑定对应关系,Linux操作系统安装时读取记录好的配置文件,对应机型找到绑定关系。但是在实际操作过程中发现不同的两台主机,即使是相同机型同一位置的网卡也会因为识别顺序的问题造成编号的不同。给网卡绑定带来麻烦。
    另外一台主机如果因为网卡故障原因更换了网卡,此网卡在操作系统中的识别序号往往也会与原来不一样,给网络配置和日常运维带来麻烦,因此,为了解决以上两个问题,引用了udev的相关功能。
    四.udev绑定及其在自动网卡绑定中的应用
    (1). UDEV介绍
    udev是Linux2.6 内核里的一个功能,它替代了原来的devfs,成为当前Linux默认的设备管理工具。udev以守护进程的形式运行,通过侦听内核发出来的uevent来管理/dev目录下的设备文件。
    udev可以通过自定义的规则文件,灵活的产生标识性强的设备文件名,比如/dev/boot_disk、/dev/root_disk等,以及按一定的条件来设置设备文件的权限和设备文件所有者/组。
    (2). UDEV的简单规则
    生产环境下默认产生网卡设备文件的规则如下:
    SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?", ATTR{address}=="e8:39:35:0e:dd:ee", ATTR{type}=="1", KERNEL=="eth", NAME="eth0"
    这条规则中SUBSYSTEM、ACTION、DRIVERS、ATTR{address}、ATTR{type}、KERNEL都是匹配键,即这条规则成立的条件,NAME则是赋值键,即匹配规则成立之后产生的结果。
    该规则表示:如果存在设备的子系统为net,并且MAC地址为" e8:39:35:0e:dd:ee ",为该设备产生一个名为eth0的设备文件。
    正如上文所述,这种规则存在问题,就是当网卡故障需要更换的时候,由于网卡的MAC地址发生改变,可能会出现网卡无法识别的问题,但如果将/etc/udev/rules.d/70-persistent-net.rules的匹配信息由网卡的MAC地址改为网卡对应PCI的bus id,而主机的PCI的bus id由主机的型号决定,不会因为故障更换硬件而改变,所以不存在网卡或PCI主板更换就匹配不了规则的情况。
    首先,需要通过lspci–m –D | grep–iethernet查找到PCI的bus id,其中ethernet代表网卡设备。

    上面查询结果中的第一列就是主机PCI的bus id。
    然后,修改70-persistent-net.rules的内容,本文为了让大家能够明显看出使用新的规则以后发生的变化,会将网卡名改为test0和test1,此规则修改如下:

    上面这个规则里使用了一个KERNELS参数,在这里表示网卡的某些父设备的名称,udev会沿着网卡的在/sys空间中绝对路径查找父设备的名称,直到匹配到KERNELS设置的设备名称。而主机PCI的bus id就是网卡的上一级的父设备名称,也就相当于以主机PCI的bus id作为匹配条件。
    修改完规则以后需要重启主机,再用ifconfig–a命令查看就可以看到新规则下的网卡名了,同时会在/sys/class/net/目录下生成两个新的设备文件。下面是使用新规则前后ifconfig–a和/sys/class/net/目录的结果对比:
    使用前:


    使用后:


    (3). 实际应用
    首先收集常见机型的bus id与eth网卡编号的对应关系,之后编写出对应机型的70-persistent-net.rules规则,然后在操作系统初始配置阶段写入到系统的rules文件中。如此网卡序号就和卡槽位置绑定,解决了机器网卡更换后网卡序号改变的问题。另外,因为卡槽位置与网卡序号绑定,所以同一机型组成bond0,bond1网卡组的网卡序号可以确定。绑定过程不需要再人工识别,可以根据之前的记录自动绑定,提高操作系统部署的速度,减少出错。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

作者其他文章

相关问题

X社区推广