1、故障现象:

    AC上arp代理表项爆表(一个IP对应多个arp代理表项),可能会影响无线AC性能,主要是CPU和内存。

原因分析:

    比如sta1在subvlan3,sta2在subvan4,sta3在subvlan5, sta2和sta3,请求sta1,网关会代理往subvlan4和subvlan5,发送源ip为sta1的arp应答,这就会导致ac上出现多个subvlan的代理表项。

解决方案:

    集中转发:AC上关闭arp代理功能,同时AC上开启二层隔离。

    本地转发:AC和18K互联的端口进行vlan裁剪,裁剪掉本地转发的sta业务vlan。

 

2、故障现象:  

    迁移失败,上下行的的业务报文vlan不一致,用户断流。

原因分析:  

    集中转发,用户从vlan3迁移到vlan4后,18K默认进行迁移探测。往旧vlan发送源IP源mac为18K,目的IP地址为sta的arp请求报文。AC的arp代理模块回应了该报文,导致18K认为终端迁移失败。AC的业务vlan是vlan4,18K认为的vlan还是vlan3,导致报文不通。

解决方案:  

    a、18K关闭迁移检测no web-auth station-move arp-detect 、no dot1x station-move arp-detect;

    b、升级AC版本为11.1(5)B9P5或11.1(5)B9P5之后软件版本(无需关闭ARP代理,同时AC上开启二层隔离。

 

3、故障现象:    

    18K上针对无线用户配置AM规则,导致无线迁移后用户断流。

原因分析:    

    18K上针对无线用户不同的subvlan配置不通的AM规则,导致无线用户迁移后vlan和IP不匹配,报文不通。

解决方案:    

    不能对无线用户的suppervlan下的subvlan配置AM规则。


4、故障现象:    

    终端提示IP地址冲突,然后重新获取了一个新的IP地址,但是无法认证成功,用户断流。

原因分析:    

本地转发场景:

     原因一、sta1从AP3(vlan3)漫游到AP4(vlan4)后,sta2从AP3切换到AP4(非漫游),迁移成功后18K会往AP3(vlan3)发送广播免费arp通告。由于AP3上有用户漫游到AP4,会有对应的漫游表项。该广播免费arp会转发到AP4上,再由AP4发送出去。sta2收到该免费arp报文。导致sta2认为地址冲突,释放原来的IP。

     原因二、现场关闭了迁移探测功能。终端从vlan3漫游到vlan4后,AC上同步漫游表项到AP不及时。有报文从vlan4漏上去。18K认为迁移,进行广播免费arp通告机制。往vlan3发送源mac地址为18K,源IP为sta的IP1,目的mac地址为广播的免费arp报文。sta正在进行dhcp续租的过程中接受到该免费arp报文。认为IP1地址被人家占用,sta发送dhcp decline释放IP地址,然后申请了一个新的IP2。由于18K上该sta的IP1认证表项还在,导致用户重新获取IP2后不能认证,无法上网。。

解决方案:    

    a、18K上关闭广播免费arp通告机制。

    b、AC上基于wlan关闭漫游功能。同时wlansc下不能开启防地址私设和arp欺骗。同时漫游功能关闭,会加大18K的迁移并发量。

 

5、故障现象:    

    极简下无线用户正常迁移会有10s以上的断流。

原因分析:    

    1、18K迁移探测功能(默认开启,可关闭),认证模块会触发arp代理模块往sta旧vlan发送源IP源mac为18K,目的IP地址为sta的arp请求报文。每秒发送1个,默认发送5个(可通过命令调整为最少发送2个)。5个都未收到回复,则认为迁移成功。这个过程约5s钟。

    2、然后18K进行mac轮询大概3s,内核桥查询大概2s。加起来有10s以上的断流时间。

解决方案:    

    18K迁移探测功能可通过命令关闭,但是mac轮询和内核桥还是需要5s时间。