锐捷端口无法UP排查SOP
一、故障现象
交换机接口不UP,包含电口接口不UP和光口接口不UP,以及接口指示灯状态不一致问题。
二、组网拓扑
三、可能原因
针对光接口不UP可能的原因:
-
端口没有收光,对端模块或者光纤问题;
-
光模块异常;
-
端口异常;
-
双工速率协商问题;
-
设备芯片异常,phy芯片、MAC芯片、M0芯片挂死(该芯片只存在于7910E设备、S78设备的F系列线卡);
针对电接口不UP可能的原因:
-
网线问题;
-
端口问题;
-
双工速率协商问题;
-
设备芯片异常,比如phy芯片、MAC芯片、M0芯片挂死(该芯片只存在于7910E设备、S78设备的F系列线卡);
针对接口指示灯状态不一致可能原因:
-
盒式设备POE按钮导致接口指示灯状态不一致问题;
-
线卡版本不一致或者线卡处于生测模式;
-
设备芯片异常,比如phy芯片、MAC芯片、M0芯片挂死(该芯片只存在于7910E设备、S78设备的F系列线卡);
四、故障排查步骤
针对光接口不up排查如下:
1.检查接口收发光情况:
两端均需通过命令show int xxx tra 查看接口收发光以及电流信息是否正常OK,查看情况如下,光衰数值正常范围是-1~-14之间,具体参见光模块手册(存在收发光问题对应接口会有warning或者alarm)
如果收光太弱说明对端模块或者光纤存在问题,需要排查对端的发光情况,对端发光正常则需要更换光纤测试; 如果发光异常需要检查接口是不是被手动down了或者触发某个功能导致被disable,命令如下 show int status show int status error
2、检查接口速率协商相关:
检查是否是万兆口插千兆光模块,若是的话通常需要强制双工速率为千兆全双工,否则概率性出现单边link up或者接口不UP的现象。或者对接友商设备时,出现端口不up时,可以通过双端强制双工速率明确是否为双工速率协商问题;
3、确认是否是我司模块:
通过外观查看是否是我司光模块或者通过命令show int xxx tra manu查看Vendor Name是否是RUIJIE,若非我司模块不保证使用效果,需要更换为我司模块
4、确认是否是M0芯片挂死问题:
M0芯片只存在于S7910E设备、S78设备的F系列线卡如FB线卡,M0芯片挂死的原因一般是接口存在频繁震荡导致,可通过命令show int link-state-change statistics 先查看是否有某些接口震荡次数很频繁
然后进入底层进一步确认,如下
run-system-shell
lc xxx //xx代表线卡槽位号
debug-ssa
m0 status
进入线卡确认线卡的m0芯片挂死,not running代表挂死
若命中此M0芯片挂死问题,临时规避方案可以拔插对应线卡或者整机重启,彻底解决方案升级对应解决版本:S7900_RGOS12.5(4)B0501、S7800C_RGOS12.5(4)B0201;
5、接口替换测试:
通过替换端口测试快速判断是不是端口问题,若发现只有如果连续4个或者8个端口都存在问题,可以初步判断是设备phy芯片问题,确认方式如下(封shell以及10.X老版本信息收集参照速查信息收集):
run-system-shell
lc xxx 线卡槽位号
debug-ssa
phy all
6、检查设备phy芯片及mac芯片是否正常;(适用11x)
底层通过phy以及mac自环测试确认是否phy芯片以及MAC芯片是否存在问题
先通过以下指令明确面板端口对应底层芯片端口
run-system-shell (封shell以及10.X老版本信息收集参照速查信息收集)
lc 2-----线卡槽位号
debug-ssa 或者debug-ssa 2 命令进入线卡底层也可以
sd
ssaport ddev //lport对应设备物理实际的接口号,即对应线卡物理接口1口底层显示的为lport 1,在底层对应的名称为xe0,后续查看端口流量以及接口状态均已xe0的状态为准。
然后使用端口底层自环,底层自环是否能够亮
在模式置位phy时,ps查看是否交换机端口是否会亮,会亮说明phy芯片无问题
在模式置位mac时,ps查看是否交换机端口是否会亮,会亮说明mac芯片无问题
若MAC芯片与phy芯片均无异常,合理怀疑是端口RJ45的硬件问题,建议返厂维修
在模式置位none,取消端口自环
针对电接口不up排查如下:
1、确认是否是M0芯片挂死问题:
具体参考上面光接口不up排查里的M0挂死确认;
2、接口替换测试;
通过替换测试,替换网线或者终端,明确故障现象是否随着端口走;
若故障现象随着接口走,查看异常端口是否是连续4个接口或者连续8个接口出现异常,若是,可能是phy芯片出现异常,可以通过底层phy自环测试明确,phy自环方式参考上面光接口不up排查里的phy自环测试;
3、检查双工速率协商相关:
可能存在网络质量问题或者设备网卡限制,无法通过自协商完成双工速率的协商,可以通过强制百兆全双工以及强制千兆全双工明确;
针对接口指示灯状态不一致排查如下:
1、明确是否POE按钮导致;
明确一下设备是否为盒式POE交换机,若为盒式POE交换机,可能按了POE按钮使得只有正在供电的接口亮灯,可以让客户长按2秒以上POE按钮,切换回显示数据传输的模式, 即可让传输速率的接口亮灯;
2、确认是否是M0芯片挂死问题:
具体参考上面光接口不up排查里的M0挂死确认;
3、检查线卡与引擎卡版本是否一致;
线卡版本与引擎卡不一致会导致对应底层端口进程无法正确将接口状态信息同步给与引擎,具体可以通过show version明确,如下是版本不一致的举例
4、检查线卡是否处于生测模式:
线卡处于生测模式正常是线卡返修之后硬件人员未将线卡调整成用户模式,具体需要使用调试线接线卡串口收集线卡启机日志,发现线卡启机日志如下即可明确处于生测模式;
命中以上问题,可以通过以下方法退出生测模式,退出后需要等待10min左右查看对应状态是否恢复。
退出生测模式方法如下:
Ctrl+c进入底层
====== BootLoader Menu("Ctrl+Z" to upper level) ======
TOP menu items.
0. Tftp utilities.
1. XModem utilities.
2. Run main.
3. SetMac utilities.
4. Scattered utilities. //间接设置 4
5. Set Module Serial
Press a key to run the command: 4
====== BootLoader Menu("Ctrl+Z" to upper level) ======
Scattered utilities.
0. Show the bootloader version.
1. Reload system.
2. Set baudrate.
3. Advanced settings. //高级选项设置
Press a key to run the command: 3
====== BootLoader Menu("Ctrl+Z" to upper level) ======
Advanced settings.
0. Set Fast boot.
1. Set Support Shell.
2. Open/Close debug switch.
3. Format flash filesystem.
4. Set default environment.
5. Set RGOS mode. //切换系统模式 5
Press a key to run the command: 5
Switch RGOS to factory mode.
Erasing Nand...
Erasing at 0x4e0000 -- 100% complete.
Writing to Nand... #done
然后按几下"Ctrl+Z"返回上一层,进行重启设备
====== BootLoader Menu("Ctrl+Z" to upper level) ======
Advanced settings.
0. Set Fast boot.
1. Set Support Shell.
2. Open/Close debug switch.
3. Format flash filesystem.
4. Set default environment.
5. Set RGOS mode.
Press a key to run the command:
====== BootLoader Menu("Ctrl+Z" to upper level) ======
Scattered utilities.
0. Show the bootloader version.
1. Reload system.
2. Set baudrate.
3. Advanced settings.
Press a key to run the command:
====== BootLoader Menu("Ctrl+Z" to upper level) ======
TOP menu items.
0. Tftp utilities.
1. XModem utilities.
2. Run main. //进行设备重启
3. SetMac utilities.
4. Scattered utilities.
5. Set Module Serial
Press a key to run the command: 2 //进行设备重启
五、故障信息收集
terminal length 0
show clock
show version
show version detail
show version slot
show run
show log
show inter status
show interface counters errors
show interface status | inc up
show interface link-state-change statistics
show interface transceiver
show interface transceiver alarm
show interface transceiver diagnosis
show interface
以下为底层接口信息收集:
10.X:
sd
su xx //机框设备切换到对应线卡,盒式设备无需执行此行
ddev //查看接口对应关系
ps // 连续3次
show c // 连续3次
phy info
phy all
11.X:
run-system-shell
lc x //机框设备切换到对应线卡,盒式设备无需执行此行
debug-ssa
ps // 连续3次
show c // 连续3次
sd
ssaport ddev //查看接口对应关系
phy info
phy all
11.X 关shell:
execute diagnose-cmd hardware <dev> <slot> me
execute diagnose-cmd hardware <dev> <slot> more /etc/version
execute diagnose-cmd hardware <dev> <slot> dir /var/tmp/coredump/ // 如果cordump目录下有文件,将文件拷贝出来
execute diagnose-cmd hardware <dev> <slot> dmesg
execute diagnose-cmd hardware <dev> <slot> more /tmp/proxy/defout/ssa_process
execute diagnose-cmd hardware <dev> <slot> more /tmp/proxy/defout/ssc_process
execute diagnose-cmd hardware <dev> <slot> more /tmp/proxy/defout/ssd_process
execute diagnose-cmd hardware <dev> <slot> ssa <unit> a
execute diagnose-cmd hardware <dev> <slot> ssa <unit> ps
execute diagnose-cmd hardware <dev> <slot> ssa <unit> phy info
execute diagnose-cmd hardware <dev> <slot> ssa <unit> phy all
execute diagnose-cmd hardware <dev> <slot> port all
execute diagnose-cmd hardware <dev> <slot> ssa <unit> show c //执行5次,间隔2秒
execute diagnose-cmd hardware <dev> <slot> ssa <unit> show int //执行3次,间隔2秒
execute diagnose-cmd hardware <dev> <slot> ssa <unit> getreg CMIC_LEDUP0_DATA_RAM
execute diagnose-cmd hardware <dev> <slot> sd ssaport
execute diagnose-cmd hardware <dev> <slot> sd ssaport ddev
12.X:
run-system-shell
lc x //机框设备切换到对应线卡,盒式设备无需执行此行
debug-ssa
ps // 连续3次
show c // 连续3次
show PortMAP //查看接口对应关系
ptd portmap
m0 status //查看M0芯片状态
phy info
phy all
12.X 关shell:
收集一键信息
terminal no length
六、总结与建议
-
端口不亮问题可通过替换测试先初步明确是否端口异常;
-
若是S7910E以及S78C产品需要重点确认是否M0挂死问题;
阅读剩余
版权声明:
作者:SE_You
链接:https://www.cnesa.cn/4062.html
文章版权归作者所有,未经允许请勿转载。
THE END