不太好解决的 TCP 断流问题

2025 年 2 月 7 日
 tool2dx
这几天想先把网络问题解决了,现象是持续 10 分钟 TCP 后,会无响应 10 秒左右,然后恢复正常。我一般用屏幕串流软件,断流会有比较大的影响。

在 google 上搜,找 github moonlight 的 issues ,有人说是 wifi 驱动问题,随即各种修改驱动参数并测试,发现无效。我还天真以为是运营商 QoS 的锅。

然后某天无意间停电,发现网络竟然好了。于是怀疑到小米路由器上,又 ssh 上去后一通修改,并什么都没用,过了两天又开始断流。

这次断流重启小米路由器没有用,重启了一次电信光猫,竟然恢复正常了。

实在是大无语,真的是万能的重启。
3399 次点击
所在节点    宽带症候群
14 条回复
ldapadmin
2025 年 2 月 7 日
换一个好一点的光猫吧
zwy100e72
2025 年 2 月 7 日
/go/bb

我如果遇到这种问题,会拿出 wireshark 来分析 tcp 流量,找到中断的原因;
或者同时用 ping 工具看下 icmp 延迟是不是会突然增大
确保两边都用全有线链路连接,因为无线变数比较大且容易被干扰
有条件的话更换路由器 / ONU (光猫)设备再试

做完检测之后应该也就有对策了,实在不行或者没时间调试再重启,有更好办法的话就不需要重启光猫了
tool2dx
2025 年 2 月 7 日
@zwy100e72 我用 frp 的 kcp 模式,udp 下似乎也会断开,貌似是收到了 RST 之类的包。

问题的关键,是复现概率并不高。重启一次后,需要等上 2 ~ 3 天才能触发。

有时候重启路由就恢复了,有时候重启光猫才行,实在是心累。电信光猫也的确很老了,也许内部原件会老化。
tool2dx
2025 年 2 月 7 日
@zwy100e72 我这号被降权了,发普通节点没人能看到,只能发程序员,尴尬。
minami
2025 年 2 月 7 日
@tool2dx #3 怀疑是光猫问题可以直接让师傅上门测光衰
tool2dx
2025 年 2 月 7 日
@minami 以前电信师傅来测过,貌似不是光衰原因。

下次再出问题,先抓包,再换散热,最后换电源适配器。估计大概率还是会换光猫。
minami
2025 年 2 月 7 日
@tool2dx 没光衰的话感觉没理由再怀疑光猫了啊,还是先换路由看看
tool2dx
2025 年 2 月 7 日
@minami 重启了几次路由都无效,后来重启一次光猫就解决问题了,于是光猫嫌疑最大。

可能是电子元件寿命到了,这光猫很老了。以前我也不觉得 CPU 这东西会用坏,直到遇到了一次后。
xiyuesaves
2025 年 2 月 7 日
有可能是公网的问题,我这边因为一个用户的设备感染了病毒导致片区内三个其他用户的网络出现了随机性断网的问题
tool2dx
2025 年 2 月 7 日
@xiyuesaves 确实是 ip6 公网出的问题,还跨了运营商,中间的幺蛾子太多了。

刚又出问题了,用抓包软件看不出什么异常,仅仅是不回复 IP 包。我正在写代码测试 TCP 长连接断线的时间规律,从 5 分钟到 10 分钟不等,真是心累。
zealot0630
2025 年 2 月 7 日
换桥接模式,多半是光猫 NAT 性能不够。
c398425861
2025 年 2 月 7 日
ipv6 试一下调小 MTU 看看
htfcuddles
2025 年 2 月 7 日
只有 ipv6 出问题的话可能是 PTMU 黑洞,中途设备 MTU 过小
tool2dx
2025 年 2 月 10 日
查了很多,有用 frp 进行端口映射,很容易就遇到 TCP 断开。

查到 lsof 打开的文件句柄数(没问题),进程占用内存查询 cat proc/pid/status(没问题), openwrt 系统异常 dmsg oom(没问题)

最后换了网线(怀疑水晶头),固定了路由器的 wan 口指定,不用自动 wan 口选择(怀疑固件 BUG )

暂时修复了,持续观测中。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1109516

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX