2023年3月23日木曜日

e1000eのハング

最近、急に e1000eがハングするようになった。

syslogに

e1000e 0000:00:1f.6 enp0s31f6: Detected Hardware Unit Hang:

というメッセージが出て、復旧する時もあれば復旧しないことも?

RDPセッションとかが切れるだけじゃなく、iSCSI接続も切れてしまうので、ちょっと不便。

ちょっと調べた限り、offloadエンジン関連らしい。

パッケージ/ドライバがかなり古かったので、一旦アップデートかけて様子見。(ドライバ更新で解消してるといいなぁ)

あと、まだ18.04なので、さっさと22.04までアップデートしないと。 

2023/03/28 追記

またハングした。同じ事象。

はやく22.04までアップグレードして様子見しよう。(ドライバ更新で安定するかな?)

2023/03/29 追記

どうやらTCP Segment Offload(tso)関連っぽい。

で、今はまだ ifupdown を使ってるんだけど、近いうちに netplan に変えたい。
netplan だと、0.104 から tso に関する制御オプションがついてきた様子。
https://netplan.io/reference
[tcp-segmentation-offload]

Ubuntu は、22.04 だと netplan.io 0.104 になっているので、22.04 にアップグレードしてからかな。(20.04 だと netplan.io 0.99 なのでまだちょっと古い。)
22.04 へのアップグレード、ifupdown から netplan へのリプレース、という段階を踏んでから、ということに。
まぁしばらくは我慢だ。

0 件のコメント:

コメントを投稿