CONTENTS


Lastmodified 2015-09-20 (日) 05:04:19


Watchdog timeout Queue[0]-- resetting

NEC Express5800/GT110bのオンボードNIC(em0) @ FreeBSD 10.2-RELEASE #0 が高負荷で落ちる件

FreeBSD 9.3-R では、落ちたことがないオンボードem0が、10.2-R で落ちる、落ちまくる・・・(+o+)

Sep 15 02:30:01 blackhole postfix/qmgr[758]: F07FA1034: removed
Sep 15 02:31:00 blackhole /usr/sbin/cron[74362]: (root) CMD (adjkerntz -a)
Sep 15 02:33:00 blackhole /usr/sbin/cron[74364]: (operator) CMD (/usr/libexec/save-entropy)
Sep 15 02:35:00 blackhole /usr/sbin/cron[74376]: (root) CMD (/usr/libexec/atrun)
Sep 15 02:39:59 blackhole kernel: em0: Watchdog timeout Queue[0]-- resetting
Sep 15 02:39:59 blackhole kernel: Interface is RUNNING and ACTIVE
Sep 15 02:39:59 blackhole kernel: em0: TX Queue 0 ------
Sep 15 02:39:59 blackhole kernel: em0: hw tdh = 5, hw tdt = 40
Sep 15 02:39:59 blackhole kernel: em0: Tx Queue Status = -2147483648
Sep 15 02:39:59 blackhole kernel: em0: TX descriptors avail = 988
Sep 15 02:39:59 blackhole kernel: em0: Tx Descriptors avail failure = 0
Sep 15 02:39:59 blackhole kernel: em0: RX Queue 0 ------
Sep 15 02:39:59 blackhole kernel: em0: hw rdh = 112, hw rdt = 111
Sep 15 02:39:59 blackhole kernel: em0: RX discarded packets = 0
Sep 15 02:39:59 blackhole kernel: em0: RX Next to Check = 112
Sep 15 02:39:59 blackhole kernel: em0: RX Next to Refresh = 111
Sep 15 02:39:59 blackhole kernel: em0: link state changed to DOWN
Sep 15 02:40:00 blackhole /usr/sbin/cron[74378]: (root) CMD (/usr/libexec/atrun)
Sep 15 02:40:02 blackhole kernel: em0: link state changed to UP
Sep 15 02:40:13 blackhole kernel: em0: Watchdog timeout Queue[0]-- resetting
Sep 15 02:40:13 blackhole kernel: Interface is RUNNING and ACTIVE
Sep 15 02:40:13 blackhole kernel: em0: TX Queue 0 ------
Sep 15 02:40:13 blackhole kernel: em0: hw tdh = 0, hw tdt = 20
Sep 15 02:40:13 blackhole kernel: em0: Tx Queue Status = -2147483648
Sep 15 02:40:13 blackhole kernel: em0: TX descriptors avail = 1004
Sep 15 02:40:13 blackhole kernel: em0: Tx Descriptors avail failure = 0

FreeBSD Forum

https://forums.freebsd.org/threads/workaround-freebsd-10-1-sudden-network-down.49264/

NECのサイトから

https://www.express.nec.co.jp/linux/distributions/confirm/R110d-1E/R110d-1E_FBSD82.html

(注1) dmesg に "bge0:link state changed to UP/DOWN" などが頻発して正常動作しません。

/boot/loader.conf に「hw.pci.enable_msi="0"」という行を追記して一旦再起動することでこれを回避できます。

hw.pci.enable_msi="0"

他にこんな参考サイトも

http://imasarane.blogspot.jp/2013/07/freebsd-watchdoc.html

/boot/loader.conf に以下の追記をするとの記述もあり

---------------------------------------------------------------------
hw.bge.allow_asf="0"
---------------------------------------------------------------------

iLO(HP), BMC(DELL)のネットワーク経由コンソール画面のサポートを無視するのであれば、このオプションで行けるらしい。

em なのに、何故 bge ? と思うが、 hw.em.allow_asf なんてオプションは存在しなさそう・・・

こっちを /boot/loader.conf に記載しろって書込みもある。

---------------------------------------------------------------------
hw.pci.enable_msi=0
hw.pci.enable_msix=0
---------------------------------------------------------------------

以下でリアルで変更できるので、とりあえず変更して様子見

# sysctl hw.pci.enable_msi=0
# sysctl hw.pci.enable_msix=0

http://www.omakase.org/freebsd/watchdog_timeout_nic.html

HP G6 の内蔵 NIC

bge0: watchdog timeout -- resetting
bge0: link state changed to DOWN
bge0: link state changed to UP

/boot/loader.conf に以下を書き込み再起動すると問題は解消します。

/boot/loader.conf

hw.bge.allow_asf="0" 

http://wiki.rookie-inc.com/os/freebsd/tips

# cat /boot/loader.conf
hw.msk.msi_disable="1"

http://d.hatena.ne.jp/flageo/20090722/p1

/boot/loader.conf

hw.bce.msi_enable=0
hw.pci.enable_msi=0

いずれの対策もDOWNを防げず

net.inet.tcp.tso=0 とem(4)

http://www.bsddiary.net/d/20100324.html

http://matsup.blogspot.jp/2012/12/freebsd-90-ipfw-natd-em.html

/etc/sysctl.conf

net.inet.tcp.tso=0

を追加。

未だ落ちる・・・

対策(ただし後ろ向き)

watchdogd de reboot

オンボードNIC em0 が高負荷で落ちるので、これを監視して落ちたらシステム・リブートさせたい。

DEVD


Total access 3804:本日 1:昨日 2

Counter: 3804, today: 1, yesterday: 2

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2015-09-20 (日) 05:04:19