CONTENTS
#contents
----
Lastmodified &lastmod;
----
*Watchdog timeout Queue[0]-- resetting [#k0af672f]
**NEC Express5800/GT110bのオンボードNIC(em0) @ FreeBSD 10.2-RELEASE #0 が高負荷で落ちる件 [#r70400e9]
FreeBSD 9.3-R では、落ちたことがないオンボードem0が、10.2-R で落ちる、落ちまくる・・・(+o+)
Sep 15 02:30:01 blackhole postfix/qmgr[758]: F07FA1034: removed
Sep 15 02:31:00 blackhole /usr/sbin/cron[74362]: (root) CMD (adjkerntz -a)
Sep 15 02:33:00 blackhole /usr/sbin/cron[74364]: (operator) CMD (/usr/libexec/save-entropy)
Sep 15 02:35:00 blackhole /usr/sbin/cron[74376]: (root) CMD (/usr/libexec/atrun)
Sep 15 02:39:59 blackhole kernel: em0: Watchdog timeout Queue[0]-- resetting
Sep 15 02:39:59 blackhole kernel: Interface is RUNNING and ACTIVE
Sep 15 02:39:59 blackhole kernel: em0: TX Queue 0 ------
Sep 15 02:39:59 blackhole kernel: em0: hw tdh = 5, hw tdt = 40
Sep 15 02:39:59 blackhole kernel: em0: Tx Queue Status = -2147483648
Sep 15 02:39:59 blackhole kernel: em0: TX descriptors avail = 988
Sep 15 02:39:59 blackhole kernel: em0: Tx Descriptors avail failure = 0
Sep 15 02:39:59 blackhole kernel: em0: RX Queue 0 ------
Sep 15 02:39:59 blackhole kernel: em0: hw rdh = 112, hw rdt = 111
Sep 15 02:39:59 blackhole kernel: em0: RX discarded packets = 0
Sep 15 02:39:59 blackhole kernel: em0: RX Next to Check = 112
Sep 15 02:39:59 blackhole kernel: em0: RX Next to Refresh = 111
Sep 15 02:39:59 blackhole kernel: em0: link state changed to DOWN
Sep 15 02:40:00 blackhole /usr/sbin/cron[74378]: (root) CMD (/usr/libexec/atrun)
Sep 15 02:40:02 blackhole kernel: em0: link state changed to UP
Sep 15 02:40:13 blackhole kernel: em0: Watchdog timeout Queue[0]-- resetting
Sep 15 02:40:13 blackhole kernel: Interface is RUNNING and ACTIVE
Sep 15 02:40:13 blackhole kernel: em0: TX Queue 0 ------
Sep 15 02:40:13 blackhole kernel: em0: hw tdh = 0, hw tdt = 20
Sep 15 02:40:13 blackhole kernel: em0: Tx Queue Status = -2147483648
Sep 15 02:40:13 blackhole kernel: em0: TX descriptors avail = 1004
Sep 15 02:40:13 blackhole kernel: em0: Tx Descriptors avail failure = 0
*** FreeBSD Forum [#u1b36000]
https://forums.freebsd.org/threads/workaround-freebsd-10-1-sudden-network-down.49264/
***NECのサイトから [#x6d75c70]
https://www.express.nec.co.jp/linux/distributions/confirm/R110d-1E/R110d-1E_FBSD82.html
(注1)
dmesg に "bge0:link state changed to UP/DOWN" などが頻発して正常動作しません。
/boot/loader.conf に「hw.pci.enable_msi="0"」という行を追記して一旦再起動することでこれを回避できます。
hw.pci.enable_msi="0"
***他にこんな参考サイトも [#d0cccae3]
http://imasarane.blogspot.jp/2013/07/freebsd-watchdoc.html
/boot/loader.conf に以下の追記をするとの記述もあり
---------------------------------------------------------------------
hw.bge.allow_asf="0"
---------------------------------------------------------------------
iLO(HP), BMC(DELL)のネットワーク経由コンソール画面のサポートを無視するのであれば、このオプションで行けるらしい。
em なのに、何故 bge ? と思うが、 hw.em.allow_asf なんてオプションは存在しなさそう・・・
こっちを /boot/loader.conf に記載しろって書込みもある。
---------------------------------------------------------------------
hw.pci.enable_msi=0
hw.pci.enable_msix=0
---------------------------------------------------------------------
以下でリアルで変更できるので、とりあえず変更して様子見
# sysctl hw.pci.enable_msi=0
# sysctl hw.pci.enable_msix=0
http://www.omakase.org/freebsd/watchdog_timeout_nic.html
HP G6 の内蔵 NIC
bge0: watchdog timeout -- resetting
bge0: link state changed to DOWN
bge0: link state changed to UP
/boot/loader.conf に以下を書き込み再起動すると問題は解消します。
/boot/loader.conf
hw.bge.allow_asf="0"
http://wiki.rookie-inc.com/os/freebsd/tips
# cat /boot/loader.conf
hw.msk.msi_disable="1"
http://d.hatena.ne.jp/flageo/20090722/p1
/boot/loader.conf
hw.bce.msi_enable=0
hw.pci.enable_msi=0
* いずれの対策もDOWNを防げず [#w98d005f]
*** net.inet.tcp.tso=0 とem(4) [#w191436b]
http://www.bsddiary.net/d/20100324.html
http://matsup.blogspot.jp/2012/12/freebsd-90-ipfw-natd-em.html
/etc/sysctl.conf
net.inet.tcp.tso=0
を追加。
未だ落ちる・・・
* 対策(ただし後ろ向き) [#nca643e8]
[[watchdogd de reboot]]
**オンボードNIC em0 が高負荷で落ちるので、これを監視して落ちたらシステム・リブートさせたい。 [#gd6a1c8f]
[[DEVD]]
----
Total access &counter(total);:本日 &counter(today);:昨日 &counter(yesterday);
#counter([total|today|yesterday]);