CONTENTS
#contents
----
Lastmodified &lastmod;
----
*Watchdog timeout Queue[0]-- resetting [#k0af672f]

**NEC Express5800/GT110bのオンボードNIC(em0) @ FreeBSD 10.2-RELEASE #0 が高負荷で落ちる件 [#r70400e9]

FreeBSD 9.3-R では、落ちたことがないオンボードem0が、10.2-R で落ちる、落ちまくる・・・(+o+)

 Sep 15 02:30:01 blackhole postfix/qmgr[758]: F07FA1034: removed
 Sep 15 02:31:00 blackhole /usr/sbin/cron[74362]: (root) CMD (adjkerntz -a)
 Sep 15 02:33:00 blackhole /usr/sbin/cron[74364]: (operator) CMD (/usr/libexec/save-entropy)
 Sep 15 02:35:00 blackhole /usr/sbin/cron[74376]: (root) CMD (/usr/libexec/atrun)
 Sep 15 02:39:59 blackhole kernel: em0: Watchdog timeout Queue[0]-- resetting
 Sep 15 02:39:59 blackhole kernel: Interface is RUNNING and ACTIVE
 Sep 15 02:39:59 blackhole kernel: em0: TX Queue 0 ------
 Sep 15 02:39:59 blackhole kernel: em0: hw tdh = 5, hw tdt = 40
 Sep 15 02:39:59 blackhole kernel: em0: Tx Queue Status = -2147483648
 Sep 15 02:39:59 blackhole kernel: em0: TX descriptors avail = 988
 Sep 15 02:39:59 blackhole kernel: em0: Tx Descriptors avail failure = 0
 Sep 15 02:39:59 blackhole kernel: em0: RX Queue 0 ------
 Sep 15 02:39:59 blackhole kernel: em0: hw rdh = 112, hw rdt = 111
 Sep 15 02:39:59 blackhole kernel: em0: RX discarded packets = 0
 Sep 15 02:39:59 blackhole kernel: em0: RX Next to Check = 112
 Sep 15 02:39:59 blackhole kernel: em0: RX Next to Refresh = 111
 Sep 15 02:39:59 blackhole kernel: em0: link state changed to DOWN
 Sep 15 02:40:00 blackhole /usr/sbin/cron[74378]: (root) CMD (/usr/libexec/atrun)
 Sep 15 02:40:02 blackhole kernel: em0: link state changed to UP
 Sep 15 02:40:13 blackhole kernel: em0: Watchdog timeout Queue[0]-- resetting
 Sep 15 02:40:13 blackhole kernel: Interface is RUNNING and ACTIVE
 Sep 15 02:40:13 blackhole kernel: em0: TX Queue 0 ------
 Sep 15 02:40:13 blackhole kernel: em0: hw tdh = 0, hw tdt = 20
 Sep 15 02:40:13 blackhole kernel: em0: Tx Queue Status = -2147483648
 Sep 15 02:40:13 blackhole kernel: em0: TX descriptors avail = 1004
 Sep 15 02:40:13 blackhole kernel: em0: Tx Descriptors avail failure = 0

***NECのサイトから [#x6d75c70]
https://www.express.nec.co.jp/linux/distributions/confirm/R110d-1E/R110d-1E_FBSD82.html

(注1)
dmesg に "bge0:link state changed to UP/DOWN" などが頻発して正常動作しません。

/boot/loader.conf に「hw.pci.enable_msi="0"」という行を追記して一旦再起動することでこれを回避できます。

 hw.pci.enable_msi="0"

***他にこんな参考サイトも [#d0cccae3]
http://imasarane.blogspot.jp/2013/07/freebsd-watchdoc.html

/boot/loader.conf に以下の追記をするとの記述もあり
 ---------------------------------------------------------------------
 hw.bge.allow_asf="0"
 ---------------------------------------------------------------------

iLO(HP), BMC(DELL)のネットワーク経由コンソール画面のサポートを無視するのであれば、このオプションで行けるらしい。

em なのに、何故 bge ? と思うが、 hw.em.allow_asf なんてオプションは存在しなさそう・・・

こっちを /boot/loader.conf に記載しろって書込みもある。
 ---------------------------------------------------------------------
 hw.pci.enable_msi=0
 hw.pci.enable_msix=0
 ---------------------------------------------------------------------

以下でリアルで変更できるので、とりあえず変更して様子見
 # sysctl hw.pci.enable_msi=0
 # sysctl hw.pci.enable_msix=0

http://www.omakase.org/freebsd/watchdog_timeout_nic.html

HP G6 の内蔵 NIC 

 bge0: watchdog timeout -- resetting
 bge0: link state changed to DOWN
 bge0: link state changed to UP


/boot/loader.conf に以下を書き込み再起動すると問題は解消します。 

/boot/loader.conf
 hw.bge.allow_asf="0" 


http://wiki.rookie-inc.com/os/freebsd/tips

 # cat /boot/loader.conf
 hw.msk.msi_disable="1"

http://d.hatena.ne.jp/flageo/20090722/p1

/boot/loader.conf
 hw.bce.msi_enable=0
 hw.pci.enable_msi=0


* いずれの対策もDOWNを防げず [#w98d005f]

[[watchdogd de reboot]] を試してみたが、期待通りにリブートせず。


----
Total access &counter(total);:本日 &counter(today);:昨日 &counter(yesterday);
#counter([total|today|yesterday]);


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS