Cisco UCS PE 3.1(2bPE1)でMinor Faluts発生
概要
・UCS PEを起動したら、Minor Faluts(障害コード: F0184)発生していた。
・Memory Eventログが取得できない中、パソコンがスリープ。
・UCS PEはMemory Eventログが取得できない?
----------------------------------------------------------------------------------------------------------------------
参考サイト
・障害コードの解説;
・UCSのRelease情報の調査方法
・DIMMの意味
・UCS ManagerでのDIMMの特定方法
交換前後の確認項目 - B シリーズ サーバ - Cisco Support Community
・UCS B-Series メモリー(DIMM) の交換手順
UCS B-Series メモリー(DIMM) の交換手順 - Cisco Support Community
----------------------------------------------------------------------------------------------------------------------
Cisco UCS PE 3.1(2bPE1)を操作していたところ、Minor Faultsが発生。
資料を探すために、Firmwareのバージョンを確認
障害コード(F0184)に対する対応方法
障害コード(F0184)のALMが多数発生。
Server5のMemoryを確認するとOperabilityがDegrated。
正常なServer3のMemoryを確認するとOperabilityはN/A。
Server5のMemoryのEventを確認中、パソコンがスリープ。。。
再度、UCS PEにログインしManor Faultsが継続していることを確認。
交換手順に従って、UCSの電源状態を確認したところ電源状態はOff。
⇒Server5をリセットしても事象変わらず。UCS PEの仕様で復旧しない可能性もあることから切り分け終了。
Cisco UCS PE 3.1(2bPE1)をさわってみた④
”Equipment>Thermal”を見てみた。
---------------------------------------------------------------------------------------------------------------------
Equipment>Thermal
Cisco UCSのChassisとFabric interconnectが表示される。
Equipment>Thermal>Chassisで右クリック
Equipment>Thermal>IO Moduleで右クリック
Equipment>Thermal>PSUで右クリック
Equipment>Thermal>Serverで右クリック
Equipment>Thermal>Adapterで右クリック
Equipment>Thermal>Motherboardで右クリック
Equipment>Thermal>Mem Arrayで右クリック
Equipment>Thermal>Memoryで右クリック
Equipment>Thermal>Fabric Interconnectで右クリック
Cisco UCS PE 3.1(2bPE1)でMajor Faluts発生
概要
・UCS PEを起動したら、Major Faluts(障害コード: F0317)発生していた。
・Ciscoの推奨措置に従って、サーバのRe Acknowledgeを実施するも復旧せず。
・UCS PEはshow tech support fileを作成できない模様。
----------------------------------------------------------------------------------------------------------------------
参考サイト
----------------------------------------------------------------------------------------------------------------------
メモ
UCS PEを起動したら、Major Faluts(障害コード: F0317)発生。
UCS PEではFaultが発生している対象が視覚的にわかりやすい。
新規に立ち上げただけだが、"Status: inoperable"となっている。。。
Chassis 5の他のServerはOperable。
Server 3に対して何ができるか、確認してみる。
View Health LED Alarmsを選択してみるも、変化なし。
Toggle Locator LEDを選択してみるも、変化なし。
Toggle FP Buttonsを選択してみるも、変化なし。
Reset All Memory Errorsを選択してみるも変化なし。
Recover Server>Re acknowledgeを実行するも変化なし。
Reset Serverを選択してみるも、変化なし。
障害コード: F0317で検索すると下記推奨措置を発見。POST(Power On Self Test, 電源投入時自己診断テスト)の結果を確認するもデータなし。サーバーの再認識を試しているのに復旧しない。。。
show tech supportファイルを作成してみるも失敗。
*CIMC: Cisco Integrated Management Controller
I
*IOM: I/Oモジュール
これ以上対応方法がわからず、切り分けを断念。
Cisco UCS PE 3.1(2bPE1)をさわってみた③
”Equipment>Servers”を見てみた。
---------------------------------------------------------------------------------------------------------------------
Equipment>Servers>Blade Servers
・Blade Serverが表示される。Server1など同じ名前がName欄にあるのは、複数のChassisにServer1が搭載されているから。
Equipment>Servers>Rack Mount-Servers
・Rack Mount-Serverが表示される。
Equipment>Servers>Blade Servers>右クリック>Show navigator
・Equipment>Servers>Blade Servers>右クリック>Create Service Profile for Server
試しにtest1というプロファイルを作成してみるも、Mac Addressが不足しているためconfiguration-failureが発生。
・Equipment>Servers>Blade Servers>右クリック>Set Desired Power State
デフォルトはすべてのServerがdownしている。でもfalut informationなどは収集されている。upを選択してもPower Statusはoffのまま。Emulatorの仕様?
・Equipment>Servers>Blade Servers>右クリック>Boot Server
Boot processを走らせているとポップアップが出てきたけど、FSM(Finite State Machine)のプロセスは始まっていない。これも仕様?
Cisco UCS PE 3.1(2bPE1)をさわってみた②
”Equipment>Fabric Interconnects”を見てみた。
---------------------------------------------------------------------------------------------------------------------
Equipment>Fabric Interconnects>Fabric Interconnects
・Fabirc Interconnect(Primary)とFabric Interconnect(Subordinate)が表示される。
・開いていくとPortの収容状態が表示される。
・Portをダブルクリックするとポートのポロパティが表示される。
・ポートを右クリックするとポートに対するアクションが表示される。
・Portを右クリックして試しに"Configure as Server Port"を選択すると、Overall StatusがUpとなってすぐに登録される。接続先を登録しなくてもUpになるのは、Emulatorの仕様?
Cisco UCS PE 3.1(2bPE1)をさわってみた①
Cisco UCS PE 3.1(2bPE1)をさわってみた。
画面左のEquipment, Servers, LANなど選択して画面を切り替える。
Main Topology Viewを見てみた。
---------------------------------------------------------------------------------------------------------------------
Equipment>Main Topology View
デフォルトで下記機器が使用されている。
・Fabric Interconnect A(Primary)
・Fabric Interconnect B(Subordinate)
・FEX1
・FEX2
・Server1~7
・Chassis 3~5
機器をマウスでダブルクリックすると機器詳細画面が表示される。
・Fabric Interconnect A(Primary)
・Fabric Interconnect B(Subordinate)
・FEX1
・FEX2
・Server1
・Server2
・Server3
・Server4
・Server5
・Server6
・Server7
・Chassis 3
・Chassis 4
・Chassis 5
・Chassis 6
GNS3、Fabirc Pathで"sh fabricpath conflict"系コマンドをたたいてみた。
以前、設定したFabric PathのPODで"sh fabricpath conflict"系コマンドをたたいてみた。
mm2911.hatenablog.com
L1# sh fabricpath conflict ?
all Show all
link Show links
switch-id Show switch-ids
transitions Show transitionsL1# sh fabricpath conflict all
No Fabricpath ports in a state of resource conflict.
No Switch id ConflictsNo transitions in progress
L1# sh fabricpath conflict link
No Fabricpath ports in a state of resource conflict.L1# sh fabricpath conflict switch-id
No Switch id Conflicts
L1# sh fabricpath conflict transitions
No transitions in progressL1#