システム屋さんの忘備録

訪問ありがとうございます。システム屋と経営者・ユーザーとのやりとり、社内SE・システム管理者向け情報、生まれ育った京阪神の情報ブログです。このページへは「システム屋さん」で検索。

温度の低い季節のシステム管理者

今日は全国的に雪の予報です。このような季節はサーバー管理者にとっては機器故障する確率が下がるので「故障閑散期」とも言えます。私のクライアントの多くは事務所に基幹業務のサーバーを設置して24時間稼働していますので温度について敏感になります。最近のサーバーは内部の各部分の温度や状態が取得できるので定期監視をしていれば致命的なインシデントを回避できます。

先日クライアントに訪問したときに「新規取引にあたってセキュリティチェックシートの提出を求められたのですが・・・」とチェックシートを渡されました。よくある一般的なチェックシートでしたが「二世代ぐらい前の内容」でプライバシーマーク取得企業によくあるひな形でした。今は「サイバー攻撃で狙われたら防御が難しい」時代ですのでそれに沿ったチェックはありません。例えば「添付ファイルをむやみに開封しない」などは「メールで仕事をしない」とも言えます。抽象的な質問も多く「とりあえず提出して下さい」という形式的なチェックシートでしたので優等生的なチェックをするようにしました。もしかしたらその企業はすでに不正侵入済みかも知れませんのでこちらからもチェックシートを送付したいぐらいでした。

Windows 7
2016年12月の世界におけるデスクトップOSシェア(出典:NetMarketShare)

最近は海外から個人への攻撃が急増しています。未だにWindows 7が多いようですが今のところサイバー攻撃に対して最強のWindows 10と付属のWindows Defenderの利用をお勧めします。

サーバーの温度管理

暑い日が続きます、社内システム管理者はサーバーの温度が気になる時期です。エアコンが複数設置されたサーバールームがある会社やデータセンターに機器を預けている場合は安心ですが、事務所に設置している場合は定期的なチェックが必要になります。

power edge 今だ現役

環境にもよりますが3ヶ月程度でサーバーのフロントパネルを外すとホコリがたまっています。このホコリによってHDDが冷却されずにHDD故障になるケースが多く、ほとんどがRAID構成ですので、故障の場合はHDD交換-RAID構成再構築を行います。RAIDボードなどの故障になると業務は止まってしまします。

お盆休みを控えて、事務所にあるサーバーやパソコンの清掃、また夜間、休日にエアコンの電源を入れたままにするなどの対策を行います。節電の時代ですがサーバー故障による損害は場合によっては会社の存続リスクにもなります。ある会社では何も知らない総務部長さんがシステム管理者の反対を押し切って節電徹底のためサーバールームのエアコンを切ったそうです。その会社の最大のリスクは総務部長さんでしょうね。

24時間対応のサポートセンター

先日保守先の事務所内設置のサーバーを再起動したところ接続できなくなりました。昔はCDをドライブに入れたままやサーバーのキーボードの上に荷物があったりして再起動が妨げられて「出動」したことがありますが・・・・・

八本松トンネル

すぐに広島の事務所に向かったのですが、いつもの高速道路は多重衝突事故のため西条から通行止めで迂回して到着、今までは強制終了して再度電源ONで直っていたのですが今回はWindowsが起動しません。メーカーのサポートセンターに問い合わせると「機器診断テスト」を何回かして「物理的に異常はありません」、そこでメーカーサポートから決定的な言葉が「OSの再インストール」「データのサルベージ業者に相談」されてはいかがですかと・・・

結局「BCP手順発動」、控えのサーバー(MAGNIA)を稼働するためにシステム開発会社へ業務システムのアクティブ化の依頼、事務の方は退社、こちらではバックアップから基幹システムデータを復元し約4時間のダウンタイムで仮復旧。重いサーバーを引き取り、通常は開発会社へ持ち込むのですが原因特定のためOS再インストールは自分で行いました。

今回はDELL社製のサーバーで24時間365日サポート契約でしたので不明な点はその都度電話にてサポートしてもらいRAID構成再構築、OSインストールを行いました。担当者によって違う指示もありLifecycle Controllerから、Windows 2012 server DVDからではうまくいきませんでしたが、SMTDメディアを利用したインストールで順調にインストールできました。どうも再インストール後はドライバが入れ替わっていたのでseagate製2TBのSATA-HDDが怪しかったと思います。サポートセンターに24時間電話が繋がる安心感は心強く感じました。DELLのインストール手順説明ページですがインストール時に出来るOEMDRVドライブの削除方法(18時間後に自動で消えるが)について一連のカテゴリにあると便利と思いました。

PRIMERGY,MAGNIA,HPE ProLiant,PowerEdge,Express5800

Windows 2003 serverのリプレイス状況

7月15日にWindows Server 2003のMSのサポートが終わるのですがリプレイスは思うように進んでいない状況です。原因は色々と言われていますがやはり中小企業にとって多額な費用が一番のようです。2003サーバー発売時と現在ではデータベース、ミドルウエアなどは値上げされ、更新を重ねて同じ機能でもアプリケーションの改修などの工数がかかります。私たちの回りでは簡単なサーバーリプレイスは1台当たり一千万円が多いようです。見積もりの妥当性相談を受けていますがだいたい生産系、販売系の基幹系の場合ですと不思議に1本当たり一千万円で二本ですと不思議に合計で二千万前後の見積もり内容を多く見受けられます。

サーバー管理

システム会社にとっては簡単なリプレイスで少しでも利益を上げたいと思われます。インターフェス画面を少しいじって、新機能を少し加えるだけでそれなりの見積もりを提案してきます。社内システム管理者はこれらの見積もりが妥当かどうか詳細にわたって診断する必要があります。

新たに基幹系システムを作り替えるとなるとすぐに億単位のコストがかかる時代です。それだけ業界向けの専門のシステムは高価なものです。今なおWindows 2003 serverを使っている社内システム管理者は経営層への働きかけに苦労していると思います。すでに修理部品も中古しか無い部品も多く中には国内には無いので海外手配やイーベイなどから入手する事になっているのが現状です。

事務所にあるサーバーは空気清浄機では無い

サーバーではハードディスク、RAIDコントローラの故障などストレージ関連の故障が大半を占めます。社内システム管理者などが定期的に点検、メンテナンスしている会社では大きなトラブルになる前に対応が出来ますが、経営者が「システムは購入したら費用をかけない」と言うような考えの方の会社ではそうはいきません。

サーバー管理

ある会社から社内サーバーが動かないと言う連絡あり訪問してみると、フロントグリルにほこりが溜まって空気清浄機状態になっていました。原因は高熱によってハードディスクが故障したと思われます(RAID-5構成の内2本故障)。購入後は費用をかけない経営者はメーカーの延長保守なども契約していませんのでメーカーは部品提供してくれません、またSAS等のサーバー向けのハードディスクは国内手配が難しい時があります。修理期間と概算費用を見積もるとほとんどの方が日時がかかるのと費用が高額になるので驚かれます。

問題はサーバーがハードディスク故障で動かなくなった場合、RAID構成が全滅している状態ですのでデータ復旧と言う特殊なサービスを依頼することになります。専用の機器で数人がかりで昼夜を問わず復旧作業をしますがその費用は内容にもよりますが桁違いの費用がかかります。メーカー純正部品が無ければデータサルベージ後にRAIDコントローラボード入替、システムの再構築が必要になり購入元の開発会社へも緊急依頼することになります。

サーバーのメーカー保守は24時間365日受付、翌日出張対応、修理部品保証などがセットになっています。1年は無料ですが複数年は追加保証を購入します。せめて償却年数ぐらいは延長保守契約しておきたいです。「今から保守契約出来ないか」とこの会社から言われましたが、システム業界の保守契約は当初購入時からの継続が原則で途中からは受けるメーカーや開発会社は無いと伝えました。結局導入時の数倍の費用がかかってしまいました。

Windows Server 2012 メンテナンス中にハング

多くのシステム管理者はサーバーのメンテナンスをリモートデスクトップで行います。接続先は自社内のサーバー、国内各拠点、海外などです。今回Windows Server 2012へ接続中にエクスプローラがハングしました。サーバーでエクスプローラがハングすることは今まで経験がありません。 幸いにも誰も使用してなかったのでリモート側からCTRL+ALT+ENDキーを押して再起動により回復しましたが原因を調べると・・・なんとMSさんのバグでした。

2012 server


修正プログラムは KB3048778で内容は以下の通りです。
この資料は、3033889 の更新プログラムが原因でリリース後、この問題を解決する更新プログラムについて説明します。3033889 の更新をインストールした後に、日本語または韓国語を使用するシステムの入力方式エディター (IME)、Windows エクスプ ローラーが応答を停止または「ハング」、とクラッシュする可能性があります。この問題は、Windows Server 2012 の R2、8.1 の Windows、Windows Server 2012 の、または Windows 8 を実行しているコンピューターでのみ発生します。

結局オプションプログラムを適用後にもう一度再起動することになりました。
オプションでの更新とは・・・、重要だと思われるのですが。

事務所に設置している業務用サーバー

今週は事務所設置の業務用サーバーHDDの故障が相次ぎました。事務所はサーバー設置場所としては好ましい環境ではありません。室温の変化が大きい、ほこりが多い、電圧が不安定など機器の耐久試験のような環境とも言えます。最近の節電対策で夏場エアコンを切った状態ではサーバー内部は50度を超えることもあります。

正常な物理ディスク

残念な事ですがサーバー購入したらメンテ無しでも動いて当たり前と考える経営者がいます。RAID構成でHDDが故障しても気づかずに使い続けいきなり動かなくなりデータも読めなくなってから相談を受けますが、データ復旧には100万円ぐらいかかると伝えると「高い」と言われます。検索するとわかりますがHDD故障のデータ復旧はクリーンルームのような専門の施設が必要で何日も専門家が対応しますのでそれなりの費用が発生します。その損害は会社に致命的な影響を及ぼす時もあります。

サーバーのRAID構成ですが小さな事務所ではスピードや容量面では他のRAID構成には劣りますがRAID-1が一番お勧めです。ミラーリングとも言いますがあらゆる面で障害復旧が容易なこととです。RAID-5でHDD4本以上の構成を見かけますがRAID-5構成では3本が理論的には一番障害発生率は低くなります。RAID構成ではHDD数が多いほど障害発生率は高くなるのが理由です。HDD数が多いから安心では無いので無駄な投資にならないように専門家に相談することをお勧めします。
ブログ内検索フォーム
インデックス
人気ランキング参加してます
人気ブログランキングへ 
法人向けPC、サーバー、他
Translation