システム管理

キャパシティプランの対象

CPU数 メモリ容量 ハードディスク容量 データベース容量 トラフィック量 ネットワーク帯域 マスタデータ件数 トランザクション件数 端末数 利用者数 サーバ数 ロードバランサー数 電力供給量 サーバラック積載量 マシン室の床面積や容積

ユーザーに依頼する移行作業

移行体制と役割分担の調整 データ整備 移行前の業務調整 移行中の業務変更 データ入力 データ検証 移行後の処理結果確認

障害予防策

障害対応の結果、原因と対策が判明したら、他のシステムやプログラムにおける類似箇所についても必ず調査を行い、対応しておく。それが新たな障害を予防する事になる。

システムの障害対応時間を短縮する方策

障害対策マニュアル、障害復旧手順書等の資料を予め整備しておく。 障害対応において必要となるツールやスクリプト、コード表等の資料を予め整備しておく。 過去の障害(復旧)事例を蓄積し、いつでもすぐに参照できるようにしておく。 障害発生時の緊急連絡…

システムの稼動時間を長くする方策

機器やネットワークを二重化する等、冗長化を図る。 定期的に予防保守を行う。 CVCF(Constant Voltage Constant Frequency)やUPS(Uninterruptible Power Supply)等により、一定の電圧や周波数を確保し、電力の瞬断にも耐えられるようにする。 ハードディスク…

障害の切り分けチェックリスト

全ての端末がサーバーに接続出来ない場合は、サーバー、もしくはネットワーク全体に障害が発生している可能性が高い。 一部の端末群がサーバーに接続出来ない場合は、ハブやルータ等のネットワーク機器に障害が発生している可能性が高い。 特定の端末がサー…

アウトソーシングの目的

システム運用コストの削減 システム運用の効率化 システム運用の安定化 サービスレベルの維持向上

システム運用マニュアル

運用ルール システム操作手順 ジョブフロー エラーメッセージ一覧 障害復旧手順 注意事項 緊急連絡網

バックアップ運用

バックアップ対象の特性やデータ量、処理時間等により、記録媒体やバックアップサイクル等を決定する。 バックアップとリストアの所要時間を踏まえて、全体バックアップと差分バックアップのサイクルを設定する。 記録媒体は、必要になると考えられる時点迄…

案件管理

システムの変更要望や障害対応を案件管理台帳で一元管理する。 各案件の対応実施は優先順位を付け、計画的に行う。 優先順位は緊急性・有効性・効率化・投資対効果・リスク等の観点で付ける。 ユーザーと会議を開催し、案件の対応計画・進捗状況・対応結果等…

システム保守の目的

システム保守の目的は、システムの欠陥を補修するだけでなく、ビジネス環境の変化や経営戦略の変更に素早く対応する事にある。経営者や利用部門のシステム化要望を管理し、投資対効果やリスク等を基に優先順位をつけながら対応しなければならない。

リリース判断基準

システムテスト(性能テスト・障害テスト)が済んでいる事。 運用テストが済んでいる事。 システムの品質が基準を満たしている事。 システムの性能が基準を満たしている事。 開発担当者から運用担当者にシステムが引き継がれている事。 システムの使い方がユ…

案件管理

管理番号 起案日 起案部署 起案者 システム名 案件区分(要望・障害) 対象区分(ハードウェア・ソフトウェア・ネットワーク・アプリケーション・運用・施設) 案件内容 起案目的・理由 状態(未着手・計画中・実施中・承認待ち・完了) 実施予定日 開始日 …

システムが利用されなくなる理由

業務に合わない。 アウトプットが信用出来ない。 操作が難しい。 処理が遅い。 システムが頻繁に停止する。 運用コストが高い。 手間がかかる割に効果が上がらない。 画面や帳票の表示が見難い。

リスク評価

想定されるリスク 予防策 発見方法 事後対策 残余リスク(予防策や対策が無効になるケース) 改善策

変更管理台帳

変更日 リリース日 システム名 サブシステム名 カテゴリ(ハードウェア・ソフトウェア・ネットワーク・アプリケーション) 変更区分(追加・更新・削除) 変更対象(機器・設定値・バージョン・プログラム・設計書・マスタデータ) 変更内容 変更担当者 変更承認者 備考

システム運用保守サービス

構成管理(ハードウェア・ソフトウェア・ネットワーク) バージョン管理(パッチ適用・バージョンアップ) リソース管理(CPU・メモリ・HDD・DB領域) データ保全(バックアップ・データ更新) 定期予防保守 システム運用 随時依頼処理 障害対応 アプリケー…

障害記録

障害管理番号 障害件名 障害区分(ハードウェア・ソフトウェア・ネットワーク・アプリケーション・運用・操作・他システム・災害等) 障害発生日時 障害発生場所 通報者(部門・氏名) 対象業務名 対象システム名 現象 操作手順 影響範囲(業務・顧客・部門・損害・損失) 対応…

運用マニュアル

端末利用 ID・パスワードの変更 ソフトウェアバージョンアップ マシン室の入退室 システム操作 例外処理 障害対策 インストール 環境設定 システム導入・移行 データ保全 防犯・防災

運用ルール

ハードウェア導入時・変更時の手続き ソフトウェア導入時・変更時の手続き ネットワーク導入時・変更時の手続き 環境設定変更時の手続き ジョブスケジュール登録・変更の手続き 消耗品の購入時・使用時の手続き 操作マニュアル作成・改訂の手続き マシン室の入退室…

障害防止策

障害の記録を蓄積し、原因の分析を行い、障害の傾向を把握する。 障害の多いシステムについて、対応にかかるコストを試算し、場合によっては再構築も検討する。 運用ルールや運用マニュアルを整備し、運用担当者への教育を行うことにより、ヒューマンエラー…

SLM(Service Level Management)

SLAを達成・維持するために運営管理すること。サービスの提供者と利用者は、サービスレベルの状況を把握し、評価する。問題を共通認識し、その改善に向けて対応を行う。状況によっては、両者協議の上、SLAを改定する。

SLA(Service Level Agreement)

システム運用において、サービスの提供者と利用者がその品質について合意すること。サービスの内容と範囲・要求水準・役割分担・責任範囲・料金・要求水準未達成時の対応等を取り決める。これにより、サービスの提供者と利用者の共通認識が深まり、レベルの…

性能劣化の理由

データ量が増えた。 トランザクションが増えた。 トラフィックが増えた。 データベースのアクセスがロック待ちになっている。 データベースのアクセスでデッドロックが発生している。 データベースのアクセスパスの効率が悪い。 ハードディスクのI/Oエラーが…

ウェブサイト更新手順

バックアップを取る。 対象のページを更新した後、アップロードし、表示やリンク等の確認をする。 サイトマップを更新した後、アップロードし、表示やリンク等の確認をする。 前回の更新日の月が現在の月と異なっていたら、その月の更新履歴ページを新たに作…

基本ソフトウェアをバージョンアップする時の注意

該当バージョンのリリースノートを読み、変更点や改良点を確認する。 早目にβ版を入手し、アプリケーションの動作確認をする。 画面表示や帳票印字に問題がない事を確認する。 入力した内容が正しく表示される事を確認する。 既存のデータや新規入力したデー…

運用担当者への教育

運用マニュアルの整備 教育体系の整備 対象別教育計画の立案と実施 スキルレベルの体系化・認定制度の制定 スキルレベル認定試験の実施 運用担当者のモチベーション向上施策

ITIL(IT Infrastructure Library)

英国政府機関で開発された情報システム運用保守に関するITサービスマネジメントのフレームワーク。ITILはサービスサポート(日々の運用手法)とサービスデリバリ(中長期的な管理手法)からなる。このフレームワークをITプロセスに適用することにより、サー…

移行計画

移行期間 前提条件 移行範囲 移行対象 移行方針 移行体制 作業項目 作業内容 作業工数 優先順位 役割分担 移行手順 移行方法 移行ツール 制約条件 タイムチャート チェックリスト 検証対象 検証方法 検証ツール バックアップ リカバリー

品質とコスト

品質はコストと切り離して考えてはならない。品質確保にかけるコストに切りはないが、品質が原因で問題が起きた時の損失も考えるべきである。