前号: No 230 / 次号: No 232 / 一覧に戻る
前回まで、4回にわたって2021年2月28日のみずほ銀行のトラブル について解説をしてきました。 中でも目についたのは、組織内での情報伝達の難しさです。 みずほ銀行のトラブルは情報を迅速に洩れなく正しく伝えることの 難しさを如実に示しています。 今回は緊急時の情報伝達について注意すべき点を解説します。 なお、今回の「情報伝達のトリレンマ」は筆者の経験から導き 出した用語です。1. 情報伝達のトリレンマ
情報を他の人に伝える場合、次の三つの要素が大切です。 ・正確なこと ・早いこと ・洩れがないこと もちろん、この全てを満たせればそれに越したことはありませんが、 この三つを同時に満たすことはできません。 これは考えてみれば納得できる話です。 ・正確で網羅された報告 → 時間がかかる ・迅速で正確な報告 → 抜け洩れが発生しやすい ・迅速で洩れがない報告 → 情報確認が不十分になりやすい これを情報伝達のトリレンマと言います。 トリレンマというのは聞きなじみのない言葉ですが「ジレンマ」は ご存知の方も多いはず。 ジレンマ(dilemma)というのは、同時に満たせない二つの命題のこと で「二律背反」「あちらを立てればこちらが立たず」な状態です。 最初の"di-"は(元々)ギリシャ語の接頭詞で2つを示します。 その接頭詞を"tri-"(トリ)に変えると3つの意味になります。 デュオが二人組、トリオが三人組というのと同じです。 つまりトリレンマというのは三つの条件のうち二つまでは満たせる けれど、三つ同時には満たせないことを指します。2. どれを捨てるかが肝心
このトリレンマを意識することで、どのタイミングではどれを重視 し、どれをあきらめるかの指標が決められます。 例えば、財務諸表のような公式な情報開示では、正確さと網羅度が 重要で、時間はそれほど求められませんが、道端で倒れている人を 見つけた場合は、何よりも早さが重要で、正確さなどは二の次です。 何か想定外の事態が起きた時の報告方法はおおむね次の四つに集約 できます。 A) 早さを最重視:「とにかくスグに一報する」 B) 早さと正確さを重視:「内容を精査してから報告する」 C) 早さと網羅度を重視:「各所の情報を集めてから報告する」 D) 正確さ網羅度を重視:「各所から情報を集め、内容精査後に報告」 どれも情報伝達の三要素のどれかは満たせていません。 どれかを捨てているわけです。 どれが正解かは、報告の目的によって違ってくるのです。3. その報告は何のためなのか?
上記のA)〜D)の具体的な例を示しましょう。 日常運用を監視する部署では、日常運用から外れた事態が起きれば、 スグに管理部門に報告を行うのが一般的です。 これは上記のA)パターンです。 その報告を受けた管理部門は、他部門と連携を取ります。その時には 報告元に状況を確認した上での報告となります。 これは上記のB)のパターンになります。 その管理部門は各部門からの情報を集め、経営陣に決断を仰ぐ場合は 経営陣に報告をします。その内容はC)のパターンになります。 最終的に管理部門が作成するトラブル報告書は、D)パターンとなる ことが多いでしょう。 要は、報告のタイミングや目的によって、重視する点と捨てる点を 明確にしておくべきなのです。 実際、みずほ銀行の2021年2月28日のトラブルを見返しますと、情報 伝達時に正確さと網羅度を重視していた様子が見受けられます。 もちろん、トラブル時に迅速な連絡が重要なことは誰もがわかって いたはずです。それでも結果的に連絡が遅れがちだったのは、重視 するポイントが組織内で共有されていなかったためなのでしょう。4. やっぱり訓練は有効
前回の繰り返しになりますが、今回の視点でも事故発生時の訓練が 有効なのがわかります。 まず、組織として目標とする対応時間(事故発生から経営陣にその 内容が届き、経営陣として判断が下せるまでの時間)を定めます。 次に、そのためには誰がどのタイミングでどんな連絡をすれば良いか? を想定しておくわけです。 実際の訓練では各部署からの状況報告が内容・所要時間などの点で 目的を満たしているかを計ります。 訓練の実施後にその結果を踏まえて、目標の見直しや各部署の改善 要請を行います。 この計画/実施/見直しサイクルはPDC(Plan/Do/See)サイクルと 呼ばれますが、これを繰り返すことで組織としての対応力を磨くこと ができるのですね。5. (おまけ)用語解説:輻輳
今回のテーマが短かい目となりましたので、おまけの用語解説です。 2021年10月14日にNTT docomoで通信が繋りにくい(メールができない、 圏外になるなど)という事故が起きました。 その事故の原因として「ネットワーク輻輳」というあまり慣じみの ないコトバが出ていましたので、その解説をしておきます。 輻輳は「ふくそう」と読みます。どちらの文字も車扁(くるまへん) の文字で日常的に使う漢字ではありません。 筆者自身もネットワーク上でのトラブル用語としてしか使ったこと がなかったのですが、一般的な言葉だったようです。 辞書によりますと、「輻」は車のスポーク(自転車などのタイヤを 支える細い棒)のこと、「輳」は集まることだそうで、「輻輳」は 「一箇所に集中して混み合うこと」。 さて、ネットワークの輻輳も、確かに一箇所にデータが集中する ことなのですが、ネットワーク輻輳はさらにやっかいです。 ネットワーク上が混んでくると、サービスへの接続を拒否される 端末が出てきます。拒否された方はそれでは困りますから、再接続 しようとします。そうして拒否された端末が再接続しようとすると、 ただでさえ混んでいるネットワークにさらに通信量を増やすことに なり、ますます繋りにくくなりますので、またエラーになります。 エラーを端末に伝えるパケットもネットワーク上を流れるわけです から、ますますネットワーク上が混雑してきます。 こういった再接続とエラーのやりとりが増えてくると、それまで 問題なく通信できていた他の接続も巻き込まれてエラーになり始め ます。するとさらに再接続/エラーのパターンが増えてしまいます。 この状況が続くと、ネットワーク上には再接続依頼とエラー通信の パケットだけでいっぱいになってしまい、まともな通信ができなく なってしまいます。 この状態を「ネットワーク輻輳」と呼びます。 さて、上記の通りネットワーク輻輳は各端末が良かれと思って再接続 を続けることで悪化し、基本的には放置しても解消しません。 一方で、ネットワーク機器の設定をちょっと間違うだけで輻輳は簡単 に起きるものですので、ネットワーク運用担当にとって輻輳はやっかい なことこの上ない困った現象なのです。 今回はdocomo側がネットワーク上の接続制限を2時間以上にわたって 実施することでようやく沈静化できたようですが、それでも、この 事故の解消には10時間程度の時間を要したようです。(17時に発生、 翌日早朝5時に解消) 以上、「輻輳」についての解説でした。 次回もお楽しみに。 (本稿は 2021年10月に作成しました)