Smartstream データ品質担当グローバルヘッド、スティーブン・コッホ著
本ブログ記事では、Smartstreamのデータ品質担当グローバルヘッドであるスティーブン・コッホが、娘の医療保険請求が却下された個人的な経験を共有し、NASAのマーズ・クライメイト・オービターの失敗との共通点を引き出します。両方の状況に共通しているのは、不適切なデータ形式の影響であり、データ品質の極めて重要な役割を強調しています。スティーブンは、日付形式のエラーのような一見些細な不一致が、いかにプロセスを混乱させるかを浮き彫りにし、深刻な結果を招く可能性のあるエラーを防ぐために、正確なデータ形式と単位を確保することの重要性を強調しています。このブログでは、さまざまな文脈におけるデータ品質の広範な影響について、特にエラーがリスクへの曝露、ファンドのNAV(純資産価値)の誤計算、取引機会の逸失につながる可能性がある金融業界に焦点を当てて解説します。
米国以外にお住まいの方のために説明すると、米国の医療保険制度の大きな特徴の一つは、医師や医療施設を受診した後に、保険会社から「給付説明書(EOB)」が送られてくることです。EOBの役割は、保険契約の制限に基づき、どの処置に対して保険金が支払われ、どの処置に対して支払われないかを通知することです。却下または承認のそれぞれには、さまざまなコードと、各コードの意味についての簡潔な説明が添えられています。さらに、EOBには、異議申し立ての権利と手順に関する詳細な説明も含まれています。
医療保険
1週間ほど前、私は医療保険会社からEOBを受け取りました。いつもは後で確認するために取っておくのですが、なぜかその時はすぐに開封しました。その通知には、娘の最近の歯科検診代が支払われていないと記されていました。理由は、彼女が私のプランの対象外であるというものでした。そんなはずはないと思いました。手元にある保険証には、彼女の名前が被保険者としてはっきりと記載されていたからです。
最近プランが変更されたばかりだったので、歯科医院に新しいプラン情報を伝えていなかったのかと思い、電話して詳細を確認しました。すべて問題ありませんでした。彼らは正しい情報を持っており、本来なら何の問題もないはずでした。
次に、保険会社に連絡しました。保険会社の担当者は、娘が確かにアカウントに登録されており、行われた処置もプランの対象であることをすぐに確認しました。私の支払いは発生しないはずです。謎は深まりました。これは単純な修正では済まないようでした。プロセスのどこか別の場所で混乱が生じているに違いありません。さらに深く調査する必要がありました。
私は、失敗が起こり得た場所は3つあると推測しました。1つ目は歯科医院です。誰かが請求を誤って送った可能性があります。間違った請求コードを使用したかもしれないと思い、再度電話しました。請求内容を精査しましたが、却下につながるような原因は見当たりませんでした。却下理由は「プランの対象外」でしたが、プラン番号はすべて正しかったのです。2つ目は保険会社です。彼女がアカウントに登録されていることはすでに確認済みで、ウェブサイトでも私のポリシーに含まれていることを確認しました。保険会社のウェブサイトを検索し、プロセスが失敗した原因がないか探しました。
同時に、3つ目の場所である勤務先の福利厚生グループにも働きかけ始めました。彼らも、私がすでに把握していた内容をすべて認めました。請求が失敗する理由は見当たりませんでしたが、現実に失敗していたのです。この時点で私はこれ以上ないほど苛立っていましたが、本当の問題が何であるか、依然として見当もつきませんでした。
この問題に取り組んでいる間、予約が近づいているのにまだ確認していないことを思い出しました。EOBの問題追跡を一時中断し、主治医に電話をかけました。看護師はいつものように、本人確認から会話を始めました。「フルネームと生年月日を教えていただけますか?」生年月日。生年月日! 私はすぐに予約を確認して電話を切り、再び保険会社のウェブサイトを開きました。加入者ページにたどり着くまでクリックを続けると、そこに答えがありました。
米国式と欧州式の値形式
システム内の日付が間違っていたのです。彼女の誕生日は米国形式(MM/DD/YYYY)ではなく、欧州形式(DD/MM/YYYY)で入力されていました。この属性は欧州でシステムに入力されたもので、入力した人物はシステムが米国式の日付形式を使用していることに気づかなかったようです。生年月日は照合のための重要なフィールドであり、一致しなかったために却下がトリガーされました。その1つの日付を修正するだけで、プロセスは再び正常に動き出しました。
1998年12月、NASAはマーズ・クライメイト・オービターを打ち上げました。11か月後、探査機は火星に到達し、ミッション完了に向けた最終準備を開始する予定でした。この火星探査機は、火星の大気中にどれだけの水蒸気が含まれているかなど、気候に関連するいくつかの測定を行うことを目的としていました。残念ながら、そのミッションは壊滅的な失敗によって打ち切られました。探査機は惑星に衝突し、数百万ドルの探査機が破壊されたのです。
当初、ミッションチームは問題を見つけることができませんでした。どのシステムが故障したのか? 故障したシステムはないように見えました。では、墜落した理由は何だったのでしょうか?
数百万マイル離れた宇宙船を制御するのは困難な作業です。人間はその場での状況の変化に対応することには長けていますが、約3,400万マイル離れた場所で起こる変化に対応することには危険が伴います。まず、宇宙船からのデータが届くまでに、惑星の相対的な位置に応じて3分から5分かかります。データを受信すると、地上の人間が対応策を作成し、再び3分から5分かけて指示を送信する必要があります。その後、指示が機能したかどうか、機能しなかった場合はさらに何が必要かを判断するために、同じ時間待つ必要があります。
そのため、多くのシステムは、このような相互作用の必要性を制限するために可能な限り自動化されています。非常に重要な指示のみが、人間の介在のために保留されます。娘の請求の件と同様に、宇宙機関もすべての失敗のポイントを調査しました。特定の自動システムが故障したのか? 人間が手動コマンドの送信に失敗したのか? 無線信号が途絶えたのか? 材料の欠陥があったのか?
娘の請求の場合と同じく、問題は米国と世界のその他の地域との違いに関係していました。NASAは、世界の基準に合わせるために、基本単位をヤード・ポンド法(インチやフィート)からメートル法(センチメートルやメートル)に変更していました。探査機を火星の軌道に乗せるために減速させるシステムは、メートル法を使用してプログラムされていました。しかし、探査機に実際の指示を提供していたベンダーの1社が、ヤード・ポンド法で指示を送ってしまったのです。メートル法の数値として取り込まれたその指示により、探査機は目標軌道を下回り、火星の表面に衝突したことが判明しました。
正しい値、誤った形式
これらは全く異なる2つの状況です。しかし、すべてのデータセットに影響を与える共通の問題を示しています。データの値は正しくても、形式が間違っていることがあるのです。最初のケースでは、日付値の表示方法という単純なことが、堅牢なプロセスを損なう可能性があります。金融商品のために取得される日付データについても同じことが言えます。デリバティブと固定利付証券はどちらも、有効期限や満期日から発行日やクーポン日まで、日付を多用します。これらのいずれかに誤った日付を入力すると、あらゆる種類のリスクにさらされる可能性があります。アクティブな買い気配や売り気配がほとんどない債券価値の計算に使用される評価価格は、それらの評価を完了するために日付に大きく依存しています。ファンド会計士は、クーポンの発生を計算するために正確な日付を必要とします。トレーダーは、どの債券を購入するかを選択するために必要な、コール利回りや満期利回りなどのさまざまな利回りを把握するために日付を頼りにしています。
単位の間違いはデリバティブにとって致命的です。例えば、1,000ガロンを基準とする原油先物を購入する際、誤って1,000バレルと記されていると、決済価値は実際の価値の42倍になります。先物の価値計算がブッシェルあたりのセントであるのに、ブッシェルあたりのドルと記されている場合、クライアントに誤った証拠金請求(マージンコール)が届く可能性があります。
データは単なる値ではない
データは単なる値ではありません。文脈のない値には価値がありません。これらの例が示すように、形式や単位の大きさを間違えると、娘の歯科医のケースのような不快な思いから、数百万ドルの宇宙探査機の破壊のような壊滅的な損失まで、幅広い影響を及ぼします。金融の世界では、このようなエラーはリスクへの曝露、ヘッジファンドや投資信託のNAVの再計算、そして取引機会の逸失を招く可能性があるのです。

