ITとDATAのあいだ

ITとデータ分析についてのブログです

ビジネスにおけるデータ活用の勘所(1)最初は情報セキュリティ

データを活用するためにはデータを蓄積していかなければなりません。その大前提として情報セキュリティがあります。情報セキュリティを確保するのは、当たり前のことのように思えますが、情報セキュリティがおそろかになっているがゆえに、起こるはずのない問題が起こり得ます。それは単にセキュリティ上の問題だけではなく、データ分析をする時に問題が起こります。では情報セキュリティの観点から、どのようなデータ分析の問題が起こるのでしょうか。情報セキュリティには基本的な3つの指標があります。機密性、完全性、可用性です。これらの観点から起こり得る問題を考えたいと思います。
まずは機密性です。誰がどのデータにアクセスできるかがコントロールされている状態を機密性がある状態といいいます。例えば分析に使用したデータは、特別な理由がない限り変更があってはいけません。なぜなら分析した結果を用いて経営判断をした場合に、元のデータが変わっていたら、一度決定した経営判断が正しいかどうかを再検討する可能性が出てくるからです。その時に誰がどんな理由でデータを変更したかがわからなければ、データが変わっているがゆえに、分析そのものの信用性がなくなります。もしもデータが変更された理由がわかれば、その理由によっては分析結果に影響がないと判断して、経営判断は正しいということになるかもしれません。
しかし、そもそも分析に使ったデータが分析した後で変わるということがあってはならないのです。それが完全性です。英語ではIntegrityといいます。英語が得意な人にとってはIntegrityという言葉の方がしっくりくるかもしれません。データが間違っていない正しい状態を完全性がある状態といいます。分析後にデータが変わることはあってはなりません。また商品別の売上や部門別の売上などは、合計が会計のデータと一致しているべきですが、しばしば会計データと一致していないケースがあります。その理由はデータ取得のタイミングや売上の定義の問題など様々ですが、いずれの理由にせよ、会計データと整合する理由がなければ、完全性があるとは言えません。
また個人向けのサービスでは顧客の性別や年齢や住んでいる地域による分析をしたい場合があります。しかしこれらは個人情報なので容易にアクセスできる状態は好ましくありません。個人情報へのアクセスは厳密に管理されなければいけません。しかし分析するためには簡単にアクセスできた方がいいと言えます。したがって、個人情報保護法に遵守しながら、実際に個人情報の漏洩が発生しないような仕組みを構築しつつ、分析するためにはアクセスが容易にできる状態にあるのが可用性がある状態です。
データを活用するためには、情報セキュリティが前提にあり、機密性、完全性、可用性の3つが満たされていることが必要ですが、データ分析にはさらなる条件が必要です。それは次回以降で。