ビッグデータ (Big Data) とは

ビッグデータとは、大量の情報というそのままの意味であるが、具体的には、定型を持たない非構造化データのことである。非構造データとは、ようはデータベース化されていないものと考えると良い。例えば、住所、氏名、年齢というのは定型化されたデータであり、これがいくら増えようがビッグデータとは言わない。仮に、一日のトイレの回数というデータを加えたものがあったとしても、これはトイレの回数という項目が増えただけに過ぎないので、これもビッグデータとは言い難い。

では、ビッグデータとして考えられるのは、どのようなデータだろうか。先ほどのトイレの回数というデータがあったとして、そこに時間という軸があったとしよう。日々大量にそのデータが蓄積されていき、分析したところ、5分以上トイレにこもっている人は80%が大きい方かもしれないという、新しい概念が生まれてくるのだ。

つまり、ビッグデータとは、今はなにも価値を見出すことのできない垂れ流しのデータを蓄積し、何らかの切り口で分析することにより、新しい発見があるかもしれないデータのことを言うのである。

またトイレネタで申し訳ないが、トイレの扉にセンサーを付け、ビッグデータを蓄積する実験があったそうである。取得できるデータはトイレに人がいるかどうかだけの単純なデータだが、この実験で分かったのは、次の通りである。

  • 1.トイレの個室は奥の利用頻度が高い
  • 2.空いている場合は、隣を一つあけて利用することが多い
  • 3.スマホの利用可のオフィスのトイレの方が個室の利用時間が長い

この結果を受けて、あなたならどう考えるだろうか。トイレの清掃頻度を奥と手前では変えた方が効率化ができるかもしれないし、奇数偶数で清掃の頻度を変えることができるかもしれない。その他、”トイレにスマホは次の人の迷惑になるのでご使用をお控えください”と張り紙をすることで改善するかもしれない。

このような新しい発見がビッグデータにはあるのだ。ビッグデータをどう扱うか、どのように分析することで有益なものに繋がっていくのか、今後の動向を見守っていきたい。