第6回・ビッグデータ
ビッグデータとは、従来の並列データベース管理システム(DBMS)では扱うのが難しい大量のデータのことです。一般的には、ペタバイト(PB)級以上の非定型のデータで、かつリアルタイム性の高いものを指します。具体例としては、WebサーバのログやSNSに投稿されたテキストデータなどがあげられます。ただし、統一された明確な定義はなく、リアルタイム性はあるものの定型データであるPOSなどのトランザクションデータや、非定型データではあるもののリアルタイム性のない音声や動画などのマルチメディアアーカイブなどもビッグデータに含めることが多いようです。
ビッグデータが注目される背景には、ソーシャルメディアとモバイル端末の急速な普及によって、インターネットのデータトラフィック量が爆発的に増加していることがあります。南カリフォルニア大学の研究チームによると、現時点で世界中に保持しているデータ総量は295エクサバイト(EB)に達していますが、アメリカCisco Systemsの予測では、2016年にはモバイルインターネットのトラフィック量だけで年間130EBに膨らむ見込みです。すべてがデータとして保持されるわけではありませんが、モバイル端末から莫大な量のデータが生成され続けることは間違いありません。
ビッグデータの活用で先行しているのは、GoogleやAmazonなどのネット関連企業です。たとえば、Google翻訳では辞書データベースを搭載する代わりに、膨大な文書の原文と翻訳文のデータを分析して翻訳結果を生成します。いわば、ビッグデータのマイニングによって実現されているサービスと表現できます。ビッグデータのマーケティング活用の例としては、あらゆる行動データを蓄積したライフログを解析することで、リアルタイムのレコメンデーションやインターネット広告の最適化など、オーディエンスターゲティングのさらなる高度化が期待できます。
ビッグデータを扱うデータベースとしては、Facebookが開発した後、2008年にオープンソースとして公開された分散キーバリュー型データストア「Cassandra」や、Apacheソフトウェア財団によって開発されたJavaソフトウェアフレームワーク「Hadoop」などが有名です。Cassandraは、Facebookがメッセージ検索機能Inbox Searchに使用しているほか、Twitterの位置情報のデータ保管、人気ツイート一覧のリアルタイム分析などでも導入されています。Hadoopは、Yahoo!をはじめFacebookやFox Interactive Media、Last.fmなど多くのネット関連企業で活用されています。
| キーワード | ビッグデータ |
| 概要 | ペタバイト(PB)級以上の非定型のデータで、かつリアルタイム性の高い、従来の並列データベース管理システム(DBMS)では扱うのが難しい大量のデータ。具体例としては、WebサーバのログやSNSに投稿されたテキストデータなどがあげられる。 |
| 注目の背景 | ソーシャルメディアとモバイル端末の急速な普及によって、インターネットのデータトラフィック量が爆発的に増加。アメリカCisco Systemsの予測では、2016年にはモバイルインターネットのトラフィック量だけで年間130EBに膨らむ見込み。 |
| 今後の予想 | アメリカではビッグデータの活用がGoogleやAmazon、Facebook、Twitterなどネット関連企業を中心に普及しつつある。日本でも、ビッグデータ分析に使われるコンテンツ分析ツールは、2015年までの5年間に年平均27.2%の高い成長率が見込まれている。 |
ビッグデータの分析は、アメリカでは「ビッグマス(big mathematics)」と呼ばれますが、日本でもビッグデータ分析をビジネスチャンスと捉える企業が増えてきています。日本経済新聞の報道によると、日本IBMやNTTデータなどがビッグデータの分析ができる人材の育成を本格化させていることがわかりました。IDC Japanが発表したビジネスアナリティクス(BA)ソフトウェアの市場予測では、ビッグデータ分析に使われるコンテンツ分析ツールは、まだ市場規模自体は小さいものの2015年までの5年間に年平均27.2%の高い成長率が見込まれています。
-----------------------------------------------------------------
◎初出:2012年2月20日
-----------------------------------------------------------------
| 固定リンク

