VMware のプラットフォームは、従来型アプリケーションに加えて、ビッグデータにも最適です。ビッグデータ用のアプリケーションを仮想化することで、ビッグデータのインフラストラクチャの管理が簡素化され、メリットを享受できるまでの時間を短縮でき、費用対効果が高くなります。

      

(9:44)

VMware と Cloudera:Hadoop の仮想化に向けた取り組み

ビッグデータに対する VMware の取り組みについてご確認ください

Hadoop の仮想化に関する誤った認識の解消

vSphere 上での Hadoop の仮想化に関する情報をご確認ください

資料を読む

技術事例:Adobe Systems

Adobe における VMware vSphere 上でのサービスとしての Hadoop の展開

詳細情報

ビッグデータとは


ビッグデータの急激な増加には目を見張るものがあり、場所を問わず絶え間なく発生しています。その膨大なデータは、コンピューター、スマートフォン、アプライアンス、機器などのシステムやデバイスから作り出され、蓄積されています。
 

そもそも、ビッグデータとはどのようなものでしょうか。ビッグデータとは、構造化データと非構造化データのセットを指す幅広い言葉です。非常に大量で複雑なため、従来のデータ処理アプリケーションやシステムでは適切に処理できません。また、予測分析の精度向上に使用されることが多く、データ セットを分析することで新たな相関関係を検出し、ビジネスの傾向の特定、病気の予防、犯罪の抑止などに利用できます。 

業界のアナリストである Doug Laney 氏は、ビッグデータを次の 3 つの「V」で定義しました。

  • Volume(データの量):テラバイト、レコード、トランザクション、テーブル、ファイル
  • Velocity(データの速度、頻度):バッチ、ニア リアルタイム、リアルタイム、ストリーム
  • Variety(データの多様性、種類):構造化、非構造化、準構造化

Apache Hadoop(Hadoop)は、分散ストレージやビッグデータの処理に使用される、オープンソースのソフトウェアです。Hadoop は、Cloudera、Hortonworks、MAPR、Pivotal などの企業が提供する大規模なディストリビューションにパッケージングおよび組み込まれており、ビッグデータのワークロードの実行に利用されています。

ビッグデータ プロジェクトの成功を阻む課題

 

企業がビッグデータ プロジェクトの実現において直面する問題には、予算の制約、IT の専門知識不足、プラットフォームの固定化のリスクなどがあります。

予算の制約

Deloitte の調査によると、予算の制約とコストの問題が、多くの企業がビッグデータの導入を断念する主な理由となっています。特にビジネスで迅速な投資対効果を上げていない場合、膨大なデータを処理するための新たな IT インフラストラクチャへの投資を正当化することが非常に難しくなります。

 

IT の専門知識

ビッグデータのワークロードの処理は、一般的なエンタープライズ アプリケーションのワークロードの処理とは異なり、連続的ではなく並行して処理されます。通常、IT 部門はビジネス クリティカルなワークロードを優先し、優先度が低いタスクは夜間のバッチ処理やキャパシティに余裕のある時間帯にスケジューリングします。ビッグデータの分析では、多くのユースケースをリアルタイムで実行して、分析と対応をリアルタイムで行います。そのため、IT 部門はデータセンターのポリシーを変更して、これらの新たなワークロードを作成、管理、および監視するための新しいツールの使用方法を習得する必要があります。

 

プラットフォームの固定化

アプリケーションやデータの実行には、適切な種類のインフラストラクチャの選択が必要です。ハードウェアの調達には時間がかかるため、クラウドへの移行は事前検証には適しているかもしれませんが、セキュリティに関する懸念事項と多額のコストを伴うプラットフォームの固定化のリスクが発生します。また、企業はどのベンダーから Hadoop を導入するかを選択する必要があります。Cloudera、Hortonworks、MAPR、および Pivotal などが提供しているのは、互換性のない競合アーキテクチャです。決定しなければならないことが多く、一度決定すると方針の転換が困難なため、多くの企業がビッグデータの導入を先延ばしにしています。

ビッグデータにおける VMware の役割

 

インフラストラクチャの役割は、物理であるか仮想であるかを問わず、アプリケーションをサポートすることです。アプリケーションには、従来のビジネス クリティカルなアプリケーションのほかに、最新のクラウド アプリケーション、モバイル アプリケーション、およびビッグデータ アプリケーションが含まれます。 

Hadoop のようなビッグデータ アプリケーションを仮想化することで、物理インフラストラクチャやクラウドでは得られない多くのメリットを享受することができるほか、ビッグデータのインフラストラクチャの管理を簡素化することで、メリットを享受できるまでの時間が短縮され、費用対効果を高めることができます。VMware のプラットフォームは、従来型アプリケーションと同じように、ビッグデータにも最適です。
 

VMware のビッグデータの特長

簡素化

ビッグデータのインフラストラクチャの運用とメンテナンスを簡素化します。

高い費用対効果

クラスタを統合することで設備投資コストを削減し、自動化とシンプルなワークフローによって運用コストを削減します。

俊敏性

インフラストラクチャをオンデマンドで入手できるため、ビジネス バリューを迅速に実現できます。

柔軟性

主要なビッグデータ テクノロジーを早期かつ頻繁に試用できます。マルチテナントにより、複数の Hadoop ディストリビューションを同一の仮想マシン上で実行できます。

効率性

リソースをプールしてサーバの使用率を向上させます。ワークロードを自動的に移動できるため、プロセスの効率が向上します。

安全性

機密データを管理し、コンプライアンスを確保します。