VMware のプラットフォームは、従来のアプリケーションに加えて、ビッグ データにも最適です。ビッグ データ用のアプリケーションを仮想化することで、ビッグ データのインフラストラクチャの管理が簡素化され、メリットを享受できるまでの時間が短縮され、費用対効果が高くなります。

      

(9:45)

VMware と Cloudera 社: Hadoop の仮想化に向けた取り組み

ビッグ データに対する VMware の取り組みについてご確認ください

Hadoop の仮想化に関する誤った認識の解消

vSphere 上での Hadoop の仮想化に関する情報をご確認ください

今すぐ読む (英語)

技術事例: Adobe Systems 社

Adobe 社が VMware vSphere 上で Hadoop をサービスとして展開

詳細情報 (英語)

ビッグ データとは


ビッグ データの急激な増加には目を見張るものがあり、あらゆるところから、絶え間なく追加され続けています。コンピュータ、スマートフォン、アプライアンス、機器などのシステムやデバイスによって、膨大なデータ セットが作り出され、積み上げられています。

そもそも、ビッグ データとはどのようなものでしょうか。ビッグ データとは、構造化データと非構造化データのセットを指す幅広い言葉です。ビッグ データは非常に大量で複雑なため、従来のデータ処理アプリケーションやシステムでは適切に処理できません。ビッグ データは、予測分析の向上に使用されることが多く、データ セットを分析することで新たな相関関係を検出し、ビジネスの傾向の特定、病気の予防、犯罪撲滅などに役立てます。 

業界のアナリストである Doug Laney 氏は、ビッグ データを次の 3 つの 「V」 で定義しました。

  • Volume (データの量): テラバイト、レコード、トランザクション、テーブル、ファイル
  • Velocity (データの速度、頻度): バッチ、ニア リアルタイム、リアルタイム、ストリーム
  • Variety (データの多様性、種類): 構造化、非構造化、準構造化

Apache Hadoop (Hadoop) は、分散ストレージやビッグ データの処理に使用される、オープン ソースのソフトウェアです。Hadoop は、Cloudera 社、Hortonworks 社、MAPR 社、Pivotal 社などの企業が提供する大規模なディストリビューションにパッケージングおよび組み込まれており、ビッグ データのワークロードの実行に利用されています。

ビッグ データ プロジェクト成功の障壁

 

企業がビッグ データ プロジェクトの実現において直面する問題には、予算の制約、IT の専門知識不足、プラットフォームの固定化のリスクなどがあります。

予算の制約

Deloitte 社の調査によると、予算の制約とコストの問題が、多くの企業がビッグ データの導入を断念する主な理由となっています。理由から特にビジネスで迅速な投資対効果を上げていない場合、膨大なデータを処理するための新たな IT インフラストラクチャへの投資を正当化することが非常に難しくなります。

 

IT の専門知識

ビック データのワークロードの処理は、一般的なエンタープライズ アプリケーションのワークロードの処理とは異なります。ビッグ データのワークロードは、連続的ではなく並行して処理します。通常、IT 部門はビジネス クリティカルなワークロードを優先し、優先度が低いタスクは夜間のバッチ処理やキャパシティに余裕のある時間帯にスケジューリングします。ビッグ データの分析では、多くのユースケースをリアルタイムで実行して、分析と対応をリアルタイムで行います。そのため、IT 部門はデータセンターのポリシーを変更して、これらの新たなワークロードを作成、管理、および監視するための新しいツールの使用方法を習得する必要があります。

 

プラットフォームの固定化

企業は、アプリケーションやデータを実行するため、適切な種類のインフラストラクチャを選択する必要があります。ハードウェアの調達には時間がかかるため、クラウドへの移行は事前検証には適しているかもしれませんが、セキュリティに関する懸念事項と多額のコストを伴うプラットフォームの固定化のリスクが発生します。また、企業はどのベンダーから Hadoop を導入するかを選択する必要があります。Cloudera 社、Hortonworks 社、MAPR 社、および Pivotal 社が、互換性のない競合アーキテクチャを提供しています。決定しなければならないことが多く、一度決定すると方針の転換が困難なため、多くの企業がビッグ データの導入を先延ばしにしています。

ビッグ データにおける VMware の役割

 

インフラストラクチャの役割は、物理であるか仮想であるかを問わず、アプリケーションをサポートすることです。アプリケーションには、従来のビジネス クリティカルなアプリケーションのほかに、最新のクラウド アプリケーション、モバイル アプリケーション、およびビッグ データ アプリケーションが含まれます。 

Hadoop のようなビッグ データ アプリケーションを仮想化することで、物理インフラストラクチャやクラウドでは得られない多くのメリットを享受することができます。ビッグ データのインフラストラクチャの管理を簡素化することで、メリットを享受できるまでの時間が短縮され、費用対効果を高めることができます。VMware のプラットフォームは、従来のアプリケーションと同様に、ビッグ データにも最適です。

VMware のビッグ データの特長

簡素化

ビッグ データのインフラストラクチャの運用とメンテナンスを簡素化します。

高い費用対効果

クラスタを統合することで設備投資コストを削減し、自動化とシンプルなワークフローによって運用コストを削減します。

俊敏性

インフラストラクチャをオンデマンドで入手できるため、ビジネス バリューを迅速に実現できます。

柔軟性

主要なビッグ データ テクノロジーを早期かつ頻繁に試用できます。マルチテナントにより、複数の Hadoop ディストリビューションを同一の仮想マシン上で実行できます。

効率性

リソースをプールしてサーバの使用率を向上させます。ワークロードを自動的に移動できるため、プロセスの効率が向上します。

安全性

秘密データを管理し、コンプライアンスを確保します。

vSphere Big Data Extensions


VMware vSphere Big Data Extensions (BDE) は、vSphere プラットフォームでのビッグ データのワークロードの実行を簡素化し、新たなレベルの効率性と俊敏性を実現します。

ダウンロードはこちら

vSphere Big Data Extensions の特長

パフォーマンスを高めながら運用を簡素化

vCenter Server を使用して Hadoop クラスタをインストールおよび構成することができ、物理環境の構成と同様のパフォーマンスを実現することも可能です。

新規または既存のハードウェアのリソース使用率を最大化

規模の柔軟な調整と真のマルチテナントを提供するソリューションによって、リソースの使用を効率化できます。

拡張性と柔軟性に優れ、企業に最適なビッグデータ プラットフォーム

シームレスに拡張できる柔軟なプラットフォームを構築することで、企業におけるビッグデータの長期的な拡張に対応します。