VMware 是巨量資料和傳統應用程式的最佳平台。將巨量資料應用程式虛擬化可為您簡化巨量資料基礎架構的管理,更快獲得結果,而且成本效益更高。

      

(9:45)

VMware 與 Cloudera:共同合作將 Hadoop 虛擬化

觀看 VMware 如何讓巨量資料發揮其功能

破除對於 Hadoop 虛擬化的迷思

瞭解在 vSphere 上將 Hadoop 虛擬化的事實數據

立即閱讀

技術個案研究:Adobe Systems

Adobe 將 Hadoop 即服務部署在 VMware vSphere 上

深入瞭解

巨量資料是什麼


巨量資料量的成長極為龐大,而且每天無時無刻從四面八方而來。包括電腦、智慧型手機、應用裝置和設備在內的系統和裝置會不斷產生龐大的資料,而且會從現有的龐大資料集繼續產生資料。
 

但是巨量資料究竟是什麼?巨量資料是一個泛稱,泛指龐大程度和複雜度高到傳統資料處理應用程式和系統無法充分處理的結構化和非結構化資料集。巨量資料通常提供增強預測性分析的信度和效度。資料集分析是用於找出新的相關性,以看出商業趨勢、預防疾病、打擊犯罪,以及更多其他用途。
 

產業分析師 Doug Laney 以三 V 定義巨量資料:

  • 資料量 (Volume):兆位元組數、記錄數、交易數、表格數和檔案數
  • 速度 (Velocity):批次、近時、即時和資料流處理速度
  • 多樣性 (Variety):結構化、非結構化和半結構化資料

Apache Hadoop (又稱為 Hadoop) 是一套開放式原始碼軟體,用於巨量資料的分散式儲存和處理。Cloudera、Hortonworks、MAPR 和 Pivotal 等公司已將 Hadoop 封裝和整合到大型散發軟體 (又稱為 Distro) 內,以執行巨量資料工作負載。

巨量資料專案成功執行的阻礙

 

公司在執行巨量資料專案時常會遇到阻礙。這些阻礙可能包括預算有限、缺少 IT 專業知識,以及侷限於特定平台的風險。

預算有限

根據 Deloitte 的研究顯示,預算有限和成本考量是許多公司遲遲不願部署巨量資料的兩個首要原因。要說服公司高層投資新的 IT 基礎架構以處理大量資料可能極為困難,尤其當公司沒有這方面的立即業務需求時。

 

IT 專業知識

處理巨量資料工作負載不同於處理典型的企業應用程式工作負載。巨量資料工作負載的處理方式為並行式,而非循序式。IT 一般會排定關鍵業務工作負載的處理優先順序,並將優先性較低的工作排在夜間或有多餘容量時再處理。反觀,在進行巨量資料分析時,必須即時執行許多使用情境,才能即時分析和反應。這會導致 IT 不得不變更資料中心內的作業原則,並學會使用新的工具,才能建立、管理和監控這些新的工作負載。

 

侷限於特定平台

公司需要選擇能執行其應用程式和資料的適合基礎架構類型。但是,採購硬體需要時間。採用雲端可能極適合概念驗證,但卻有侷限於特定平台的風險、連帶的安全顧慮,以及在大規模採用時會產生極大成本。公司也必須決定選擇哪一種 Hadoop 散發軟體,Cloudera、Hortonworks、MAPR 和 Pivotal 目前都提供競爭 (而且互不相容的) 架構。有許多決定都是一旦做出決定後,公司在之後就難以轉換,所以才會有這麼多公司乾脆先暫緩討論巨量資料事宜。

VMware 在巨量資料領域扮演的角色

 

基礎架構無論是實體或虛擬,所扮演的角色都是支援應用程式。所支援的應用程式涵蓋傳統的關鍵業務應用程式,以及新穎的雲端、行動和巨量資料應用程式。
 

將 Hadoop 這類巨量資料應用程式虛擬化,會提供許多在實體基礎架構或雲端上均無法獲得的效益。簡化巨量資料基礎架構的管理能更快獲得結果,讓管理的成本效益更高。VMware 是巨量資料的最佳平台,效能如同之於傳統應用程式。
 

VMware 巨量資料

簡單

為您簡化巨量資料基礎架構的運作和維護。

具成本效益

能透過叢集整合降低資金支出成本。透過自動化和簡單的工作流程降低營運成本。

機動靈活

讓您的基礎架構能隨選應變,這樣您就能快速提供業務價值。

靈活有彈性

會及早和經常試用重大的巨量資料技術。多租戶讓您能在同一個虛擬機上執行多個 Hadoop 散發軟體。

效率卓越

能將您的資源分區集中,並提高伺服器利用率。工作負載行動化自動化功能會提高處理流程的效率。

安全

確保您的敏感資料受到控制且合規。

在 vSphere 上將 Hadoop 虛擬化 – 個案研究與白皮書

vSphere Big Data Extensions


VMware vSphere Big Data Extensions (BDE) 會簡化在 vSphere 平台上執行巨量資料工作負載的程序,將效率和靈活性提升至全新境界。

立即下載

vSphere Big Data Extensions 的功能

能達到作業簡便性與效能兼具

用 vCenter 安裝和設定 Hadoop 叢集,就能達到媲美實體部署組態設定的效能。

能讓新舊硬體上的資源達到最高利用率

透過一個提供彈性延展和真正多租戶的解決方案,能有效率地利用資源。

能為企業架構出兼具延展性和靈活性的巨量資料平台

會建置出一個彈性平台,不但能順暢延展,更能依照企業預期的巨量資料長期成長量,來定位巨量資料。