VMware는 기존 애플리케이션뿐만 아니라 빅데이터에도 가장 적합한 플랫폼입니다. 빅데이터 애플리케이션을 가상화하면 빅데이터 인프라 관리를 간소화하고 더 빠르게 결과를 제공하며 비용 효율성을 높일 수 있습니다.

      

(9:45)

VMware 및 Cloudera: 긴밀한 협력을 통해 Hadoop 가상화

VMware의 빅데이터 지원 방식 알아보기

Hadoop 가상화에 대한 선입견을 뒤집는 사실

vSphere 기반 Hadoop 가상화에 대한 주요 정보

지금 읽기

기술 고객 사례: Adobe Systems

VMware vSphere 기반의 Hadoop as a Service를 구축하는 Adobe

자세한 정보

빅데이터란?


빅데이터의 볼륨이 매일 매 순간 모든 곳에서 크게 증가하고 있습니다. 컴퓨터, 스마트폰, 어플라이언스, 장비를 비롯한 시스템과 기기 역시 기존 데이터 세트를 기반으로 생성되고 있습니다.
 

그렇다면 빅데이터란 무엇일까요? 빅데이터는 기존의 데이터 처리 애플리케이션 및 시스템에서 제대로 처리할 수 없을 정도로 규모가 크고 복잡한 정형 및 비정형 데이터 세트에 광범위하게 사용되는 용어입니다. 빅데이터는 종종 예측 분석을 제공합니다. 데이터 세트의 분석은 비즈니스 동향을 파악하고 질병을 예방하며 범죄를 퇴치하기 위해 새로운 상관 관계를 찾는 데 사용됩니다. 
 

업계 애널리스트인 Doug Laney가 다음 세 가지 V로 빅데이터를 정의했습니다.

  • 볼륨(Volume): 테라바이트, 기록, 트랜잭션, 테이블, 파일
  • 속도(Velocity): 일괄 처리, 단시간, 실시간, 스트림
  • 다양성(Variety): 정형, 비정형, 반정형

Apache Hadoop(별칭 Hadoop)은 분산 스토리지와 빅데이터 처리에 사용되는 오픈 소스 소프트웨어입니다. Hadoop은 Cloudera, Hortonworks, MAPR, Pivotal 같은 기업에서 빅데이터 워크로드를 실행하기 위해 대규모 배포(별칭 distros)에 패키지로 구성하여 통합했습니다.

성공적인 빅데이터 프로젝트에 대한 걸림돌

 

기업에서 빅데이터 프로젝트를 구현할 때 예산 제약, IT 전문성 결여, 플랫폼 종속 리스크 등의 걸림돌을 만나는 일이 종종 발생합니다.

예산상의 제약

Deloitte에서 실시한 연구에 따르면 많은 기업에서 빅데이터 구축을 꺼리는 가장 큰 이유가 바로 예산상의 제약과 비용입니다. 특히 즉각적인 비즈니스 사례가 없다면 대량 데이터를 처리할 새로운 IT 인프라에 대한 투자를 정당화하기가 쉽지 않을 수 있습니다.

 

IT 전문성

빅데이터 워크로드를 처리하는 것은 일반적인 엔터프라이즈 애플리케이션 워크로드를 처리하는 것과 다릅니다. 빅데이터 워크로드는 순차적으로 처리되는 것이 아니라 병렬로 처리됩니다. IT는 일반적으로 비즈니스 크리티컬 워크로드에 우선 순위를 지정하고 우선 순위가 낮은 작업에 대해서는 야간이나 초과 용량이 있을 때 일괄 처리하도록 예약합니다. 빅데이터 분석에서는 라이브 분석 및 대응을 위해 많은 사용 사례를 실시간으로 실행해야 합니다. 따라서 IT는 데이터 센터 정책을 변경하고 새로운 툴을 학습하여 새로운 워크로드를 생성하고 관리 및 모니터링해야 합니다.

 

플랫폼 종속

기업에서는 애플리케이션과 데이터를 실행하는 데 적합한 유형의 인프라를 선택해야 합니다. 하드웨어를 조달하는 데는 상당한 시간이 소요됩니다. 클라우드로 전환하면 개념 검증(POC)에는 효과적일 수 있지만 플랫폼의 제한을 받게 되는 리스크가 있고 보안 문제와 함께 규모에 따라 어마어마한 비용 문제가 발생합니다. 또한 기업에서는 상충되는(호환되지 않는) 아키텍처를 제공하는 Cloudera, Hortonworks, MAPR, Pivotal을 기반으로 Hadoop 배포 버전을 결정해야 합니다. 이 외에도 많은 사항을 결정해야 하는데, 한 번 결정되면 나중에 변경하기가 쉽지 않으므로 많은 기업에서 빅데이터 전환을 늦추고 있습니다.

빅데이터에서 VMware의 역할

 

물리적 인프라든 가상 인프라든 인프라의 역할은 애플리케이션을 지원하는 것입니다. 여기에는 기존의 비즈니스 크리티컬 애플리케이션뿐만 아니라 최신 클라우드, 모바일 및 빅데이터 애플리케이션도 포함됩니다. 
 

Hadoop같이 빅데이터 애플리케이션을 가상화하면 물리적 인프라나 클라우드에서는 제공하지 않는 많은 이점을 얻을 수 있습니다. 빅데이터 인프라 관리를 간소화하면 결과를 더 빠르게 도출할 수 있으므로 비용 효율성을 높일 수 있습니다. VMware는 기존 애플리케이션과 마찬가지로 빅데이터에도 가장 적합한 플랫폼입니다.
 

VMware 빅데이터

간편성

빅데이터 인프라의 운영 및 유지 보수를 간소화합니다.

비용 효율적

클러스터 통합을 통해 자본 비용을 절감하고 자동화 및 간단한 워크플로우를 통해 운영 비용을 절감합니다.

대응력

비즈니스 가치를 신속하게 제공할 수 있도록 온디맨드로 인프라를 구축합니다.

유연성

주요 빅데이터 기술을 초기 단계에 자주 사용해 볼 수 있습니다. 멀티 테넌시를 통해 동일한 가상 머신에서 여러 Hadoop 배포를 실행할 수 있습니다.

효율적

리소스를 풀링하고 서버 활용도를 늘립니다. 워크로드 모빌리티를 자동화하여 프로세스 효율성을 높입니다.

보안

중요 데이터의 제어 및 규정 준수를 보장합니다.

vSphere Big Data Extensions


VMware vSphere Big Data Extensions(BDE)는 vSphere 플랫폼에서 빅데이터 워크로드 실행을 간소화하여 새로운 차원의 효율성과 대응력을 제공합니다.

지금 다운로드

vSphere Big Data Extensions의 기능

성능으로 운영 간소화 실현

vCenter를 사용하여 물리적 구축 구성에 필적하는 성능을 제공하는 Hadoop 클러스터를 설치 및 구성할 수 있습니다.

신규 또는 기존 하드웨어에서 리소스 활용도 극대화

탄력적인 확장성과 진정한 멀티 테넌시를 가능하게 하는 솔루션을 통해 리소스 효율성을 확보할 수 있습니다.

아키텍트가 확장할 수 있는 유연한 기업용 빅데이터 플랫폼

기업의 장기적 성장을 위해 원활하게 확장할 수 있는 유연한 플랫폼을 구축하고 빅데이터를 포지셔닝합니다.