O que é Big Data?

Potencialização do Big Data
VMware e Cloudera: trabalhando juntas para virtualizar o Hadoop.
Desmistificação da virtualização Hadoop
Conheça os fatos sobre a virtualização do Hadoop no vSphere.
Estudo de caso técnico: Adobe Systems
Adobe implanta o Hadoop como serviço no VMware vSphere
Obstáculos para o sucesso de projetos de Big Data
Restrições orçamentárias
As restrições orçamentárias e os custos são as principais razões pelas quais muitas empresas estão evitando a implantação de Big Data, de acordo com um estudo realizado pela Deloitte. Pode ser difícil justificar o investimento em novas infraestruturas de TI para processar grandes quantidades de dados, principalmente se a empresa ainda não tem um caso de negócios imediato.
Experiência em TI
O processamento das cargas de trabalho de Big Data é diferente do processamento das cargas de trabalho típicas de aplicativos corporativos. As cargas de trabalho de Big Data são processadas paralelamente, e não sequencialmente. Em geral, a TI prioriza as cargas de trabalho essenciais aos negócios e programa trabalhos com prioridade mais baixa para serem executados em lotes à noite ou quando há excesso de capacidade. Com as técnicas de análise de Big Data, muitos casos de uso devem ser executados em tempo real para que a análise e a reação também ocorram em tempo real. Isso força a equipe de TI a mudar as políticas do data center e conhecer novas ferramentas para criar, gerenciar e monitorar essas novas cargas de trabalho.
Dependência de plataforma
As empresas precisam escolher o tipo ideal de infraestrutura para executar seus aplicativos e dados. A aquisição de hardware leva tempo. Migrar para a nuvem pode ser ótimo para fins de validação técnica, mas traz consigo o risco do bloqueio de plataforma, preocupações com a segurança e um enorme custo em escala. As empresas também precisarão decidir qual distribuição do Hadoop adotarão, com a Cloudera, a Hortonworks, a MAPR e a Pivotal oferecendo todas as arquiteturas concorrentes (e incompatíveis). Há muitas decisões que, após serem tomadas, ficam difíceis de serem controladas mais tarde por uma empresa. Por esse motivo, muitas empresas simplesmente adiam a discussão sobre o Big Data.
Benefícios do VMware Big Data
Simples
Simplifique as operações e a manutenção de sua infraestrutura de big data.
Ágil
Obtenha sua infraestrutura sob demanda para que possa agregar rapidamente valor aos negócios.
Econômico
Reduza os custos de CapEx por meio da consolidação de cluster. Reduza os custos de OpEx por meio da automação e de fluxos de trabalho simples.
Flexível
Avalie as grandes tecnologias de Big Data o quanto antes e com frequência. A multilocação permite executar várias distribuições do Hadoop na mesma máquina virtual.
Eficiente
Agrupe os recursos e aumente a utilização do servidor. A automação da mobilidade de carga de trabalho contribui para a eficiência do processo.
Segura
Assegure o controle e a conformidade de seus dados confidenciais.
Hadoop em destaque
A função da infraestrutura, seja física ou virtual, é oferecer suporte a aplicativos. Isso inclui os tradicionais aplicativos essenciais aos negócios, bem como os modernos aplicativos móveis, em nuvem e de Big Data. O analista do setor, Doug Laney, definiu o Big Data em três Vs:
- Volume: terabytes, registros, transações, tabelas e arquivos
- Velocidade: lote, rapidez, tempo real e fluxos
- Variedade: estruturados, não estruturados e semiestruturados
O Apache Hadoop (também conhecido como Hadoop) é um software de código aberto usado para armazenamento distribuído e processamento de Big Data. O Hadoop foi empacotado e integrado em grandes distribuições por empresas como Cloudera, Hortonworks, MAPR e Pivotal para executar cargas de trabalho de Big Data. A virtualização de aplicativos de Big Data, como o Hadoop, oferece muitos benefícios que não podem ser obtidos na infraestrutura física ou na nuvem. A simplificação do gerenciamento da infraestrutura de Big Data acelera a obtenção dos resultados, tornando-o mais econômico. VMware é a melhor plataforma para Big Data, bem como para aplicativos tradicionais.