vSphere Big Data Extensions 2.2 | 4 juin 2015 | Build 2774463

Consultez ces notes de mise à jour afin de découvrir les nouveautés et les mises à jour.

Contenu des notes de mise à jour

Ces notes de mise à jour s'appliquent à vSphere Big Data Extensions 2.2 et traitent les thèmes suivants :

Nouveautés de vSphere Big Data Extensions 2.2

Big Data Extensions permet le déploiement rapide de clusters Hadoop sur une plate-forme virtuelle VMware vSphere. Cette version apporte les nouvelles fonctions et améliorations suivantes :

  • Gestion des noms de domaine complets. Dynamic DNS (DDNS ou DynDNS) est une méthode qui permet la mise à jour automatique d'un nom de serveur du système DNS (Domain Name System) avec la configuration DNS active de ses noms d'hôte configurés, adresses ou autres informations. Big Data Extensions s'intègre à un serveur Dynamic DNS de son réseau, au travers duquel il fournit des noms d'hôte significatifs aux nœuds d'un cluster Hadoop. Le cluster inscrit alors automatiquement ces noms d'hôte auprès du serveur DNS et offre ainsi un DNS correctement configuré à votre environnement Big Data Extensions.

    Les noms d'hôte vous permettent d'identifier les éléments plus facilement et d'utiliser des services tels que l'authentification unique, ce qui nécessite l'utilisation d'un DNS correctement configuré.

  • Gestion centralisée des utilisateurs. Vous pouvez spécifier un serveur Active Directory ou LDAP pour l'authentification des utilisateurs que vous pouvez ainsi gérer à partir d'un emplacement centralisé. Vous pouvez utiliser votre serveur Active Directory ou LDAP pour gérer les comptes des nœuds Serengeti Management Server et Hadoop générés par Big Data Extensions, ainsi que pour spécifier les comptes de votre serveur Active Directory ou LDAP comme comptes d'utilisateur Hadoop et/ou comptes de service.

  • Redimensionnement des clusters Hadoop à la demande.Vous pouvez réduire le nombre de machines virtuelles d'un cluster Hadoop en cours d'exécution et gérer ainsi les ressources de vos environnements VMware ESXi et vCenter Server. Les machines virtuelles sont supprimées, ce qui libère toutes les ressources, telles que la mémoire, l'UC et les E/S.

  • Augmentation des performances de clonage et de l'utilisation des ressources des machines virtuelles. Vous pouvez rapidement cloner et déployer des machines virtuelles à l'aide d'Instant Clone, une fonctionnalité de vSphere 6.0. À l'aide d'Instant Clone, une machine virtuelle parent est dupliquée, puis une machine virtuelle enfant (ou clone instantané) est créée. La machine virtuelle enfant tire profit du stockage et de la mémoire de la machine virtuelle parent, ce qui permet de réduire l'utilisation des ressources.

  • Journalisation centralisée avec vRealize Log Insight ou d'autres serveurs Syslog externes.Vous pouvez configurer Big Data Extensions afin d'utiliser un serveur Syslog externe (ou distant), tel que VMware vRealize Log Insight. Les serveurs Syslog externes permettent de gérer plus facilement les fichiers journaux et peuvent se révéler indispensables si vous devez afficher les fichiers journaux sur une machine non fiable.

  • Suspension de Big Data Extensions pour les procédures de sauvegarde et de maintenance. Vous pouvez suspendre Big Data Extensions afin de sauvegarder ou de restaurer en toute sécurité votre environnement, ou d'exécuter d'autres tâches de maintenance.

  • Prise en charge des distributions Hadoop les plus récentes. Big Data Extensions prend en charge Bigtop 0.8, Cloudera CDH 5.3, Hortonworks HDP 2.2, MapR 4.1 et Pivotal PHD 3.0.

  • Prise en charge des outils de gestion Hadoop partenaires les plus récents. Big Data Extensions prend en charge Cloudera Manager 5.3 et Ambari 1.7.

  • Possibilité de déployer différents types de clusters Hadoop. En plus des clusters Hadoop de base, Big Data Extensions vous permet de déployer des clusters HBase, des clusters MapReduce, des clusters de calcul uniquement, des clusters distincts de données et de calcul, et différents types de clusters personnalisés pour répondre à vos besoins.

  • Prise en charge d'EMC Isilon OneFS 7.2. Big Data Extensions offre un processus automatisé pour déployer et gérer les clusters de calcul uniquement sur EMC Isilon OneFS 7.2.

  • Prise en charge multilingue. Big Data Extensions est traduit en six langues : chinois (simplifié), chinois (traditionnel), français, allemand, coréen et japonais. Grâce à cette prise en charge multilingue, vous pouvez facilement accéder à l'interface Web et à la documentation, intégralement traduites.

  • Mise à niveau de Big Data Extensions. Vous pouvez mettre à niveau Big Data Extensions 2.1 vers la version actuelle, Big Data Extensions 2.2, tout en conservant l'ensemble des données des clusters créés dans Big Data Extensions. La totalité de vos clusters existants peut être gérée par Big Data Extensions 2.2 une fois la mise à niveau terminée.


Notice d'installation pour cette version

Pour obtenir des instructions détaillées sur l'installation et la configuration de Big Data Extensions, consultez la documentation vSphere Big Data Extensions.
 
  • Si vous utilisez actuellement Big Data Extensions 1.x ou 2.0 et que vous voulez procéder à la mise à niveau vers la version 2.2, vous devez d'abord effectuer la mise à niveau vers la version 2.1, puis la mise à niveau vers la version 2.2. Vous ne pouvez pas mettre directement à niveau Big Data Extensions 1.x ou 2.0 vers la version 2.2.

  • Virtual Update Manager (VUM) n'est pas en mesure d'effectuer la mise à niveau de Big Data Extensions 2.1 vApp vers Big Data Extensions 2.2 vApp. Pour plus d'informations sur ce problème, consultez KB #2118702.

    Problèmes résolus

    Les problèmes suivants ont été résolus pour Big Data Extensions 2.2.

    • Big Data Extensions ne prend en charge que l'inscription d'un seul serveur vCenter Server.
    • L'utilisation de plusieurs serveurs vCenter Server n'entraîne plus de problèmes au sein de votre déploiement.

    • Big Data Extensions ne peut pas formater les disques VMDK dont la taille est supérieure à 2 To.
    • Jusqu'à présent, lorsque vous déployiez un disque VMDK dont la taille était supérieure à 2 To, le format utilisé était exclusivement 2 To. Vous pouvez désormais formater les disques VMDK dont la taille est supérieure à 2 To et utiliser la capacité de stockage accrue.

    • Impossibilité de configurer la topologie Hadoop lors de l'utilisation d'Ambari.

      Jusqu'à présent, si vous utilisiez le gestionnaire d'applications Ambari, vous ne pouviez pas configurer la topologie de votre cluster Hadoop. Désormais, vous pouvez améliorer l'équilibrage de la charge de travail entre vos nœuds de cluster, ce qui accroît les performances et le débit, en utilisant Ambari pour spécifier comment les machines virtuelles Hadoop sont placées à l'aide de la reconnaissance de la topologie.

    • Échec du déploiement des clusters par Big Data Extensions quand vCenter Server contient des centres de données vides.

      Désormais, vous pouvez créer un cluster Big Data sur un centre de données vCenter Server avec des hôtes vides.

    • Les valeurs de configuration affichées dans l'interface graphique utilisateur de Big Data Extensions peuvent ne pas être mises à jour avec les valeurs du fichier de spécification du cluster.

      Cette situation se produit lorsque vous créez un fichier de spécification de cluster personnalisé à l'aide de l'interface de ligne de commande Serengeti et que vous utilisez l'interface graphique utilisateur de Big Data Extensions pour déployer le cluster. Les valeurs de configuration affichées dans l'interface graphique utilisateur peuvent ne pas correspondre à celles du fichier de spécification du cluster.

    • Lors du redémarrage de Big Data Extensions, le montage des disques de données avec l'option Linux noatime échoue.

      L'option de montage Linux standard, noatime, est spécifiée lors du montage du système de fichiers, ce qui désactive les mises à jour atime sur le système de fichiers spécifié. L'utilisation de l'option noatime pour monter les disques de données dans Big Data Extensions offre une amélioration significative des performances.

    Problèmes connus

    Les problèmes suivants de Big Data Extensions 2.2 ont déjà été identifiés. Si vous rencontrez un problème qui ne figure pas dans cette liste, consultez la Base de connaissances VMware ou contactez le support technique VMware.

    • Échec des tâches Apache Pig lors de l'utilisation de Cloudera CDH 5.2.

      Lors de l'exécution d'une tâche Apache Pig dans un cluster créé avec la distribution Cloudera CDH 5.2, Pig échoue avec le message d'erreur suivant : Veuillez initialiser HCAT_HOME.

      Solution : remplacez le Pig RPM de votre référentiel Yum CDH 5.2.0 local par le Pig RPM du référentiel Yum CDH 5.3.0 officiel, puis exécutez la commande createrepo pour réindexer le référentiel Yum.

    • Échec de l'installation de Big Data Extensions si le nom d'utilisateur de l'utilisateur connecté contient des caractères non-ASCII.
      Si le nom d'utilisateur de l'utilisateur connecté à Big Data Extensions contient des caractères non-ASCII, l'installation de Big Data Extensions échoue avec le message d'erreur suivant : Une erreur interne s'est produite - Erreur #1009.

      Solution : connectez-vous avec un nom d'utilisateur qui contient uniquement des caractères au format ASCII, puis relancez l'installation.

    • Les versions allemande et française du client de l'interface de ligne de commande Serengeti affichent les caractères non-ASCII sous forme de points d'interrogation.

      Lors de l'exécution des versions allemande et française de l'interface de ligne de commande Serengeti à partir d'une console de commandes Windows, les caractères non-ASCII s'affichent sous forme de points d'interrogation.

      Solution : utilisez uniquement les caractères ASCII pour les noms d'utilisateur, les étiquettes d'objet et les valeurs de configuration au sein de votre environnement Big Data Extensions lorsque vous utilisez la version allemande ou française de l'interface de ligne de commande Serengeti.




  •