vSphere Big Data Extensions 2.2 | 4. Juni 2015 | Build 2774463

In den Versionshinweisen ist angegeben, welche Funktionen neu hinzugekommen sind bzw. aktualisiert wurden.

Inhalt dieser Versionshinweise

In diesen Versionshinweisen zu vSphere Big Data Extensions 2.2 werden die folgenden Themen behandelt:

Neuigkeiten in vSphere Big Data Extensions 2.2

Big Data Extensions ermöglicht die schnelle Bereitstellung von Hadoop-Clustern in einer virtuellen Plattform mit VMware vSphere. Diese Version beinhaltet die folgenden neuen Funktionen und Erweiterungen:

  • Management von vollqualifizierten Domänennamen: Dynamisches DNS (DDNS bzw. DynDNS) ist eine Methode der automatischen Aktualisierung eines Namenservers im Domain Name System (DNS) mit der aktiven DNS-Konfiguration der konfigurierten Hostnamen, Adressen und sonstigen Informationen. Big Data Extensions ist in einen DDNS-Server im Netzwerk integriert. Über diesen Server werden sinnvolle Hostnamen für die Knoten in einem Hadoop-Cluster bereitgestellt. Der Cluster registriert anschließend automatisch die Hostnamen beim DNS-Server und stellt damit ein ordnungsgemäß konfiguriertes DNS für die Big Data Extensions-Umgebung bereit.

    Hostnamen bieten den Vorteil, dass sie leichter zu erkennen sind und die Nutzung von Services wie Single Sign-On ermöglichen. Hierfür ist wiederum ein ordnungsgemäß konfiguriertes DNS erforderlich.

  • Zentrales Anwendermanagement: Sie können einen Active Directory- bzw. LDAP-Server für die Anwenderauthentifizierung angeben und damit die Anwender von einem zentralen Ort aus verwalten. Mit dem Active Directory- bzw. LDAP-Server können Sie Konten auf dem Serengeti Management Server und auf von Big Data Extensions erzeugten Hadoop-Knoten verwalten und Konten auf dem Active Directory- bzw. LDAP-Server als Hadoop-Benutzer- oder -Servicekonten festlegen.

  • Bedarfsweise Neufestlegung der Hadoop-Cluster-Größe:Sie können die Zahl der virtuellen Maschinen in einem laufenden Hadoop-Cluster reduzieren und damit die Ressourcen in den VMware ESXi- und vCenter Server-Umgebungen verwalten. Die virtuellen Maschinen werden gelöscht. Dabei werden sämtliche Ressourcen wie Arbeitsspeicher, CPU und E/A freigegeben.

  • Optimierung der Cloning-Performance und der Ressourcennutzung virtueller Maschinen: Mit Instant Clone, einer Funktion von vSphere 6.0, können Sie in kürzester Zeit virtuelle Maschinen klonen und bereitstellen. Bei Instant Clone wird aus der Verzweigung einer übergeordneten virtuellen Maschine eine untergeordnete virtuelle Maschine (ein sogenannter Instant Clone) erstellt. Die untergeordnete virtuelle Maschine nutzt den Storage und den Arbeitsspeicher des übergeordneten Elements und senkt damit die Ressourcennutzung.

  • Zentrale Anmeldung mit vRealize Log Insight oder anderen externen Syslog-Servern:Sie können Big Data Extensions so konfigurieren, dass ein externer (bzw. Remote-)Syslog-Server wie VMware vRealize Log Insight verwendet wird. Externe Syslog-Server ermöglichen ein einfacheres Management von Protokolldateien und sind unter Umständen eine wichtige Funktion, wenn Sie Protokolldateien auf einem befallenen Computer einsehen möchten.

  • Quiescing von Big Data Extensions für Backup- und Wartungsverfahren: Durch das Quiescing von Big Data Extensions können Sie Ihre Umgebung gefahrlos sichern und wiederherstellen oder andere Wartungsaufgaben durchführen.

  • Unterstützung für die neuesten Hadoop-Distributionen: Big Data Extensions unterstützt Bigtop 0.8, Cloudera CDH 5.3, Hortonworks HDP 2.2, MapR 4.1 und Pivotal PHD 3.0.

  • Unterstützung der neuesten Partner-Management-Tools. Big Data Extensions unterstützt Cloudera Manager 5.3 und Ambari 1.7.

  • Möglichkeit zur Bereitstellung von Hadoop-Clustern: Zusätzlich zu den einfachen Hadoop-Clustern können Sie mit Big Data Extensions HBase-Cluster, MapReduce-Cluster, reine Rechen-Cluster, separate Daten-Rechen-Cluster und verschiedene Variationen individueller Cluster-Typen für Ihre Anforderungen bereitstellen.

  • Unterstützung für EMC Isilon OneFS 7.2: Big Data Extensions bietet einen automatisierten Prozess zur Bereitstellung und Verwaltung von reinen Rechen-Clustern auf EMC Isilon OneFS 7.2.

  • Unterstützung in verschiedenen Sprachen: Big Data Extensions ist neben Englisch in sechs weiteren Sprachen erhältlich: Chinesisch (vereinfacht), Chinesisch (traditionell), Französisch, Deutsch, Koreanisch und Japanisch. Diese zusätzliche Sprachunterstützung bietet einen einfachen Zugriff auf eine vollständig übersetzte Webschnittstelle und die Dokumentation.

  • Big Data Extensions-Upgrade: Sie können ein Upgrade von Big Data Extensions 2.1 auf die aktuelle Version (Big Data Extensions 2.2) durchführen und sämtliche Daten aus den in Big Data Extensions erstellten Clustern speichern. Sämtliche vorhandenen Cluster können nach Abschluss des Upgrades von Big Data Extensions 2.2 verwaltet werden.


Installationshinweise für diese Version

Eine Schritt-für-Schritt-Anleitung zur Installation und Konfiguration von Big Data Extensions finden Sie in der Dokumentation zu vSphere Big Data Extensions.
 
  • Falls Sie zurzeit Big Data Extensions 1.x oder 2.0 installiert haben und ein Upgrade auf Version 2.2 durchführen möchten, müssen Sie zuerst ein Upgrade auf Version 2.1 und anschließend auf Version 2.2 durchführen. Ein direktes Upgrade von Big Data Extensions 1.x oder 2.0 auf Version 2.2 ist nicht möglich.

  • Virtual Update Manager (VUM) kann kein Upgrade der vApp von Big Data Extensions 2.1 auf die vApp von Big Data Extensions 2.2 durchführen. Weitere Informationen zu diesem Problem finden Sie unter KB #2118702.

    Behobene Probleme

    Die folgenden Probleme wurden bei Big Data Extensions 2.2 behoben:

    • Big Data Extensions unterstützt die Registrierung von nur einem vCenter Server.
    • Die Nutzung mehrerer vCenter Server verursacht keine Probleme mehr mit der Bereitstellung.

    • Mit Big Data Extensions können keine VMDKs mit einer Größe von über 2 TB formatiert werden.
    • Bislang wurden bei der Bereitstellung von VMDKs mit einer Größe von über 2 TB dennoch nur 2 TB formatiert. Ab sofort können Sie VMDKs mit mehr als 2 TB formatieren und die zusätzliche Storage-Kapazität nutzen.

    • Bei Verwendung von Ambari kann die Hadoop-Topologie nicht konfiguriert werden.

      Bislang konnte bei der Verwendung des Ambari-Anwendungsmanagers die Topologie des Hadoop-Clusters nicht konfiguriert werden. Sie können nun die Workload-Verteilung auf die Cluster-Knoten verbessern und die Performance sowie den Durchsatz optimieren. Mit Ambari können Sie die Platzierung virtueller Hadoop-Maschinen unter Kenntnis der vorhandenen Topologie festlegen.

    • Die Cluster-Bereitstellung mit Big Data Extensions schlägt fehl, wenn vCenter Server leere Rechenzentren enthält.

      Sie können nun einen Big Data-Cluster in einem vCenter Server-Rechenzentrum mit leeren Hosts erstellen.

    • Die in der grafischen Benutzeroberfläche von Big Data Extensions angezeigten Konfigurationswerte werden unter Umständen nicht auf die in der Cluster-Spezifikationsdatei festgelegten Werte aktualisiert.

      Dieses Problem tritt auf, wenn Sie eine benutzerdefinierte Cluster-Spezifikationsdatei mit der Serengeti-CLI erstellen und zur Bereitstellung des Clusters in die grafische Benutzeroberfläche von Big Data Extensions wechseln. Die in der grafischen Benutzeroberfläche angezeigten Konfigurationswerte entsprechen unter Umständen nicht den Werten in der Cluster-Spezifikationsdatei.

    • Beim Neustart von Big Data Extensions werden die Datenplatten nicht mit der Linux-Option „noatime“ gemountet.

      Beim Mounten des Dateisystems wird die Linux-Standardoption noatime angegeben. Damit werden atime-Updates auf dem angegebenen System deaktiviert. Durch die Verwendung von noatime zum Mounten von Datenplatten in Big Data Extensions lassen sich erhebliche Leistungsverbesserungen erzielen.

    Bekannte Probleme

    In Big Data Extensions 2.2 sind die im Folgenden aufgeführten Probleme bekannt. Wenn Sie ein Problem feststellen, das nicht in der Liste der bekannten Probleme aufgeführt ist, durchsuchen Sie die VMware-Knowledgebase oder wenden Sie sich an den Technischen Support von VMware.

    • Die Ausführung von Apache Pig-Aufträgen schlägt bei Verwendung von Cloudera CDH 5.2 fehl.

      Bei der Ausführung eines Apache Pig-Auftrags in einem mit der Cloudera CDH 5.2-Distribution erstellten Cluster wird Pig nicht ausgeführt. Stattdessen wird die folgende Fehlermeldung angezeigt: Bitte initialisieren Sie HCAT_HOME.

      Umgehung: Ersetzen Sie die Pig-RPM im lokalen Repository „CDH 5.2.0 Yum“ durch die Pig-RPM aus dem offiziellen Repository „CDH 5.3.0 Yum“. Führen Sie anschließend den Befehl createrepo aus, um den Index für das Yum-Repository neu anzulegen.

    • Die Installation von Big Data Extensions schlägt fehl, wenn der Anwendername des angemeldeten Anwenders Zeichen außerhalb des ASCII-Zeichensatzes enthält.
      Falls der Anwendername des aktuell bei Big Data Extensions angemeldeten Anwenders Zeichen enthält, die nicht zum ASCII-Zeichensatz gehören, wird Big Data Extensions nicht installiert. Stattdessen wird die folgende Fehlermeldung angezeigt: Ein interner Fehler ist aufgetreten – Fehler #1009.

      Umgehung: Melden Sie sich mit einem Benutzernamen an, der keine Nicht-ASCII-Zeichen enthält, und wiederholen Sie den Installationsvorgang.

    • In der deutschen und der französischen Version des CLI-Clients von Serengeti werden Zeichen außerhalb des ASCII-Zeichensatzes als Fragezeichen angezeigt.

      Bei der Ausführung der deutschen bzw. französischen Version der Serengeti-CLI von einer Windows-Befehlszeilenkonsole aus werden Zeichen außerhalb des ASCII-Zeichensatzes als Fragezeichen angezeigt.

      Umgehung: Verwenden Sie in Anwendernamen, Objektbezeichnungen und Konfigurationswerten in der Big Data Extensions-Umgebung ausschließlich ASCII-Zeichen, wenn Sie mit der deutschen oder französischen Version der Serengeti-CLI arbeiten.




  •