vSphere Big Data Extensions 2.2 | 2015 年 6 月 4 日 | 内部版本 2774463

请查阅这些发行说明以了解新增内容和更新。

发行说明内容

这些发行说明适用于 vSphere Big Data Extensions 2.2,并包含以下主题:

vSphere Big Data Extensions 2.2 的新增功能

Big Data Extensions 可让您在 VMware vSphere 虚拟平台上快速部署 Hadoop 集群。 本版本提供以下新功能和增强功能:

  • 完全限定域名管理。 动态 DNS(Dynamic DNS, DDNS 或 DynDNS)是一种在域名系统 (Domain Name System, DNS) 中自动更新名称服务器的方法,活动 DNS 会以其已配置的主机名、地址或其他信息进行配置。 Big Data Extensions 与动态 DNS 服务器在其网络中集成。通过网络,它将有意义的主机名提供给 Hadoop 集群中的节点。 随后,集群会自动使用 DNS 服务器注册这些主机名,为您的 Big Data Extensions 环境提供配置正确的 DNS。

    主机名比较直观,更容易辨识,并且可以让您使用 Single Sign-On 等服务,此服务需要使用正确配置的 DNS。

  • 集中用户管理。您可以指定 Active Directory 或 LDAP 服务器进行用户验证,以便从一个集中点管理用户。 您可以使用 Active Directory 或 LDAP 服务器管理 Serengeti Management Server 中的帐户和 Big Data Extensions 生成的 Hadoop 节点中的帐户,以及将 Active Directory 或 LDAP 服务器中的帐户指定为 Hadoop 用户帐户和/或服务帐户。

  • 按需调整 Hadoop 集群大小。您可以减少正在运行的 Hadoop 集群中的虚拟机数量,以便管理 VMware ESXi 和 vCenter Server 环境中的资源。 删除虚拟机后,释放了所有资源,例如内存、CPU 和 I/O。

  • 提高虚拟机的克隆性能和资源使用率。 您可以使用 vSphere 6.0 的“即时克隆”功能快速克隆和部署虚拟机。 通过使用“即时克隆”,系统会对父虚拟机执行派生操作,随后生成子虚拟机(或即时克隆)。 子虚拟机会利用父虚拟机的存储和内存,从而降低了资源使用率。

  • 使用 vRealize Log Insight 或其他外部系统日志服务器执行集中式日志处理。您可以将 Big Data Extensions 配置为使用外部(或远程)系统日志服务器,例如 VMware vRealize Log Insight。 外部系统日志服务器使您能够更轻松地管理日志文件,而且如果您需要查看遭到入侵的机器上的日志文件,这是不可或缺的功能。

  • 执行备份和维护程序时将 Big Data Extensions 设置为静默模式。 您可以将 Big Data Extensions 设置为静默模式,以便安全地备份和还原环境,或者执行其他维护任务。

  • 支持最新 Hadoop 发行版。 Big Data Extensions 支持 Bigtop 0.8、Cloudera CDH 5.3、Hortonworks HDP 2.2、MapR 4.1 和 Pivotal PHD 3.0。

  • 支持最新合作伙伴 Hadoop 管理工具。 Big Data Extensions 支持 Cloudera Manager 5.3 和 Ambari 1.7。

  • 能够部署不同类型的 Hadoop 集群。 除了基本 Hadoop 集群,您还可以使用 Big Data Extensions 部署 HBase 集群、MapReduce 集群、仅计算集群、数据计算分离集群以及多种自定义集群类型,以满足您的要求。

  • 支持 EMC Isilon OneFS 7.2。 Big Data Extensions 提供一种自动化程序,可在 EMC Isilon OneFS 7.2 上部署和管理仅计算集群。

  • 国际语言支持。 Big Data Extensions 已本地化为其他六种语言: 简体中文、繁体中文、法语、德语、韩语和日语。 提供其他语言支持可便于用户访问完全翻译的 Web 界面和文档。

  • Big Data Extensions 升级。 您可以将 Big Data Extensions 2.1 升级到当前版本 Big Data Extensions 2.2,并且保留在 Big Data Extensions 中创建的集群中的所有数据。 升级一旦完成,Big Data Extensions 2.2 则可以管理您现有的所有集群。


此版本的安装说明

有关安装和配置 Big Data Extensions 的分步说明,请阅读 vSphere Big Data Extensions 文档。
 
  • 如果您的当前版本为 Big Data Extensions 1.x 或 2.0,并且想要升级到版本 2.2,那么必须首先升级到版本 2.1,才可以升级到版本 2.2。 无法直接从 Big Data Extensions 1.x 或 2.0 升级到版本 2.2。

  • Virtual Update Manager (VUM) 无法成功将 Big Data Extensions 2.1 vApp 升级到 Big Data Extensions 2.2 vApp。 有关此问题的更多信息,请参见 KB #2118702


    已解决的问题

    以下 Big Data Extensions 2.2 相关问题已得到解决。


    • Big Data Extensions 不支持注册一个以上的 vCenter Server。
    • 使用多个 vCenter Server 不会再导致部署出现问题。

    • Big Data Extensions 无法格式化大小大于 2 TB 的 VMDK。
    • 之前在部署大小大于 2 TB 的 VMDK 时,只有 2 TB 被格式化。 现在您可以格式化大小大于 2 TB 的 VMDK,并且可以使用增加的存储容量。

    • 使用 Ambari 时无法配置 Hadoop 拓扑。

      之前在使用 Ambari 应用管理器时,您无法配置 Hadoop 集群拓扑。 现在,您可以使用 Ambari 指定如何利用拓扑感知来放置 Hadoop 虚拟机,以此改善整个集群节点的工作负载均衡,从而改善性能和吞吐量。

    • vCenter Server 包含空数据中心时,Big Data Extensions 无法部署集群。

      现在,您可以在包含空主机的 vCenter Server 数据中心上创建大数据集群。

    • Big Data Extensions 图形用户界面中显示的配置值可能无法更新为集群规范文件中指定的值。

      使用 Serengeti 命令行界面创建自定义集群规范文件时,以及切换到 Big Data Extensions 图形用户界面以部署集群时会出现此问题。 图形用户界面中显示的配置值可能与集群规范文件中的值不符。

    • 重新启动 Big Data Extensions 时,数据磁盘无法使用 Linux noatime mount 选项进行装载。

      装载文件系统时会指定标准的 Linux mount 选项 noatime,同时禁用指定文件系统上的 atime 更新。 使用 noatime 在 Big Data Extensions 中装载数据磁盘可以实现显著的性能改善。

    已知问题

    Big Data Extensions 2.2 具有以下已知问题。 如果您遇到此已知问题列表中不包含的问题,请搜索 VMware 知识库,或联系 VMware 技术支持告诉我们。

    • 使用 Cloudera CDH 5.2 时运行 Apache Pig 作业失败。

      在使用 Cloudera CDH 5.2 发行版创建的集群中运行 Apache Pig 作业时,Pig 无法运行,并显示以下错误消息: 请初始化 HCAT_HOME (Please initialize HCAT_HOME)。

      解决办法: 将本地的 CDH 5.2.0 Yum 存储库中的 Pig RPM 替换为官方 CDH 5.3.0 Yum 存储库中的 Pig RPM,然后运行 createrepo 命令以重新索引 Yum 存储库。

    • 登录用户的用户名包含非 ASCII 字符时,Big Data Extensions 安装失败。
      如果当前登录到 Big Data Extensions 的用户的用户名包含非 ASCII 字符,则 Big Data Extensions 安装失败,并显示以下错误消息: 发生内部错误 - 错误 #1009 (An internal error has occurred - Error #1009)。

      解决办法: 使用不包含非 ASCII 字符的用户名登录,然后重新尝试安装。

    • 德语和法语版本的 Serengeti 命令行界面客户端中的非 ASCII 字符显示为问号。

      从 Windows 命令控制台运行德语和法语版本的 Serengeti 命令行界面时,非 ASCII 字符显示为问号。

      解决办法: 使用德语和法语版本的 Serengeti 命令行界面时,Big Data Extensions 环境中的用户名、对象标签和配置值仅允许使用 ASCII 字符。


  •