慧与今天表示,它正在扩展 HPE GreenLake 文件存储的功能,推出新的高密度全闪存存储选项,旨在支持数据湖和管理人工智能工作负载。
该公司对其更新产品的性能改进做出了一些重大声明,称其每个机架单元的容量提高了四倍,性能提高了两倍。HPE 表示,通过这些改进,企业将能够将 AI 吞吐量扩大两倍,同时显着降低功耗,在某些用例中能效提升高达 50%。它补充说,这将使组织能够加速其人工智能工作负载,同时减少功耗和整体数据中心占地面积。
HPE GreenLake 文件存储是HPE GreenLake即服务产品组合的一部分,允许客户租用本地数据中心设备并像云服务一样进行管理。该产品由标准化、可组合的构建块组成,这些构建块由计算节点、商品存储和网络交换机组成,可以根据不同的需求进行配置。
HPE Storage 产品营销高级经理 David Yu 在一篇博文中表示,新产品解决了阻碍组织实现人工智能潜力并实现更大规模以从数据中释放更多价值的三个关键挑战。
性能提升
Yu表示,用于文件存储的GreenLake具有一些关键创新,使其非常适合加速和扩展人工智能工作负载,包括训练、微调和推理。他说,它们很重要,因为大规模的性能限制可能会成为人工智能存储的巨大障碍,人工智能存储可以在容量方面进行扩展,但在性能方面却无法跟上。
“HPE GreenLake 文件存储可通过 AI 规模的企业性能加速数据密集型应用程序,”Yu 说。“这种性能涵盖了人工智能的所有阶段——从数据聚合、数据准备、训练和调整到推理。对于小数据集来说,在某个时间点达到峰值的不仅仅是性能。相反,它是快速、持续的性能,涵盖整个数据规模,适用于最苛刻的数据密集型 AI 应用程序,包括 gen AI 和大型语言模型。”
Yu 表示,GreenLake 文件存储之所以能实现这一目标,得益于其分解、共享一切和高度弹性的模块化架构,该架构允许容量和性能相互独立地扩展。它专为 EB 级工作负载而设计,可实现快速数据传输,从而确保快速且可预测的性能,且无需前端缓存。其架构意味着媒体之间没有数据移动,也没有分层数据管道,这使其成为增强数据密集型人工智能应用程序的理想选择。
简化管理
GreenLake for File Storage 还解决了传统文件存储的问题,这些问题导致 AI 工作负载效率极低。传统上,管理文件存储需要专门的领域专业知识,并且是一个繁琐的手动过程。然而,对于希望扩大人工智能规模的组织来说,这些管理任务是不可避免的。
凭借其类似云的体验,GreenLake for File Storage 简化了文件数据管理任务,减轻了信息技术团队的负担。Yu 列举了一系列好处,包括简化部署、简单设置、轻松创建文件共享、快速完成作业以及通过可在任何位置的任何设备上访问的单一云控制台进行统一存储管理。
Yu 表示,这些功能提供了现实世界的优势:“您的数据科学家和业务线应用程序所有者不再受到繁琐的遗留文件系统的负担,这些系统需要技术专业知识和复杂的设置流程才能运行,”他说。
提高可扩展性
传统文件存储面临的第三个挑战与人工智能对存储容量、机架空间和功耗的永不满足的需求有关。对于传统存储系统,如果不构建全新的数据中心,将人工智能工作负载扩展到某个特定点是不切实际的。“采用无共享架构的传统 NAS 解决方案无法有效地横向扩展,以满足人工智能工作负载的容量密度、每 TB 成本和能效需求,”Yu 解释道。
GreenLake 文件存储采用各种创新技术来解决这一挑战,使组织能够将存储成本降低四倍,功耗降低两倍。它将无开销快照和本机数据复制等先进技术与闪存存储的卓越效率以及公司专有的相似性数据压缩算法相结合,以实现更有效的数据缩减。
此外,Yu表示,GreenLake for File Storage现在支持通过Nvidia Corp.的InfiniBand、GPUDirect和RDMA网络技术优化图形处理单元的利用。他说,这可以实现更快的检查点,以加速模型训练和调整等人工智能工作负载。
“为了支持您的人工智能计划并在当今的市场中竞争,您需要一个支持人工智能的文件存储解决方案,该解决方案可以提供企业性能、简单性和更高的效率,”Yu 说。“真正加速人工智能工作负载需要人工智能可扩展性的所有三项指标,因为每一项对于人工智能的成功都至关重要。”