『新基建』

面朝AI,IBM让企业数据花开

要梳理过去十年的历史数据是个极大的挑战,对于一家拥有海量数据积累的国际科研机构而言更是如此。IBM的这位客户在过去十年的数据存满了数万盘磁带,总长度达到惊人的2200万米。
吴磊是IBM大中华区系统部存储系统的总经理,他在提及这个案例时,只是想说明磁带库之于海量冷数据的价值,“全球很多云服务公司都是IBM磁带库产品的用户。”他说,对于冷数据而言,它可靠且便宜。
在过去两年,IDC 和 Gartner 均将 IBM 评为 8 个产品类目中的“领导者”;同时IBM具有全球排名第一的软件定义存储平台,在整体存储软件、软件定义存储、归档、对象存储,当然还有品牌磁带中均位列第一。
IBM大中华区系统部存储系统总经理 吴磊
现在的问题是,由于AI和大数据相关技术在各行业业务中重要性的变化,要做类似数据梳理工作的公司和机构正在变得越来越多。他们或许没有十年的业务历史数据需要读取和梳理,但由于数据来源日趋复杂,以及高效使用这些数据等问题的存在,一切同样变得困难重重。
IBM与客户的沟通结果显示了这些需求的主要内容,并指向了客户“非常一致”的关注优先级。
首先是需要存储更多来自新来源的数据,并通过人工智能和大数据技术增加收入;其次是在包括在Red Hat OpenShift在内的容器环境中部署应用程序,以改进混合多云环境中的应用程序和数据移动性;最后则是数据安全问题,包括防范网络安全威胁等。
尽管这些需求的沟通基于数据存储,但显然其结论与IBM所提“现代化基础架构”的特征同根同源。IBM副总裁、大中华区系统部总经理侯淼指出,它不只针对服务器,同样针对存储。
IBM副总裁、大中华区系统部总经理 侯淼
侯淼是IBM“现代化基础架构”(Modern infrastructure)在中国最积极的布道者之一。现代化基础架构指向了IBM产品设计所围绕的三个维度——负载为要、多云敏捷,和安全无虞。
侯淼这里所谓负载为要,在新需求面前就明确指向了面向AI与大数据的存储。
明显的数据显示,AI正走向大规模应用。今天的财富500强CEO中有50%表示,他们的公司已经使用了AI,其中有60%用它降本增效,而他们中的22%已经开始用它来支持产品和服务创新。
吴磊指出,AI的关键是将数据转化为生产力。
围绕AI模型训练,IBM存储提出了一个极速数据管道的概念,它对应了端到端的、对数据模型的训练,以及模型训练完成后服务于生产的过程。IBM目前在整个人工智能市场的市场份额排名第一。
“训练的一些环节需要大吞吐、低延时,”吴磊说,“如果不能用足够快的数据‘喂它’,那么你对CPU、GPU、FPGA的投资都将出现浪费。”
显然,提供数据的快慢很大程度上取决于基础设施。不同介质、架构、地理位置都将影响大数据需求背景下的数据流动,并最终影响到业务——AI的推进要求在AI数据管道的每个阶段都有合适的基础设施,坚实的基础是AI成功的关键。
一项调研显示,部署人工智能工作负载将主要面临三大挑战,包括了数据量和质量、需要高级的数据管理,以及技能短缺。在IBM的那次调研中,这三项挑战均被过半企业提及。
一些新的存储解决方案和更新便聚焦于更高效地解决这些问题。这就包括了可以统一数据,实现单一可信来源和简单管理的IBM Spectrum Scale,和可以深入了解非结构化数据的IBM Spectrum Discover。
其中,IBM Spectrum Scale拥有近乎无限的处理能力,以及Exabyte级的扩展性。IBM官方资料显示,它已经被部署于目前世界最快的超级计算机中。
至于Spectrum Discover,它实质是IBM专门针对非结构化的数据环境下的管理软件。当数据进入系统时,它可以自动地给原始数据打上标签。这对于企业探索AI进程中的效率提升可以想见。
“数据访问部分是IBM存储软件着力最多的地方。”侯淼说,包括使存储本身更加智能,对负载进行调整等。整体而言,这些归于热门的软件定义存储。
最新发布的IBM Elastic Storage System 3000(ESS 3000)也引入了IBM Spectrum Scale,并以之为核心;通过集成快速的 NVMe 存储技术,该存储方案可以提供全局统一命名的文件管理功能,以及容器化开箱即用的体验。
IBM称,作为新一代软件定义存储新一代成员,它是帮助AI和大数据实现快速、无限扩展存储部署的“最简单方法”。
吴磊提醒人们注意,ESS 3000是第一个基于红帽Enterprise Linux 8.0的存储产品,这是一个红帽多年锤炼出的一个全新企业版的Linux产品。
因为ESS 3000的核心是IBM Spectrum Scale,因此该产品可在整个组织中提供一个统一的数据平台,这显然有助于消除数据孤岛、简化存储管理并提供一致的高性能,可以无限横向扩展,以满足大规模数据系统的需求。
“它采用了容器化封装,能给客户带来极大的灵活性。”吴磊说,现在互联网基本上都是以容器化封装快速地部署,IBM也在进行这样的实践。
吴磊对容器化的进程判断同样获得了数据支持。IBM最新的一份数据显示,70% 的组织具有基于容器的应用开发环境。
这又对应了新的或者至少区别于以往的需求——生产应用将需要数据卷备份、恢复和保留服务。
IBM持续强调“现代数据保护”概念,是因为某权威报告显示:90%的组织希望在1年内使用云进行部分数据保护,而未来两年中组织发生数据泄漏的的可能性为1/4.
为了确保数据得到保护,并支持关键业务,IBM在今年11月推出了针对Red Hat OpenShift和VMware cloud的现代数据保护产品IBM Spectrum Protect Plus。它可针对混合多云环境中的虚拟机、数据库和应用提供近乎实时的数据恢复、复制、复用和保留服务。该解决方案可作为一个虚拟设备轻松部署,而且采用无代理架构,易于维护。
同期围绕现代数据保护而发布的产品还包括了IBM TS7770 Virtual Tape Library,高端企业存储系统IBM DS8900F等。🖋







a豆:开辟AIoT第二战场

上一篇

双引擎驱动,华为以最强算力打造计算新时代

下一篇

你也可能喜欢

热门标签

微信扫一扫

微信扫一扫