如何为AI探索构建数据基础设施

数据的重要性对CIO而言并非新鲜话题。数字化领导者花费多年时间收集和整理企业信息,将这些数据存储在内部数据中心和云基础设施中,期待有朝一日能发挥作用。如今随着AI的兴起,这个时刻终于到来了。

CIO.com的2025年CIO现状调查发现,研究和实施数据驱动的AI产品和项目是IT领域的首要CEO优先事项。企业高管希望CIO们超越实验阶段,与业务领导者合作,通过提高生产力或效率增益来创造价值。

Carruthers and Jackson年度数据成熟度指数显示了类似趋势,发现超过50%的组织在过去一年中增加了AI的使用,其中11%报告了显著增长。该咨询公司CEO Caroline Carruthers表示,对AI的关注对数据兴趣产生了相应影响。

"我们发现几乎出现了数据重要性认知的第二次觉醒,"她说,"这与2018年引入GDPR时看到的效应类似。我认为那可能是第一次觉醒,而AI效应是第二次。"

虽然组织热衷于探索AI,但只有在拥有可靠且可扩展的数据基础设施的前提下,才能充分利用新兴技术。为此,CIO们在过去十年中构建的云基础设施将在帮助公司根据新业务需求扩展IT资源方面发挥关键作用。

然而,AI加快了变化的步伐。在几乎持续转型的时代,公有云或私有云供应只是IT基础设施拼图的一部分。研究机构GigaOm的COO兼CTO Howard Holton建议,为AI构建有效基础需要对基础设施有细致的理解,而许多业务领导者缺乏这种理解。

许多组织从传统内部存储整体迁移到云端服务,这种一刀切的方法对于新兴技术的波动需求并不完美。Holton表示,更好的方法是为变化构建数据基础,并为可能每12个月就会发生重大方向转变的未来做准备。

"这个领域存在巨大的变动,市场发展太快,难以做出硬性决策,"他说,"数字化领导者必须在设计架构时认识到自己可能是错误的。正确的方法就像我们为网络安全设计架构一样——它会失败,所以要将这种认知融入其中,以便根据需要更改组件。"

**让数据成为一切的平台**

HPE全球CIO Rom Kosla是一位认识到敏捷基础设施关键作用的数字化领导者。他的公司使用具有内置AI功能的第三方应用程序,包括Microsoft Copilot以及SAP和Salesforce的工具。HPE还花了18个月开发了一个名为ChatHPE的内部聊天解决方案,这是一个由Azure和OpenAI技术驱动的内部流程生成式AI中心。

Kosla表示,ChatHPE的新业务提案会被评估以创建用例流水线,如审查法律合同、提升客户服务、重用营销资产和改善财务分析。该流水线通过包含HPE Private Cloud AI的IT基础设施进行管理,这是一个面向企业AI挑战的全栈解决方案。Kosla补充说,该平台允许他的组织有效且安全地为AI项目扩展数据资源。

"IT部门是第一批接收Private Cloud AI服务器并将其部署到我们托管数据中心的部门之一,"他说,"现在我们有了一个路由机制,如果我们想要特定的内部AI用例,而我们永远不希望在外部模型上训练和推理,我们可以将其保留在该数据中心内。"

理解数据用例对梅赛德斯-AMG Petronas F1车队IT运营和服务管理负责人Steve Riley来说也至关重要。他的团队消耗大量信息来提高赛道比赛性能,对他的IT部门而言,优秀的数据平台必须可扩展,更重要的是超级可靠。

"我们进行大量计算流体力学工作,因此拥有高性能的底层存储层对我们来说价值很高,"他说,"但成功还在于在正确的地方拥有正确的技术。这并不总是意味着购买最快、最昂贵的技术,而是要在投资配置方面保持战略性,这就是我们采取的方法。"

Riley表示,梅赛德斯F1的主要技术合作伙伴包括提供数据基础设施的HPE和提供包括用于比赛模拟器的Tensor平台在内的新兴技术的TeamViewer。车队也在涉足AI领域。Riley说,正确的平台意味着他的组织可以在适当时机做出数据驱动的决策。

"运用我们的行业知识是我们的工作,"他说,"这通常意味着我们需要仔细考虑在哪里花钱。我们会在需要的地方寻求性能。然而,可靠性是关键,因为这样团队就不会持续重复相同的工作,他们可以腾出时间关注下一个重大事件。"

维珍航空数据与AI副总裁Richard Masters是另一位寻找创新解决方案来应对棘手挑战的数字化领导者。这种方法的关键要素是组织的Databricks数据平台。他的团队使用该平台整合企业信息,并考虑如何应对出现的新技术和模型。

Masters表示,轻松访问信息产生了巨大影响。"过去当问题出现时,当我们没有这种洞察力时,我们的团队必须进入这里的SQL Server数据库,或那里的Postgres数据库,或Oracle数据库,然后去与系统所有者交谈,然后重新建模数据,"他说。

维珍的Databricks平台意味着企业信息现在存储在一个位置。Masters说他的数据团队可以花更多时间探索、理解和验证信息。这种能力意味着当业务其他部门提出问题时,团队可以更快地释放洞察力。

"这是一个巨大的收益,因为数据是一切的基础,"他说,"这种能力意味着你可以用AI智能体等新兴工具做更多事情,因为你对平台中的数据有信任,可以减少很多噪音。"

**保持对创新想法的开放**

因此,数字化领导者必须认识到有序数据对于利用创新至关重要。正如Snowflake联合创始人兼总裁Benoit Dageville建议的,CIO应该将企业信息视为数据基础的"零层"。现在专注于这一基础工作的CIO将能够很好地利用后续出现的新兴技术。

GigaOm云和数据基础设施现场CTO Whit Walters说:"AI推动创新的速度超过了我们见过的任何事物。大多数工具都是几年前设计用来管理推动云发展的市场力量的。每个人都只是在努力跟上。与此同时,企业需要模块化架构。数据平台的各个部分必须可互换,因为在AI时代供应商的发展将是不对称的。"

这种方法与服装制造商Happy Socks的CIO Vivek Bharadwaj的观点一致。在迁移到Snowflake数据平台之前,他的业务依赖Excel进行报告。他的团队使用Snowflake构建了全新的数据基础,帮助组织其他部门做出更快的、基于洞察的决策。他们继续添加新技术来构建平台。

"最初,我们纯粹在Snowflake上运行,"Bharadwaj说,"随着规模扩大,我们迁移到DBT和包括Airbyte和Sigma在内的合作伙伴生态系统栈。随着流程成熟,我们开始探索不同的应用程序,如Streamlit框架和Cortex AI,以提供业务价值。"

Happy Socks还使用其数据生态系统探索新用例。Bharadwaj表示,潜在投资领域包括预测分析、库存管理和电商客户个性化。此外,他的团队正在研究如何使用Snowflake Cortex大语言模型创建产品描述,释放员工专注于更高价值的问题。

"真正的目标是使用数据和AI大规模解决我们的业务问题,"他说,"我大力倡导的一点,我们在这个领域取得了有意义的进展,就是如果你想在公司内通过数据实现非线性增长,从第一天起就要让它成为自助服务。业务用户应该被赋权,他们不应该在每个支持问题上都依赖IT。"

在经验教训方面,他对其他CIO的建议是从基础开始,不要在不稳定的数据基础设施上构建AI。"你可能会获得一些初期胜利,但这从来不是可持续的方法,"他说。

Q&A

Q1:为什么说数据是AI应用的基础?

A:数据是AI应用的"零层"基础,就像维珍航空的Richard Masters所说"数据是一切的基础"。只有拥有可靠、有序且可扩展的数据基础设施,企业才能充分利用AI等新兴技术。没有良好的数据基础,AI项目可能获得初期胜利,但永远不会是可持续的方法。

Q2:企业在构建AI数据基础设施时应该注意什么?

A:企业应该采用模块化架构,让数据平台的各个部分可以互换。因为AI领域变化太快,每12个月就可能发生重大方向转变。正如GigaOm的Howard Holton建议的,要为变化而设计架构,认识到决策可能是错误的,就像设计网络安全架构一样——预期它会失败,所以要能够根据需要更改组件。

Q3:ChatHPE和Databricks这类平台有什么优势?

A:这些平台能够整合企业信息,让数据存储在统一位置。比如维珍航空的Databricks平台让团队不再需要分别访问不同的SQL Server、Postgres或Oracle数据库,可以花更多时间探索、理解和验证信息,当业务问题出现时能更快地释放洞察力,并减少大量噪音。