If 2023 was all about generative AI-powered chatbots and search, 2024 introduced agentic AI — tools capable of planning and executing multi-step actions across digital environments. From Devin’s engineering breakthroughs to Microsoft’s early trials with Copilot Vision, the innovations were diverse, but one constant remained: the need to keep data infrastructure organized and reliable.随着企业深入推进先进的 AI 计划,一些趋势重塑了数据的管理、保护和使用方式。企业越来越多地采用多云、开放数据和开放治理策略,以避免供应商锁定并获得更大的灵活性。他们还专注于非结构化数据,将数据市场转变为提供预训练 AI 模型、专有数据集和应用程序的中心。同时,向量和图形数据库的进展增加了新的可能性,为未来奠定了基础。现在,随着 AI 故事的继续展开,行业领导者分享了他们对 2025 年支撑 AI 的数据基础设施将如何演变的预测。1. 实时多模态数据将推动智能数据飞轮“到 2025 年,企业将全面拥抱多模态数据和 AI,改变其运营和交付价值的方式。这一转变的核心是‘智能数据飞轮’——一个动态循环,实时数据为 AI 驱动的洞察力提供动力,推动持续创新和改进。今天的暗数据——图像、视频、音频和传感器输出——将成为释放更清晰预测、更智能自动化和实时适应性的关键,最终导致对业务现实更丰富、更细致的理解。“随着实时数据飞轮的到位,AI 将自主诊断问题、优化流程并生成创新解决方案。企业将依靠 AI 代理来确保数据质量、发现洞察力和制定策略,使人类人才能够专注于更高层次的任务。这将重新定义效率,加速创新,并将企业转变为更具动态性和智能性的组织。”——Google Cloud 数据、分析和 AI 战略与出站产品管理总经理 Yasmeen Ahmad2. 冷却因素:液冷数据中心“随着 AI 工作负载继续推动增长,先驱组织将过渡到液冷,以最大限度地提高性能和能源效率。超大规模云提供商和大型企业将引领潮流,在新的 AI 数据中心中使用液冷,这些数据中心容纳了数十万个 AI 加速器、网络和软件。“企业将越来越多地选择在托管设施中部署 AI 基础设施,而不是自己构建——部分原因是为了减轻大规模设计、部署和运营智能制造的财务负担。或者,他们将根据需要租用容量。这些部署将帮助企业利用最新的基础设施,而无需自己安装和运营。这一转变将加速液冷作为 AI 数据中心主流解决方案的更广泛行业采用。”——Nvidia DGX 平台副总裁 Charlie Boyle3. 全球数据爆炸将导致存储短缺“世界正在以前所未有的数量创建数据。到 2028 年,将产生多达 400ZB 的数据,复合年增长率(CAGR)为 24%。然而,存储安装基础预计将以 17%CAGR 增长——因此增长速度明显慢于生成数据的增长速度。而且制造一个硬盘需要一整年的时间。这种增长率的差异将破坏全球存储供需平衡。随着组织在 AI 使用方面变得不那么实验性,而更具战略性,他们将需要建立更大的物理数据中心空间和容量计划,以确保存储供应,并充分货币化 AI 和数据基础设施的投资——同时平衡财务、监管和环境问题。”——Seagate Technology 执行副总裁兼首席商务官 B.S. Teh4. AI 工厂将演变为 PaaS“到 2025 年,AI 工厂将超越其提供基础设施即服务的初始阶段,提供计算、网络和存储服务,发展为提供平台即服务功能。虽然基础服务对于启动 AI 采用至关重要,但下一阶段的 AI 工厂将优先考虑推动数据亲和力并提供持久价值的平台。这一转变对于使 AI 工厂在长期内可持续和具有竞争力至关重要。”——DataPelago 联合创始人兼首席执行官 Rajan Goyal5. 公司将使用其海量数据集,但要求可靠性“在很大程度上,AI 的早期应用只是使用了在大量公共数据上训练的基础模型。随着复杂的 RAG 应用成为主流,以及生产结构化数据的产品迅速成熟,利用海量私有企业数据的应用将开始创造真正的价值。但这些应用的标准将很高:企业将要求 AI 应用具有可靠性,而不仅仅是令人惊叹的演示。“此外,提供这些模型的 AI 公司将不得不与出版商和内容提供商友好合作,以保护 AI 发展的未来。他们需要与内容提供商签订许可协议,以确保他们为提供的极有价值的数据得到补偿。这必须尽快发生,以免陷入诉讼和阻止 AI 爬虫的混乱局面。”——Snowflake 首席执行官 Sridhar Ramaswamy6. 企业代理将吞噬通信数据“到 2025 年,企业将挖掘数 TB 的通信数据,如电子邮件、Slack 消息和 Zoom 记录,使用提供分析洞察力、仪表板和可操作决策支持工具的代理。“这将推动各行业的显著生产力提高。”——RelationalAI 研究和 ML 副总裁 Nikolaos Vasiloglou7. 数据治理和质量将是成功和道德 AI 采用的最大障碍“到 2025 年,数据治理、准确性和隐私将成为有效 AI 采用的最重要障碍。随着组织寻求扩大 AI,人们将意识到成功的 AI 结果完全依赖于可信赖的数据。管理和准备大量数据,确保合规性并保持准确性将提供复杂的挑战。企业将需要通过投资基础数据平台来克服这些障碍,这些平台能够跨不同数据源进行统一管理。“因此,我们将看到对数据管理角色和与 AI 计划相一致的治理框架的更强强调,因为企业认识到不可靠的数据直接影响 AI 的有效性。”——EDB 分析、数据和 AI 工程副总裁 Jeremy Kelway8. 统一数据可观测性平台将成为必不可少的工具“到 2025 年,统一数据可观测性平台将成为大型企业必不可少的工具,使他们能够全面了解数据基础设施性能、质量、管道健康、成本管理和用户行为,以解决复杂的治理和集成挑战。通过自动化异常检测并提供实时洞察力,这些平台将支持数据可靠性并简化跨行业的合规努力。”——Acceldata 联合创始人兼首席技术官 Ashwin Rajeeva9. 主权云万岁“到 2025 年,我们将看到对主权云和私有云的真正推动。我们已经看到最大的超大规模企业投入数十亿美元在世界各地建设数据中心,以提供这些能力。这种……能力需要一段时间才能上线;与此同时,需求将飙升,主要由欧盟的立法浪潮推动。那些具有灵活、可扩展和弹性云基础设施的企业将能够快速采用主权或私有方法。那些具有单片、刚性基础设施的企业将使自己落后于曲线。”——Vultr 首席营销官 Kevin Cochrane10. 边缘数据处理的兴起“我正在关注边缘计算的潜在扩展,这是由 5G 的普及推动的,5G 使数据处理更接近源并减少延迟。这可能有助于使 AI 民主化。问题是,我们能否构建在移动设备上运行的高效 AI 应用程序,可能无需依赖云资源?“如果 5G 可供现场技术人员使用,他们可以利用 AI 来协助他们的工作——无论是在 5G 可用但 Wi-Fi 不可用的灾区提供诊断和治疗的医疗专业人员,还是在现场决策中使用 AI 辅助研究和实时计算的工程师和科学家。”——CData 高级技术传播者 Jerod Johnson11. 保护非结构化数据将变得更加紧迫“传统上,数据保护侧重于关键任务数据,因为这是需要更快恢复的数据。然而,情况已经发生了变化,非结构化数据在过去 10 年中增长到涵盖所有生成数据的 90%。数 PB 的非结构化数据的大表面积,加上其广泛的使用和快速增长,使其极易受到勒索软件攻击。网络犯罪分子可以使用非结构化数据作为特洛伊木马感染企业。从经济有效地保护非结构化数据免受勒索软件攻击将成为一种关键的防御策略,首先将冷的、不活跃的数据移动到不可变的对象存储中,在那里它不能被修改。“为此,IT 和存储主管将寻找提供自动化功能来保护、分段和审计 AI 中敏感和内部数据使用的非结构化数据管理解决方案——这一用例随着 AI 的成熟必然会扩大。此外,他们将需要创建系统的方法,让用户跨公司数据存储搜索、整理正确的数据、检查敏感数据并将数据移动到 AI,并进行审计报告。”——Komprise 联合创始人 Krishna Subramanian总之,2025 年有望在企业数据基础设施方面取得重大进展,从多模态数据飞轮到主权云。然而,数据治理和存储短缺等挑战将继续存在。在这个动态的领域中取得成功将取决于在创新与信任和可持续性之间取得平衡,将数据转化为持久的竞争优势。