2024 年人工智能的重大发展及未来预测

2024 年人工智能的重大发展

无论从哪个角度来看，2024 年都是人工智能迄今为止规模最大的一年——至少在该技术的商业化方面是如此。

# 大型语言模型（LLM）热潮持续

由 2022 年底 ChatGPT 推出引发的大型语言模型（LLM）热潮没有放缓的迹象，不仅 OpenAI 和微软、Meta 和谷歌等科技巨头推出了许多新的 LLM，还有许多其他初创公司和个人开发者也推出了新的 LLM。

# AI 研究放缓的报道被证明是夸大其词

关于 AI 研究放缓的报道，如果不是没有根据的，至少目前肯定是夸大了。

# 新的技术开始出现

除了支撑大多数大型 LLM 的 Transformer 架构之外，新的技术开始出现，例如 Liquid AI 的 Liquid Foundation Models。

# 企业开始全面采用“智能体”方法

企业开始全面采用“智能体”方法来开发特定的 AI 驱动的机器人、应用程序和工作流程，这些机器人、应用程序和工作流程可以独立解决特定问题，或者比典型的 LLM 聊天机器人的来回交互需要更少的人工管理。

将今年的新闻报道浓缩为前 14 名，更不用说前 10 名或前 4 名，是一项令人烦恼的工作。但我还是尝试了一下，尽管稍微作弊了一下，将几个故事合并成了更大的主题。在我看来，以下是今年将产生最大影响的事情：

# 1. OpenAI 远远超出了 ChatGPT 的范围

可以说，引发了通用人工智能时代的公司今年并没有错过任何一个节拍，尽管来自新手和传统科技公司的竞争加剧，甚至包括它自己的投资者和合作伙伴微软。

- o1 模型：OpenAI 发布了其首个超越 GPT 系列的大型通用模型系列 o1“推理”系列，该系列分配了更多时间来处理复杂的提示，从而提高了准确性。它在科学、编码和推理任务中特别有效。

- o3 模型：它在 9 月推出 o1 模型后，在年底发布了一个更先进的 o3 模型的重磅消息。虽然这要到 2025 年初才会公开提供，甚至不会提供给任何第三方，但它表明 OpenAI 并没有满足于现状。

- ChatGPT 搜索：这个功能最初是作为一个仅限邀请的独立产品 SearchGPT 推出的，后来被合并到 ChatGPT 中，使 ChatGPT 能够更实时地检索网络信息，并以更精炼的方式呈现搜索结果，提高了其对最新查询的实用性，并与谷歌、必应和新来者 Perplexity 正面竞争。

- Canvas：10 月推出的 Canvas 将 ChatGPT 的界面从对话式扩展到了类似工作站的窗格，可以根据用户的请求动态更新内容，例如编辑文档或编码项目。当然，很难不把它看作是对 Anthropic 几个月前宣布的 Artifacts 的反应，或者至少是一个可比的功能。

- Sora：在将近一年的时间里，OpenAI 一直用其严密保护的视频生成模型来逗我们，终于在 12 月初向大众推出了 Sora，很快就引起了广泛的反应，因为它试图在竞争激烈的 AI 视频领域中脱颖而出，具有独特而深思熟虑的界面和故事板功能。

# 2. 开源 AI 起飞

- Llama 3 和 3.1：Meta 在 4 月推出了 Llama 3，为开源 AI 的性能设定了新标准，然后在 7 月迅速推出了具有 4050 亿参数的 Llama 3.1。Llama 3.1 的版本被用于为 Meta AI 提供动力，该公司的助手集成在 WhatsApp、Messenger、Instagram 和 Facebook 等平台上，旨在成为使用最广泛的 AI 助手。

- Llama 3.3：2024 年 12 月发布的 Llama 3.3 提供了与更大模型相当的性能，但计算成本仅为其一小部分，使其更适合企业应用。

与此同时，阿里巴巴的 Qwen-2.5 系列和 DeepSeek 的新 V2.5 和 R1-Lite Preview 等中国模型似乎突然出现在一些基准图表的顶部，而 Nvidia 本身也超越了提供图形卡和软件架构的范畴，推出了自己的开源、强大的 Nemotron-70B 模型。

Nous Research，一家位于旧金山的小型机构，旨在提供更个性化和限制更少的 AI 模型作为开源，也推出了一些很酷的新想法。

别忘了法国的 Mistral，它迅速扩大了自己的开源和专有 AI 产品。

# 3. Google 的 Gemini 系列成为最佳可用的有力竞争者

在今年的复出故事中，Google 的 Gemini 系列 AI 模型曾经因其奇怪的图像生成而被嘲笑，并因其过于“觉醒”而受到批评，但现在它以新的、更强大的版本卷土重来，这些版本现在在第三方性能基准图表中名列前茅，并且越来越吸引开发者和企业。

Google 推出了 Gemini 2.0 Flash，这是一种多模态 AI 模型，支持流媒体视频分析，可以看到并指示你在屏幕上正在做的事情，并随后推出了与 OpenAI 的 o1 和 o3 推理模型竞争的 Gemini 2.0 Flash Thinking。

# 4. 智能体 AI 席卷企业

随着时间的推移，“智能体”AI 从一个热门词汇变成了一系列主要产品发布和企业软件供应商的举措。例如：

- Salesforce 的 Agentforce 2.0：Salesforce 几天前推出了 Agentforce 2.0，这是一个先进的 AI 代理程序，旨在增强其 CRM 和销售产品以及 Slack 的推理、集成和定制功能，显著提高企业生产力工具。

- SAP 的 Joule：SAP 将其 Joule 聊天机器人转换为由开源大型语言模型（LLM）驱动的 AI 代理，推动企业环境中的创新和效率。

- Google 的 Project Astra：作为 Gemini 2.0 计划的一部分，Google 推出了 Project Astra，这是一个 AI 助手，旨在通过利用 Google 的服务套件提供实时、上下文响应，旨在提高用户的生产力和决策能力。

2025 年的大预测：AI 生成的内容将占据主导地位

在这些进步的基础上，2025 年有望见证 AI 生成的内容在商业和消费者领域的广泛传播，特别是因为从 OpenAI 到 Meta、Google、Microsoft、Apple，甚至 Elon Musk 的 xAI 现在都在其产品中内置了 AI 图像生成器。

这一扩展将简化内容创建，增强个性化，并在各个领域提高效率。

此外，我们预计大型语言模型（LLM）和生成式 AI 驱动的机器人的首次大规模部署将在商业和消费者环境中进行，彻底改变自动化和人机交互。

这就是 2024 年最后一期#AIBeat 时事通讯的全部内容。感谢阅读、写作、订阅、分享、评论，感谢与我们在一起。期待在 2025 年与大家分享更多，听到更多。

祝大家节日快乐，新年快乐，我们在 VentureBeat 的所有人都向你和你的亲人致以最美好的祝愿。