AI前沿速览：CES 机器人、谷歌云 C4A 虚拟机、Runway Frames 与 Devin 1.2 新突破

CES人形机器人

2025 年 CES 展示了如机器人调酒师 ADAM 和能安慰老人的机器小狗等创新产品，但广泛部署仍处于早期阶段。

当前机器人面临处理视觉信息、理解人类行为及适应环境变化等挑战，多数依赖云计算且受网络延迟影响。不过，相关技术也在进步。World Labs 等公司致力于克服局限，其利用生成式 AI 助力机器人实现空间智能，实时绘制周围环境地图并预测物体运动，GenEx 还能让机器人从单张图像推断世界，帮助其在传感器数据有限时做决策和适应新环境。

英伟达的 Cosmos 和 GR00T 等技术为机器人赋予世界适应性和交互能力，Cosmos 帮助机器人理解物理和空间关系，GR00T 使其通过观察人类学习。谷歌 DeepMind 也在构建模拟物理世界的大规模生成模型。

2025 年初，人形机器人多为原型，近期聚焦制造、物流和灾难响应等特定任务，随着技术成熟，护理、零售等更广泛应用将逐步实现。咨询公司埃森哲预测未来十年机器人将与人类频繁互动，摩根士丹利预计到 2040 年美国人形机器人数量可达 800 万，2050 年达 6300 万，劳动力短缺等因素将推动其发展。

除技术障碍外，还需克服社会对机器人的潜在反对意见。研究者通过让机器人外观更具亲和力（如日本工程师用人皮细胞制作面具）等方式提升信任度，同时要确保机器人行为符合道德规范、数据收集透明，以保障人类接受度。

谷歌云推出配备 Titanium SSDs（定制本地磁盘）的 C4A 虚拟机

几个月前谷歌云推出了基于 Axion（其首款 Arm 架构 CPU）的 C4A 虚拟机实例，如今又推出配备 Titanium SSDs（定制本地磁盘）的 C4A 虚拟机。此举旨在增强 C4A 产品组合，为需要实时数据处理的工作负载提供能提升云性能的虚拟机，其结合了超低延迟、高吞吐量存储和成本效益，适用于高性能数据库、分析引擎和搜索等应用。

目前在 Compute Engine、Google Kubernetes Engine（GKE）、Batch 和 Dataproc 等服务中可使用配备 Titanium SSDs 的 C4A 虚拟机，Dataflow 中也有标准 C4A 虚拟机预览版，且即将支持 Cloud SQL、AlloyDB 等服务。

谷歌云的 C4A 实例通常有 Persistent Disk、Hyperdisk 和 Local SSD 三种存储选项，Titanium SSDs 是 Local SSD 中的最新创新，相比上一代 SSD，它每秒可实现高达 240 万随机读取输入/输出操作、10.4 GiB/s 的读取吞吐量，访问延迟降低 35%。Titanium SSDs 直接连接到主机服务器内的计算实例，可将存储和网络任务从 CPU 卸载，释放资源提升应用安全性和吞吐量性能，其创新源于谷歌的 Titanium 系统。

新的 C4A 系列（配备 Titanium SSDs）核心配置包括多达 72 个 vCPU、576 GB 内存和 6 TB 本地存储，企业可选择标准（4 GB/vCPU）或高内存（8 GB/vCPU）配置，连接选项可扩展至 100 Gbps，可支持如网络/应用服务器、高性能数据库等实时数据处理的高流量工作负载，以及内存缓存、媒体流和转码、基于 CPU 的 AI/ML 等应用。

谷歌云高级产品经理表示 C4A 相比当代基于 x86 的实例有高达 65%的性价比提升和 60%的能源效率提升，C4A 和 Titanium SSDs 为广泛的 Arm 兼容通用工作负载提供了行业领先的性价比。

像 Couchbase 和 Elastic 等早期采用者已从中获益，如 Elastic 观察到吞吐量比之前的虚拟机代提高了 40%。配备 Titanium SSDs 的 C4A 虚拟机目前已在美国、欧洲和亚洲等关键地区普遍可用，并计划进一步扩展，客户可通过按需、Spot VMs 和折扣定价选项使用。

Runway 推出了其最新的文本到图像生成模型 Frames

Runway 推出了其最新的文本到图像生成模型 Frames。它已在 2024 年 11 月宣布，最初提供给部分 Runway Creators Program 大使和高级用户，目前可通过 Runway 的无限和企业订阅计划向所有人开放，月费 95 美元/年付 912 美元（企业计划年付 1500 美元）。用户可在 app.runwayml.com 生成静态图像，并一键用于制作电影。

该模型具有以下特点：

提供高级风格控制和视觉保真度，适用于编辑、艺术指导等多个行业。
能让用户设计具有特定观点和美学特征的世界，保持风格一致的同时提供广泛创作探索，用户可建立独特视觉标识并可靠生成符合特定风格的变化。
初始发布带有 19 种预设视觉风格供选择和进一步定制。
为专业用户提供了多项增强功能，擅长渲染高级纹理、自然光照和复杂构图，提供更多灵活性并超越早期图像生成模型的僵化输出。

其创始人兼 CEO Cristóbal Valenzuela 表示该模型专为专业创意工作而设计，提示系统允许精确和深度，用户可获得细致、自然和电影般的合成结果，用户反馈也表明了对其高质量和风格控制的认可。

安全和伦理方面，Runway 在其生成式 AI 工具中继续优先考虑安全和道德责任，包含强大的内容审核功能，嵌入符合 C2PA 标准的隐形水印以追踪内容是否由 AI 生成，还致力于减少生成模型中的视觉输出偏差，支持不同人口统计和语言。

Scott Wu 领导的团队刚发布了 Devin 1.2

去年 Cognition 推出世界首款 AI 工程师 Devin，现其已普遍可用且学习能力强，Scott Wu 领导的团队刚发布了 Devin 1.2，带来了诸多新功能，提升了处理整个开发项目的能力。

Devin 1.2 的最大亮点是改进的上下文推理能力，使其更擅长处理和复用代码；还能通过 Slack 接收语音消息，用户在 Slack 聊天中标记 Devin 并点击“Record audio clip”按钮描述任务或反馈，Devin 会使用自身的开发工具执行命令，简化了交互方式。

该版本的其他特点包括：在代码仓库处理方面，能更好地理解结构和内容，识别相关文件、复用代码和模式，更准确地建议编辑或创建 PR，加速工作流程并减少认知负担；改进登录流程，引入机器快照简化登录；推出企业账户，组织管理员可集中管理多个工作空间的成员、访问控制和账单；增加基于使用量的计费模式，1 月 9 日起生效，用户可根据需求设置额外使用预算，超出月 ACU 配额后可继续付费使用。

目前 Devin 以每月 500 美元起的价格普遍用于工程协助，无座位限制，已有多家企业将其纳入工作流程。在 AI 工程领域竞争激烈的背景下，各参与者都在努力重新定义软件开发，追求更快的工作流程、降低认知负荷以及人机无缝协作。到 2028 年，Gartner 估计 33%的企业软件应用将包含智能代理 AI，实现 15%日常工作的自主决策。