CES人形机器人
2025 年 CES 展示了如机器人调酒师 ADAM 和能安慰老人的机器小狗等创新产品,但广泛部署仍处于早期阶段。
当前机器人面临处理视觉信息、理解人类行为及适应环境变化等挑战,多数依赖云计算且受网络延迟影响。不过,相关技术也在进步。World Labs 等公司致力于克服局限,其利用生成式 AI 助力机器人实现空间智能,实时绘制周围环境地图并预测物体运动,GenEx 还能让机器人从单张图像推断世界,帮助其在传感器数据有限时做决策和适应新环境。
英伟达的 Cosmos 和 GR00T 等技术为机器人赋予世界适应性和交互能力,Cosmos 帮助机器人理解物理和空间关系,GR00T 使其通过观察人类学习。谷歌 DeepMind 也在构建模拟物理世界的大规模生成模型。
2025 年初,人形机器人多为原型,近期聚焦制造、物流和灾难响应等特定任务,随着技术成熟,护理、零售等更广泛应用将逐步实现。咨询公司埃森哲预测未来十年机器人将与人类频繁互动,摩根士丹利预计到 2040 年美国人形机器人数量可达 800 万,2050 年达 6300 万,劳动力短缺等因素将推动其发展。
除技术障碍外,还需克服社会对机器人的潜在反对意见。研究者通过让机器人外观更具亲和力(如日本工程师用人皮细胞制作面具)等方式提升信任度,同时要确保机器人行为符合道德规范、数据收集透明,以保障人类接受度。
谷歌云推出配备 Titanium SSDs(定制本地磁盘)的 C4A 虚拟机
几个月前谷歌云推出了基于 Axion(其首款 Arm 架构 CPU)的 C4A 虚拟机实例,如今又推出配备 Titanium SSDs(定制本地磁盘)的 C4A 虚拟机。此举旨在增强 C4A 产品组合,为需要实时数据处理的工作负载提供能提升云性能的虚拟机,其结合了超低延迟、高吞吐量存储和成本效益,适用于高性能数据库、分析引擎和搜索等应用。
目前在 Compute Engine、Google Kubernetes Engine(GKE)、Batch 和 Dataproc 等服务中可使用配备 Titanium SSDs 的 C4A 虚拟机,Dataflow 中也有标准 C4A 虚拟机预览版,且即将支持 Cloud SQL、AlloyDB 等服务。
谷歌云的 C4A 实例通常有 Persistent Disk、Hyperdisk 和 Local SSD 三种存储选项,Titanium SSDs 是 Local SSD 中的最新创新,相比上一代 SSD,它每秒可实现高达 240 万随机读取输入/输出操作、10.4 GiB/s 的读取吞吐量,访问延迟降低 35%。Titanium SSDs 直接连接到主机服务器内的计算实例,可将存储和网络任务从 CPU 卸载,释放资源提升应用安全性和吞吐量性能,其创新源于谷歌的 Titanium 系统。
新的 C4A 系列(配备 Titanium SSDs)核心配置包括多达 72 个 vCPU、576 GB 内存和 6 TB 本地存储,企业可选择标准(4 GB/vCPU)或高内存(8 GB/vCPU)配置,连接选项可扩展至 100 Gbps,可支持如网络/应用服务器、高性能数据库等实时数据处理的高流量工作负载,以及内存缓存、媒体流和转码、基于 CPU 的 AI/ML 等应用。
谷歌云高级产品经理表示 C4A 相比当代基于 x86 的实例有高达 65%的性价比提升和 60%的能源效率提升,C4A 和 Titanium SSDs 为广泛的 Arm 兼容通用工作负载提供了行业领先的性价比。
像 Couchbase 和 Elastic 等早期采用者已从中获益,如 Elastic 观察到吞吐量比之前的虚拟机代提高了 40%。配备 Titanium SSDs 的 C4A 虚拟机目前已在美国、欧洲和亚洲等关键地区普遍可用,并计划进一步扩展,客户可通过按需、Spot VMs 和折扣定价选项使用。
Runway 推出了其最新的文本到图像生成模型 Frames
Runway 推出了其最新的文本到图像生成模型 Frames。它已在 2024 年 11 月宣布,最初提供给部分 Runway Creators Program 大使和高级用户,目前可通过 Runway 的无限和企业订阅计划向所有人开放,月费 95 美元/年付 912 美元(企业计划年付 1500 美元)。用户可在 app.runwayml.com 生成静态图像,并一键用于制作电影。
该模型具有以下特点:
- 提供高级风格控制和视觉保真度,适用于编辑、艺术指导等多个行业。
- 能让用户设计具有特定观点和美学特征的世界,保持风格一致的同时提供广泛创作探索,用户可建立独特视觉标识并可靠生成符合特定风格的变化。
- 初始发布带有 19 种预设视觉风格供选择和进一步定制。
- 为专业用户提供了多项增强功能,擅长渲染高级纹理、自然光照和复杂构图,提供更多灵活性并超越早期图像生成模型的僵化输出。
其创始人兼 CEO Cristóbal Valenzuela 表示该模型专为专业创意工作而设计,提示系统允许精确和深度,用户可获得细致、自然和电影般的合成结果,用户反馈也表明了对其高质量和风格控制的认可。
安全和伦理方面,Runway 在其生成式 AI 工具中继续优先考虑安全和道德责任,包含强大的内容审核功能,嵌入符合 C2PA 标准的隐形水印以追踪内容是否由 AI 生成,还致力于减少生成模型中的视觉输出偏差,支持不同人口统计和语言。
Scott Wu 领导的团队刚发布了 Devin 1.2
去年 Cognition 推出世界首款 AI 工程师 Devin,现其已普遍可用且学习能力强,Scott Wu 领导的团队刚发布了 Devin 1.2,带来了诸多新功能,提升了处理整个开发项目的能力。
Devin 1.2 的最大亮点是改进的上下文推理能力,使其更擅长处理和复用代码;还能通过 Slack 接收语音消息,用户在 Slack 聊天中标记 Devin 并点击“Record audio clip”按钮描述任务或反馈,Devin 会使用自身的开发工具执行命令,简化了交互方式。
该版本的其他特点包括:在代码仓库处理方面,能更好地理解结构和内容,识别相关文件、复用代码和模式,更准确地建议编辑或创建 PR,加速工作流程并减少认知负担;改进登录流程,引入机器快照简化登录;推出企业账户,组织管理员可集中管理多个工作空间的成员、访问控制和账单;增加基于使用量的计费模式,1 月 9 日起生效,用户可根据需求设置额外使用预算,超出月 ACU 配额后可继续付费使用。
目前 Devin 以每月 500 美元起的价格普遍用于工程协助,无座位限制,已有多家企业将其纳入工作流程。在 AI 工程领域竞争激烈的背景下,各参与者都在努力重新定义软件开发,追求更快的工作流程、降低认知负荷以及人机无缝协作。到 2028 年,Gartner 估计 33%的企业软件应用将包含智能代理 AI,实现 15%日常工作的自主决策。