在科技日新月异的当下,微软推出的 Copilot Vision 引发了广泛关注。这款 AI 工具能够读取用户浏览网站的屏幕内容,为用户提供一系列智能服务,然而其背后也蕴含着诸多值得深入探讨的方面。
Copilot Vision 目前在美国推出了限量预览版,它依托于微软 Edge 浏览器,被安置在 Copilot Labs 这一实验性 AI 功能的可选程序之后。用户若要使用,需订阅每月 20 美元的微软 Copilot Pro 计划。它的功能颇为丰富,不仅能够理解并回答关于所访问网站的问题,例如当用户面对一道美食网页时,可以询问“这份千层面的食谱是什么?”它还能对网页文本进行总结与翻译,在商店目录中精准找出折扣商品,甚至能在游戏中充当助手,如在 Chess.com 的比赛里为玩家提供策略建议。正如微软在博客中所描述的:当启用 Copilot Vision 后,它能感知用户所在页面,与用户同步阅读,共同探讨面临的问题,如同在浏览网页时贴心相伴的智能伙伴,巧妙地镶嵌在 Edge 浏览器底部,随时准备提供援助。
微软在隐私保护方面表现出了谨慎态度,强调 Copilot Vision 在每次会话结束后会删除数据,处理过的音频、图像或文本均不会被存储或用于模型训练,至少在当前预览版中如此。不过,Copilot Vision 可访问的网站类型存在限制,暂时无法在付费墙和“敏感”内容的网站上运行,仅能在预先批准的“热门”网站列表中使用。至于“敏感”内容究竟涵盖哪些,微软并未明确说明,是色情内容还是暴力画面,都还是个谜。微软发言人表示,允许访问的网站列表是依据类别并逐个确定的,初期是一小部分经过充分测试的网站,后续会逐步增加。
微软的这种谨慎部分源于与新闻媒体的法律纠纷。例如,《纽约时报》就曾指控微软通过 Bing 上的 Copilot 聊天机器人绕过其付费墙提供文章。许多大型出版商出于对数据未经许可被使用以及服务器成本飙升的担忧,选择阻止 AI 工具抓取其网站内容。微软虽表示 Copilot Vision 会尊重网站的“机器可读 AI 控制”,如禁止机器人抓取数据用于 AI 训练的规则,但未明确具体会遵循哪些控制措施,毕竟此类规则众多。按照当前趋势,Copilot Vision 可能无法在一些顶尖新闻网站上运行,但微软承诺会“接受反馈”以缓解出版商的顾虑。微软提到,部分合作的第三方出版商有助于其了解如何让 Vision 在页面上更好地帮助用户互动与决策,这些反馈将助力 Vision 在与网页交互时发挥更大作用。
从整体来看,Copilot Vision 无疑是微软在 AI 领域拓展应用场景的一次大胆尝试,它为用户的网页浏览体验带来了更多智能化的可能,无论是获取信息、购物还是娱乐,都能提供便捷高效的辅助。但在发展过程中,隐私保护、与内容提供商的关系协调等问题如影随形。如何在充分发挥其功能优势的同时,妥善解决这些隐患,将是微软乃至整个 AI 行业在推进此类屏幕阅读 AI 工具发展时需要深入思考的关键所在。只有在技术创新与规则约束、用户权益保障之间找到平衡,这类工具才能真正在互联网生态中健康、可持续地发展,为用户创造更多价值,而不是引发更多争议与混乱。