概要:谷歌宣布其Bard聊天机器人全球升级为Gemini Pro模型,支持40多种语言。Gemini Pro提供更好的理解和总结内容、推理、头脑风暴、写作和规划功能。文章探讨了升级的重要性,以及新功能带来的潜在问题和解决方案。
在2024年2月1日,谷歌公司宣布全球范围内升级其Bard聊天机器人,采用Gemini Pro模型,支持超过40种语言,包括阿拉伯语、中文、荷兰语、法语、德语、印地语、日语、葡萄牙语、西班牙语、泰米尔语、泰卢固语和马拉雅拉姆语。
这项更新是在去年12月推出的谷歌新一代人工智能模型中的一部分,其中包括旗舰Gemini Ultra、轻量级Gemini Pro和适用于Pixel 8等设备的Gemini Nano。当时,公司使用Gemini Pro模型对Bard进行了英语对话的更新。谷歌没有具体说明改进的程度,但表示聊天机器人在理解和总结内容、推理、头脑风暴、写作和规划方面将更为出色。
Bard在后台经历了几次迭代。在其于2023年2月首次亮相时,它由LaMDA(用于对话应用的语言模型)提供动力;同年晚些时候,它通过新模型PaLM 2进行了更新;而现在,Bard由Gemini Pro提供动力,将在230多个国家提供服务。是的,这些名称和版本确实令人困扰。
去年9月,谷歌推出了“双重检查”功能,利用Google搜索评估其返回的结果是否与Bard生成的结果相似。当时,该功能仅提供英语支持。如今,谷歌正在扩展对40多种语言的支持。
此外,这家搜索巨头通过去年12月发布的Imagen 2模型引入了图像生成支持。目前,该功能仅支持英语。用户可以在聊天机器人界面中输入查询,比如“创建一辆未来汽车的图像”。
谷歌表示,由Bard生成的图像将具有由DeepMind开发的SynthID数字水印嵌入的像素。然而,要使用谷歌的工具来识别这些图像。
在10月份,该公司将Bard的人工智能功能注入Google助手中,使用户能够计划旅行或制定购物清单等。在11月份,谷歌将Bard在英语中向青少年开放,但设有限制,以防止Bard生成非法或年龄限制的内容。
这一系列更新和功能的背后有着重要的意义。首先,Gemini Pro模型的全球升级意味着Bard在更广泛的语言背景下能够提供更智能、更灵活的对话。这对于全球用户来说是一个巨大的福音,有助于跨越语言障碍,推动文化交流和信息传播。
其次,对Bard的图像生成支持以及数字水印技术的引入,标志着谷歌对聊天机器人在多媒体内容生成方面的不断探索。用户现在可以通过Bard直接生成图像,这为创意设计、社交媒体和其他领域提供了新的可能性。然而,数字水印也引发了一些隐私和版权问题,谷歌需要采取措施确保合法使用。
另外,通过谷歌搜索的“双重检查”功能的扩展,用户可以更加信任Bard生成的内容。这对于确保机器人生成的信息准确性和相关性至关重要,特别是在多语言环境中。然而,这也需要确保搜索结果的多语言质量得到维护和提高,以保持“双重检查”功能的可靠性。
总体而言,这次Bard的全球升级和新功能的引入,不仅推动了谷歌在人工智能领域的创新步伐,也为用户提供了更丰富、更便捷的体验。然而,伴随而来的挑战也需要认真对待,包括隐私问题、版权问题以及对多语言支持的持续优化。谷歌需要在技术创新和用户权益之间找到平衡,确保Bard继续成为人工智能领域的佼佼者。