$("body").append("")

谷歌Gemini:关于新一代生成式人工智能平台的一切

570次阅读
没有评论

概要:
谷歌推出了Gemini,一套旗舰生成式人工智能模型、应用程序和服务。尽管Gemini在某些方面看起来很有前景,但在其他方面表现不佳。Gemini是什么?你可以如何使用它?它与竞争对手相比如何?我们将在这篇文章中对此进行深入探讨。


谷歌Gemini:关于新一代生成式人工智能平台的一切

Gemini是什么?

Gemini是由谷歌的AI研究实验室DeepMind和Google Research开发的下一代GenAI模型系列。它分为三种类型:

  1. Gemini Ultra:旗舰型Gemini模型。
  2. Gemini Pro:一种“轻量级”Gemini模型。
  3. Gemini Nano:一个更小的“精炼”模型,可在像Pixel 8 Pro这样的移动设备上运行。

Gemini模型被训练成“本地多模式”——换句话说,能够处理和使用不仅仅是文字的信息。它们被预训练和微调,可以处理各种音频、图像和视频,以及不同语言的文本。

Gemini应用程序和Gemini模型有什么区别?
Gemini应用程序只是一个接口,通过它可以访问某些Gemini模型。Gemini应用程序与Imagen 2完全独立,后者是谷歌的一款文本到图像模型。

谷歌Gemini:关于新一代生成式人工智能平台的一切

Gemini能做什么?

由于Gemini模型是多模式的,它们理论上可以执行一系列多模式任务,从转录语音到给图像和视频加字幕再到生成艺术作品。但是,很少有这些功能已经达到产品阶段。

Gemini是否优于OpenAI的GPT-4?
谷歌多次吹嘘Gemini在基准测试中的优越性,声称Gemini Ultra在“32个广泛使用的大型语言模型研究和开发中使用的基准测试中有30个超过了当前的最先进结果。”然而,Gemini的得分似乎仅比OpenAI对应的模型稍微好一点。

Gemini的成本是多少?
Gemini Pro在Gemini应用程序中免费使用,但一旦在Vertex中退出预览,模型将以每字符0.0025美元的价格收费,输出则以每字符0.00005美元的价格收费。

你可以在哪里尝试Gemini?
Gemini Pro和Ultra也可以在Vertex AI的预览中使用,API的使用在一定限制内是免费的,支持一些地区,包括欧洲,以及某些功能。

谷歌Gemini:关于新一代生成式人工智能平台的一切

Gemini作为谷歌的下一代GenAI模型,旨在处理多模式数据,从而为用户提供更广泛的应用场景。尽管Gemini在某些方面表现出色,但在其他方面却有所不足,例如在功能实现上还存在差距,用户体验可能不尽如人意。与此同时,Gemini面临与竞争对手的比较和优劣势的评估,特别是与OpenAI的GPT-4相比。Gemini的成本也是用户关注的焦点之一,尤其是在模型正式推出后的收费情况。Gemini的发布将为人工智能领域带来新的探索和应用可能性,但也需要进一步的发展和完善。

正文完