$("body").append("")

Anthropic发布Claude 2:第二代AI聊天机器人

435次阅读
没有评论

Anthropic发布Claude 2:第二代AI聊天机器人

Anthropic是一家由前OpenAI高管共同创立的人工智能初创公司,近日宣布发布一款新的文本生成AI模型,名为Claude 2。作为Anthropic首个商业模型的继任者,Claude 2在美国和英国通过Web和付费API进行测试版上线。

Claude 2在许多方面都比旧版Claude(Claude 1.3)更为优秀。它在律师资格考试的选择题部分得分略高(76.5%对比Claude 1.3的73%),能够通过美国医疗许可考试的选择题部分,并在编程方面表现更强(在Codex Human Level Python编码测试中,Claude 2得分71.2%,而Claude 1.3仅为56%)。此外,Claude 2在解答数学问题方面也更加准确,GSM8K收集的小学水平问题得分为88%,比Claude 1.3高出2.8个百分点。

Claude 2的训练数据比Claude 1.3更加新,包括来自网站、第三方授权数据集以及自愿提供的用户数据,其中大约10%为非英语数据。尽管Claude 2无法搜索互联网,但它在架构上与Claude 1.3并没有太大差别,可以看作是对Claude 1.3的改进版本,经过了大约两年的工作。

与Claude 1.3相比,Claude 2拥有相同大小的上下文窗口,即10万个令牌。这使得Claude 2具有几个关键优势,因为大的上下文窗口可以更好地记住甚至最近的对话内容,并能够生成和吸收更多的文本。Claude 2可以分析大约7.5万个词(相当于《了不起的盖茨比》的长度)并生成4,000个令牌,约为3,125个词。

Anthropic表示,Claude 2在某些特定的文本处理任务上表现更好,例如生成符合JSON、XML、YAML和markdown格式的输出。

Anthropic发布的Claude 2是一款进一步改进的AI聊天机器人模型,相比旧版Claude 1.3在多个领域表现更优秀。然而,类似于其他模型,Claude 2仍然存在一些问题,例如产生无关的、荒谬的或事实错误的回答以及生成有毒文本的倾向。

Anthropic声称在内部评估中,Claude 2比Claude 1.3在给出“无害”回答方面提升了2倍,但具体指标并未透露。此外,Anthropic也建议不要将Claude 2用于涉及身体或心理健康以及可能导致伤害的高风险情况。

正文完