Anthropic发布Claude 2：第二代AI聊天机器人

Anthropic是一家由前OpenAI高管共同创立的人工智能初创公司，近日宣布发布一款新的文本生成AI模型，名为Claude 2。作为Anthropic首个商业模型的继任者，Claude 2在美国和英国通过Web和付费API进行测试版上线。

Claude 2在许多方面都比旧版Claude（Claude 1.3）更为优秀。它在律师资格考试的选择题部分得分略高（76.5%对比Claude 1.3的73%），能够通过美国医疗许可考试的选择题部分，并在编程方面表现更强（在Codex Human Level Python编码测试中，Claude 2得分71.2%，而Claude 1.3仅为56%）。此外，Claude 2在解答数学问题方面也更加准确，GSM8K收集的小学水平问题得分为88%，比Claude 1.3高出2.8个百分点。

Claude 2的训练数据比Claude 1.3更加新，包括来自网站、第三方授权数据集以及自愿提供的用户数据，其中大约10%为非英语数据。尽管Claude 2无法搜索互联网，但它在架构上与Claude 1.3并没有太大差别，可以看作是对Claude 1.3的改进版本，经过了大约两年的工作。

与Claude 1.3相比，Claude 2拥有相同大小的上下文窗口，即10万个令牌。这使得Claude 2具有几个关键优势，因为大的上下文窗口可以更好地记住甚至最近的对话内容，并能够生成和吸收更多的文本。Claude 2可以分析大约7.5万个词（相当于《了不起的盖茨比》的长度）并生成4,000个令牌，约为3,125个词。

Anthropic表示，Claude 2在某些特定的文本处理任务上表现更好，例如生成符合JSON、XML、YAML和markdown格式的输出。

Anthropic发布的Claude 2是一款进一步改进的AI聊天机器人模型，相比旧版Claude 1.3在多个领域表现更优秀。然而，类似于其他模型，Claude 2仍然存在一些问题，例如产生无关的、荒谬的或事实错误的回答以及生成有毒文本的倾向。

Anthropic声称在内部评估中，Claude 2比Claude 1.3在给出“无害”回答方面提升了2倍，但具体指标并未透露。此外，Anthropic也建议不要将Claude 2用于涉及身体或心理健康以及可能导致伤害的高风险情况。