H2O AI发布Danube，用于移动应用的超小型LLM

概要： H2O AI今日宣布推出Danube，这是一个新的超小型大型语言模型（LLM），旨在用于移动设备。该模型拥有18亿参数，名字取自欧洲第二大河流，据称在一系列自然语言任务中能够匹敌或超越同等大小的模型。

H2O AI [https://h2o.ai/] 公司致力于通过一系列开源和专有工具使人工智能民主化，该公司的这一举动预示着人工智能将进一步走向普及化，同时也对移动应用市场带来了巨大的潜力。

H2O声称Danube可以在小型设备上进行微调，以处理一系列自然语言应用，包括常识推理、阅读理解、摘要和翻译等。为了训练这个迷你模型，该公司从多样化的网络来源收集了一万亿令牌，并利用了从Llama 2和Mistral模型中提炼出的技术来增强其生成能力。

为了帮助实现这一模型在移动使用场景下的应用，H2O已经在Hugging Face上以Apache 2.0许可发布了Danube-1.8B。任何希望将该模型用于移动应用场景的团队都可以从Hugging Face下载并进行特定应用的微调。为了使这一过程更加简化，该公司还计划很快发布额外的工具。此外，他们还发布了一个聊天版本的模型（H2O-Danube-1.8B-Chat），可用于对话应用程序。

随着Danube和类似规模的模型的普及，预计将推动手机和笔记本电脑上的离线生成AI应用的激增，有助于处理诸如电子邮件摘要、打字和图像编辑等任务。实际上，三星已经朝着这个方向迈出了一步，推出了其S24系列智能手机。

这一消息标志着人工智能在移动应用领域迈出了重要的一步。通过在小型设备上部署超大型语言模型，用户可以获得更快速的本地服务，而无需将信息传输到云端，从而增加了便利性和隐私性。此举预示着人工智能技术将在更广泛的应用中变得更加普及和可访问。