$("body").append("")

字节推出开源AI模型GoKu AI;Nous Research推出推理模型DeepHermes-3

220次阅读
没有评论

TikTok母公司字节跳动推出的开源AI模型GoKu AI

字节推出开源AI模型GoKu AI;Nous Research推出推理模型DeepHermes-3
重点聚焦其文本转视频的功能,具体内容如下:

  1. 模型发布:字节跳动推出开源AI模型GoKu AI,该模型能根据文本生成视频和图像,只需输入简短文字,就能生成高度逼真的视频和图像。
  2. 应用情况:GoKu AI的测试版已集成到TikTok Live中,近5000万创作者在使用。
  3. 功能特点:它具备文本转视频功能,可将文本提示无缝转化为视频;还有图像转视频功能,能把静态图像变为动态视频;并且采用统一架构,能处理多种生成任务。
  4. 测试体验:文章作者试图对GoKu AI进行测试,但因排队人数过多未能成功,于是分享了GoKu AI官网的一个示例。示例中,输入一段描述老人在海边作画的文本提示,GoKu AI据此生成了相应视频,最后向读者发起互动,询问该模型是否名符其实。

Nous Research推出的推理模型DeepHermes-3

字节推出开源AI模型GoKu AI;Nous Research推出推理模型DeepHermes-3
涵盖模型特点、数据训练、推理模式、性能反馈、部署许可及未来规划等内容。

  1. 模型发布:专注“个性化、无限制”的AI实验室Nous Research推出DeepHermes-3 Preview,这是一款可切换推理模式的大语言模型,能统一推理和直观语言模型能力,用户可在长推理过程和快速响应间切换,其代码可在HuggingFace下载。
  2. 数据和训练:基于Hermes 3构建,使用约3900万令牌的多领域数据集训练,数据包含通用指令、领域专家数据等多个类别。训练数据有100万个非思维链(CoT)输出和15万个CoT输出,这种数据混合让模型具备切换推理模式的能力。
  3. 可切换推理模式:用户通过在提示前输入特定文本开启推理模式,模型会用长思维链系统思考,推理过程用标签构建;标准响应模式下则类似传统聊天机器人,快速给出基于直觉的回答 。
  4. 性能和反馈:早期测试显示,在数学推理MATH基准测试中得分为67%,低于DeepSeek的R1-distilled模型;在多轮对话中,推理模式首次响应正常,但持续对话存在问题;支持工具使用,但推理模式与工具调用结合时结果不稳定。Nous Research正收集反馈改进。
  5. 部署和硬件性能:可在Hugging Face测试,GGUF量化版本适用于低功耗硬件,与vLLM兼容,在MacBook Pro M4 Max上处理速度达每秒28.98个令牌。
  6. 许可情况:基于Meta的Llama 3模型,受Meta Llama 3社区许可约束,再分发需遵循规定,大型企业商业使用受限,与DeepSeek的R1推理模型的MIT许可不同。
  7. 未来展望:DeepHermes-3由多位成员开发,感谢开源社区贡献,它是迈向Hermes 4的一步,Hermes 4预计将进一步优化推理和对话能力。
正文完