字节推出开源AI模型GoKu AI；Nous Research推出推理模型DeepHermes-3

TikTok母公司字节跳动推出的开源AI模型GoKu AI

重点聚焦其文本转视频的功能，具体内容如下：

模型发布：字节跳动推出开源AI模型GoKu AI，该模型能根据文本生成视频和图像，只需输入简短文字，就能生成高度逼真的视频和图像。
应用情况：GoKu AI的测试版已集成到TikTok Live中，近5000万创作者在使用。
功能特点：它具备文本转视频功能，可将文本提示无缝转化为视频；还有图像转视频功能，能把静态图像变为动态视频；并且采用统一架构，能处理多种生成任务。
测试体验：文章作者试图对GoKu AI进行测试，但因排队人数过多未能成功，于是分享了GoKu AI官网的一个示例。示例中，输入一段描述老人在海边作画的文本提示，GoKu AI据此生成了相应视频，最后向读者发起互动，询问该模型是否名符其实。

Nous Research推出的推理模型DeepHermes-3

涵盖模型特点、数据训练、推理模式、性能反馈、部署许可及未来规划等内容。

模型发布：专注“个性化、无限制”的AI实验室Nous Research推出DeepHermes-3 Preview，这是一款可切换推理模式的大语言模型，能统一推理和直观语言模型能力，用户可在长推理过程和快速响应间切换，其代码可在HuggingFace下载。
数据和训练：基于Hermes 3构建，使用约3900万令牌的多领域数据集训练，数据包含通用指令、领域专家数据等多个类别。训练数据有100万个非思维链（CoT）输出和15万个CoT输出，这种数据混合让模型具备切换推理模式的能力。
可切换推理模式：用户通过在提示前输入特定文本开启推理模式，模型会用长思维链系统思考，推理过程用标签构建；标准响应模式下则类似传统聊天机器人，快速给出基于直觉的回答。
性能和反馈：早期测试显示，在数学推理MATH基准测试中得分为67%，低于DeepSeek的R1-distilled模型；在多轮对话中，推理模式首次响应正常，但持续对话存在问题；支持工具使用，但推理模式与工具调用结合时结果不稳定。Nous Research正收集反馈改进。
部署和硬件性能：可在Hugging Face测试，GGUF量化版本适用于低功耗硬件，与vLLM兼容，在MacBook Pro M4 Max上处理速度达每秒28.98个令牌。
许可情况：基于Meta的Llama 3模型，受Meta Llama 3社区许可约束，再分发需遵循规定，大型企业商业使用受限，与DeepSeek的R1推理模型的MIT许可不同。
未来展望：DeepHermes-3由多位成员开发，感谢开源社区贡献，它是迈向Hermes 4的一步，Hermes 4预计将进一步优化推理和对话能力。