标签:文本生成
Moonlight-16B-A3B
Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...
Mistral Saba
Mistral Saba 是法国 Mistral AI 推出的专注于中东和南亚地区语言及文化的区域定制 AI 模型。模型拥有 240 亿参数,规模虽小,在处理阿拉伯语和印度起源语言...
KTransformers
KTransformers是清华大学KVCache.AI团队联合趋境科技推出的开源项目,能优化大语言模型的推理性能,降低硬件门槛。KTransformers基于GPU/CPU异构计算策略,用...
RWKV-7-2.9B
RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先进 RNN 大语言模型。基于 RWKV World V3 数据集训练,具有 29 亿参数,支持世界所有语言。模型...
ChatGPT Tasks
ChatGPT Tasks是OpenAI推出的新功能,属于OpenAI Agent的初步形态。ChatGPT Tasks赋予ChatGPT执行力,用户能在ChatGPT聊天界面的“4o与计划任务”模式中,用自...
Monoxer Junior
Monoxer Junior 是面向小学新生的AI家庭学习应用,日本公司Monoxer开发。基于AI技术根据儿童的学习水平和记忆状态智能出题,提供假名、汉字等丰富学习内容,...
Emotion-LLaMA
Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模型基于修改版LLaMA,经指令调整以提升情感识别能力...