标签:对话系统
Moonlight-16B-A3B
Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...
Mistral Saba
Mistral Saba 是法国 Mistral AI 推出的专注于中东和南亚地区语言及文化的区域定制 AI 模型。模型拥有 240 亿参数,规模虽小,在处理阿拉伯语和印度起源语言...
KTransformers
KTransformers是清华大学KVCache.AI团队联合趋境科技推出的开源项目,能优化大语言模型的推理性能,降低硬件门槛。KTransformers基于GPU/CPU异构计算策略,用...
ChatGPT Tasks
ChatGPT Tasks是OpenAI推出的新功能,属于OpenAI Agent的初步形态。ChatGPT Tasks赋予ChatGPT执行力,用户能在ChatGPT聊天界面的“4o与计划任务”模式中,用自...
Monoxer Junior
Monoxer Junior 是面向小学新生的AI家庭学习应用,日本公司Monoxer开发。基于AI技术根据儿童的学习水平和记忆状态智能出题,提供假名、汉字等丰富学习内容,...
Diff-Instruct
Diff-Instruct是先进的知识转移方法,用于从预训练的扩散模型中提取知识,指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leibler (IKL) 散...
RWKV-7:RWKV系列大模型架构提升上下文学习能力的创新产品特性解析
RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵活的状态演化能力,能在相同算力消耗下解决attention无法解...
OpenAI o3:OpenAI推出超强推理模型,智能提升与创新思维的完美结合
OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能(AGI),在ARC-AGI基准测试中得分高达87.5%,远超人...