标签:个性化推荐
DeepSeek-GRM
DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。通过点式生成式奖励建模(Pointwise Generative Reward Mod...
小猿AI
小猿AI是猿辅导集团旗下的智能教育产品,原名小猿口算,接入了DeepSeek满血版深度推理大模型,具备解题、翻译、写作、问答等多种功能,能为学生提供个性化的...
Augment Agent
Augment Agent 是Augment推出的AI编程助手,帮助软件工程师高效编写高质量代码。Augment Agent能深度理解大型代码库,随着用户工作自动学习和适应代码风格。
OThink-MR1
OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖励模型,提升...
Actor Mode
Actor Mode 是 ElevenLabs 推出的AI语音生成工具,支持用户通过自己的声音指导 AI 生成语音内容。用户只需录制一段音频或上传已有音频文件,AI 能分析其语调...
Cosmos-Reason1
Cosmos-Reason1 是 NVIDIA 推出的一系列多模态大型语言模型,基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型:Cosmos-Reason1-8B 和 Cosmo...