AtomThink:多模态数学推理框架助力智慧教育革新
AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。框架基于构建长链的思维(CoT)...
Prezi:无限创意空间助力连接与组织演示内容
Prezi是创新的AI演示文稿工具,基于开放式画布和动态演示方式,帮助用户创建引人入胜的演示文稿和视频。与传统线性幻灯片不同,Prezi支持自由组织内容,提供...
DeepSeek-R1-Lite:DeepSeek推理模型预览版全面提升智能分析与预测能力
DeepSeek-R1-Lite是DeepSeek推出的推理模型预览版,DeepSeek-R1-Lite用强化学习训练,具备长思维链推理能力,能实时展示推理思考过程,性能在多个基准测试中...
BlueLM-V-3B:ViVo与香港中文大学携手创新算法与系统协同设计方法提升产品智能化水平
BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法,支持高效部署多模态大型语言模型(MLLM)至移动设备。模型以小尺寸(2.7B语...
XiYan-SQL:阿里推出文本到SQL多生成器集成框架实现智能化数据查询与管理
XiYan-SQL是阿里巴巴推出的自然语言到SQL(NL2SQL)框架,基于多生成器集成策略,结合提示工程和监督微调,提升SQL查询生成质量。XiYan-SQL引入M-Schema半结...
KuaiFormer:智能音响重塑你的听觉体验
KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“...
EyeDiff:基于文本到图像扩散模型的多模态眼科图像生成技术
EyeDiff是文本到图像的扩散模型,基于自然语言提示生成多模态眼科图像,提高常见和罕见眼病的诊断准确性。模型在多个大规模数据集上训练,能准确捕捉关键病变...
代悟:智能搜索引擎助力开发者高效获取精准信息
代悟是专为开发者打造的AI搜索引擎。基于深度学习技术和知识图谱,帮助开发者快速、精准地获取技术信息和解决方案。基于整合海量的开发文档、代码库和社区问...
MikuDance:动态风格化角色艺术的混合动力动画生成技术
MikuDance是基于扩散模型的动画生成技术,整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运动建模和混合控制扩散技术,解决高动态运动和参...
通义代码模式:阿里通义推出智能一句话生成应用,轻松创作与表达的新体验
通义代码模式是阿里旗下的通义推出的创新功能,支持用户通过简单的指令(Prompt)生成代码,实时预览代码生成的页面或应用。适用于快速开发动态网页和交互式...
Cascade:智能编程助手提升开发效率与代码质量
Cascade是Codeium 推出的集成开发环境(IDE),高颜值和功能强大。集成了Cursor的所有功能,还支持运行终端命令。用户界面友好,支持从VSCODE移植,提供直观...
MATRIX-Gen:多智能体模拟系统引领智能决策新时代
MATRIX-Gen是上海交通大学和牛津大学研究团队推出的多智能体模拟系统,基于模拟1000多个具有独立身份和人格的AI智能体组成的社会,生成多样化且高质量的训练...
BodyTalk:智能视频配音工具实现语音与唇形、面部表情与肢体动作的完美同步
BodyTalk是Panjaya推出的AI视频配音工具,基于生成性AI技术,将视频中的人物声音转换为其他语言,自动调整视频中人物的面部表情和肢体动作,自然地匹配新的语...
Windsurf Editor:智能编程助手提升开发效率与代码质量
Windsurf Editor 是 Codeium 推出的首款“代理式”集成开发环境(IDE),基于深度集成AI技术,提供与人类开发者协作的 AI Copilot 和独立处理复杂任务的 AI Age...
Doc2Lang:多格式文档翻译平台的智能化解决方案
Doc2Lang是基于AI技术的文档翻译平台,支持Excel、Word、PowerPoint和PDF等格式的文档。用户能上传不超过10MB的文件,AI将自动进行翻译。基于最新的ChatGPT技...