AI项目和框架

Samsung Gauss2:三星推出第二代多模态生成式AI模型,融合视觉与语言智能的创新体验

Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型,能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和图像等多种数据类型。Sa...
阅读原文

AtomThink:多模态数学推理框架助力智慧教育革新

AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。框架基于构建长链的思维(CoT)...
阅读原文

DeepSeek-R1-Lite:DeepSeek推理模型预览版全面提升智能分析与预测能力

DeepSeek-R1-Lite是DeepSeek推出的推理模型预览版,DeepSeek-R1-Lite用强化学习训练,具备长思维链推理能力,能实时展示推理思考过程,性能在多个基准测试中...
阅读原文

BlueLM-V-3B:ViVo与香港中文大学携手创新算法与系统协同设计方法提升产品智能化水平

BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法,支持高效部署多模态大型语言模型(MLLM)至移动设备。模型以小尺寸(2.7B语...
阅读原文

XiYan-SQL:阿里推出文本到SQL多生成器集成框架实现智能化数据查询与管理

XiYan-SQL是阿里巴巴推出的自然语言到SQL(NL2SQL)框架,基于多生成器集成策略,结合提示工程和监督微调,提升SQL查询生成质量。XiYan-SQL引入M-Schema半结...
阅读原文

KuaiFormer:智能音响重塑你的听觉体验

KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“...
阅读原文

EyeDiff:基于文本到图像扩散模型的多模态眼科图像生成技术

EyeDiff是文本到图像的扩散模型,基于自然语言提示生成多模态眼科图像,提高常见和罕见眼病的诊断准确性。模型在多个大规模数据集上训练,能准确捕捉关键病变...
阅读原文

MikuDance:动态风格化角色艺术的混合动力动画生成技术

MikuDance是基于扩散模型的动画生成技术,整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运动建模和混合控制扩散技术,解决高动态运动和参...
阅读原文

MATRIX-Gen:多智能体模拟系统引领智能决策新时代

MATRIX-Gen是上海交通大学和牛津大学研究团队推出的多智能体模拟系统,基于模拟1000多个具有独立身份和人格的AI智能体组成的社会,生成多样化且高质量的训练...
阅读原文

BodyTalk:智能视频配音工具实现语音与唇形、面部表情与肢体动作的完美同步

BodyTalk是Panjaya推出的AI视频配音工具,基于生成性AI技术,将视频中的人物声音转换为其他语言,自动调整视频中人物的面部表情和肢体动作,自然地匹配新的语...
阅读原文

Windsurf Editor:智能编程助手提升开发效率与代码质量

Windsurf Editor 是 Codeium 推出的首款“代理式”集成开发环境(IDE),基于深度集成AI技术,提供与人类开发者协作的 AI Copilot 和独立处理复杂任务的 AI Age...
阅读原文

OmniParse:智能数据解析平台助力高效提取与分析非结构化数据

OmniParse是数据解析平台,将非结构化数据转换为结构化、可操作的数据,优化适用于GenAI(大型语言模型)应用。OmniParse支持约20种文件类型,包括文档、表格...
阅读原文

Promptim:智能优化库助力自动迭代配置生成与性能提升

Promptim是实验性的AI提示优化库,基于自动化流程提升AI系统在特定任务上的提示效果。用户提供初始提示、数据集和自定义评估器,Promptim能自动运行优化循环...
阅读原文

TinyTroupe:多智能体角色模拟库助力智能交互与协作创新

TinyTroupe是microsoft推出的实验性Python库,用在模拟具有特定个性、兴趣和目标的人工代理(TinyPersons),在模拟环境(TinyWorld)中进行互动。TinyTroupe...
阅读原文

Thinking Claude:AI思维革新工具让机器更懂人类思维方式

Thinking Claude是基于深度思考协议和浏览器扩展工具,增强AI模型Claude-3.5的“深度思维”能力的项目,让其思考逻辑更接近人类。支持AI以自然、未经过滤的方式...
阅读原文
12346