LanPaint

LanPaint 是 为Stable Diffusion 模型设计的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝且...
阅读原文

Macro PDF

Macro PDF 是 AI PDF 编辑器,专为学术、法律和金融领域的专业人士设计。通过强大的 AI 技术,将复杂的 PDF 文档转化为智能文档,帮助用户快速提取关键信息、...
阅读原文

START

START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升大型语...
阅读原文

SeedFoley

SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型,实现音效与...
阅读原文

R1-Omni

R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出...
阅读原文

灵犀 X2

灵犀X2是智元机器人推出的最新双足人形机器人。全身拥有28个自由度,搭载小脑控制器Xyber-Edge、域控制器Xyber-DCU和智能电源管理系统Xyber-BMS,机械结构上...
阅读原文

Zulu

Zulu 是百度文心快码推出的AI自动编程智能体,为开发者提供从需求到代码的端到端生成服务。能自主理解编码需求,精准拆解任务,突破单文件限制,实现跨模块、...
阅读原文

FoxBrain

FoxBrain 是鸿海研究院推出的繁体中文大型语言模型(LLM),具有强大的推理能力。基于 Meta Llama 3.1 架构,拥有 70B 参数,专注于数学和逻辑推理领域。FoxB...
阅读原文

COMET

COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术,COMET将通信...
阅读原文

VideoPainter

VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基于双分支...
阅读原文

月匣

月匣是百度推出的AI互动应用,主打情感陪伴和沉浸式剧本体验。用户选择多种AI角色进行个性化对话,如温柔好友、霸道总裁或二次元角色等,享受深度情感交流。...
阅读原文

LanDiff

LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,有...
阅读原文

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是多模态对话练习工具,帮助用户应对各种困难对话场景而设计。支持创建和分享多种对话场景,如面试、职场沟通、销售谈判等,提供智能对...
阅读原文

IMAGPose

IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性,如无法同时生成多个不同姿态...
阅读原文

Heygem

Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,在 ...
阅读原文