Avatar IV

Avatar IV 是 HeyGen 推出的数字人模型,用在快速创建逼真视频。用户只需上传一张照片和一段脚本或音频,能生成自然流畅的视频。模型基于音频驱动的表情引擎...
阅读原文

Insert Anything

Insert Anything是浙江大学、哈佛大学和南洋理工大学的研究人员联合推出的基于上下文编辑的图像插入框架。框架基于将参考图像中的对象无缝插入到目标场景中,...
阅读原文

Smart PDFs

Smart PDFs 是免费开源的 AI 驱动 PDF 文档总结工具,能快速将 PDF 文档中的关键信息整理为清晰的章节式总结,支持学术论文、行业报告或技术文档,能在数秒内...
阅读原文

oli

oli 是开源的智能代码助手,支持为开发者提供强大的编程支持。基于现代化的混合架构,结合 Rust 后端的高性能和 React/Ink 前端的交互式终端界面。oli 支持多...
阅读原文

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的多模态语言模型。模型在性能和成本之间实现平衡,接近甚至达到Claude Sonnet 3.7模型的性能水平,成本仅为后者的1/8(每...
阅读原文

Ztalk.ai

Ztalk.ai 是AI桌面应用程序,专注于实时语音翻译。支持超过30种语言,延迟小于100毫秒,能与Zoom、Google Meet、Teams等主流视频会议工具无缝集成。
阅读原文

Open Computer Agent

Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行,基于预装的程序(如 Firefox)完成用户指定的任务,例如用...
阅读原文

Absolute Zero

Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolute Zero基于模型...
阅读原文

FlexiAct

FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下,将参考视频中的动作迁移到目标主体上,在空间结构差异较...
阅读原文

mrge

mrge 是高效智能的 AI 代码审查平台,专为提升开发团队的代码质量和审查效率设计。通过 AI 自动审核代码,快速发现潜在缺陷、安全漏洞和性能问题,显著节省开...
阅读原文

Airpost

Airpost是AI驱动的视频广告创意生成工具,专为电商营销人员设计。能快速将产品链接和素材转化为具有高转化率的UGC(用户生成内容)视频广告。通过AI技术,Air...
阅读原文

Klavis AI

Klavis AI 是一个开源的 MCP(Multimodal Communication Protocol,多模态通信协议)集成平台,帮助 AI 应用快速接入生产级的 MCP 服务器和客户端。平台提供...
阅读原文

今天学点啥

今天学点啥是秘塔AI推出的创新AI学习工具。用户只需输入关键词、上传文档或粘贴网页链接,AI能自动将内容转化为个性化的互动课程,生成配套PPT和讲解语音。
阅读原文

ICEdit

ICEdit(In-Context Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力...
阅读原文

DBCopilot

DBCopilot 是火山引擎推出的国内首个数据库智能助手,上线于火山引擎数据库工作台 DBW 控制台。通过 AI 技术覆盖数据存储、管理、获取三大核心场景,结合基础...
阅读原文