AI项目和框架 - 第 55 页

KuaiMod

KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架，能高效识别和过滤有害及低质量内容。框架借鉴普通法（Common Law）体系，基于案例驱动的方式动...

阅读原文

AI工具

9个月前

WebThinker

WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型（LRMs）在推理过程中自主进行...

阅读原文

AI工具

9个月前

DeerFlow

DeerFlow 是字节跳动开源的深度研究框架，能帮助用户高效完成复杂的研究任务。DeerFlow结合语言模型与多种工具，如网络搜索、爬虫和 Python 执行，能快速生成...

阅读原文

AI工具

9个月前

ZeroSearch

ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架，基于强化学习激励大模型的搜索能力，无需与真实搜索引擎交互。框架爱基于大模型预训练知识，...

阅读原文

AI工具

9个月前

Chatlog

Chatlog是开源的聊天记录分析工具，支持高效解析、可视化和挖掘微信、QQ、Telegram等主流聊天工具的聊天记录。工具支持从本地数据库文件获取数据，提供智能分...

阅读原文

AI工具

9个月前

HunyuanCustom

HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件，支持生成具有特定主体和场景...

阅读原文

AI工具

9个月前

ICEdit

ICEdit（In-Context Edit）是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器（Diffusion Transformer）的强大生成能力和上下文感知能力...

阅读原文

AI工具

9个月前

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特...

阅读原文

AI工具

9个月前

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型，具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破...

阅读原文

AI工具

9个月前

VPP

VPP（Video Prediction Policy）是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型，学习互联网上的大量视频数据，直接预测未来场...

阅读原文

AI工具

9个月前

Amazon Nova Premier

Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型，能处理文本、图像和视频输入（不包括音频），擅长处理需要深度理解上下文、多步骤规划以及跨...

阅读原文

AI工具

9个月前

D-DiT

D-DiT（Dual Diffusion Transformer）是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型，能统一图像生成和理解任务。模型结合连续图像扩...

阅读原文

AI工具

9个月前

NoteLLM

NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别，用大型语言模型（LLM）的强大语义理解能...

阅读原文

AI工具

9个月前

kimi-thinking-preview

kimi-thinking-preview 是月之暗面推出的多模态思考模型，具备深度推理能力，擅长解决复杂问题，如代码、数学和工作难题。模型基于 reasoning_content 字段展...

阅读原文

AI工具

9个月前

3DV-TON

3DV-TON（Textured 3D-Guided Consistent Video Try-on via Diffusion Models）是阿里巴巴达摩院、湖畔实验室和浙江大学联合推出的基于扩散模型的视频虚拟试...

阅读原文

AI工具

9个月前