AI项目和框架

MiroThinker v1.5

MiroThinker v1.5 是 MiroMind 团队开源的搜索智能体模型。模型通过交互式扩展技术,将推理与外部环境深度耦合,打破传统大模型依赖庞大参数的局限。
阅读原文

Paper2Any

Paper2Any是北京大学DCAI课题组推出的开源多模态AI辅助平台,基于自动化数据治理Agent框架DataFlow-Agent,能将科研论文自动转化为可编辑的PPT和SVG文件。支...
阅读原文

TuriX-CUA

TuriX-CUA 是基于 Python 开源的 AI 智能体,能通过 AI 技术实现桌面自动化操作。TuriX-CUA 通过截屏“看”屏幕,用多模态大模型“思考”下一步操作,完成用户指...
阅读原文

DLCM

DLCM(Dynamic Large Concept Models)是字节Seed团队推出的新型大语言模型架构。框架将模型的推理单位从传统的token(词)提升到concept(概念)层级,通过...
阅读原文

Voquill

Voquill是开源的语音输入工具,通过语音输入替代传统键盘打字,提升写作和记录效率。支持macOS、Windows和Linux系统,可在任何文本框和应用程序中使用,实现...
阅读原文

XVERSE-Ent

XVERSE-Ent是元象科技开源的专为泛娱乐领域设计的中英双语底座大模型,包含中文模型XVERSE-Ent-A4.2B和英文模型XVERSE-Ent-A5.7B。模型在角色一致性、长剧情...
阅读原文

Vibe Kanban

Vibe Kanban 是开源的看板工具,帮助开发者高效管理 AI 编码Agent,如 Claude Code、Gemini CLI 和 Codex 等。通过可视化看板,让用户能轻松切换和编排多个编...
阅读原文

ClipSketch AI

ClipSketch AI 是开源的 AI 驱动内容创作工具,专为视频创作者、社交媒体运营者和二创爱好者设计。能解析 Bilibili 和小红书的视频链接,自动提取关键帧并转...
阅读原文

IQuest-Coder-V1

IQuest-Coder-V1是IQuestLab推出的专注于代码生成、理解和优化的先进人工智能模型。具备多种参数规模(7B、14B、40B)和版本(Instruct、Thinking、Loop),...
阅读原文

mHC

mHC(Manifold-Constrained Hyper-Connections)是DeepSeek团队推出的新型的神经网络架构设计方法,解决传统超连接(Hyper-Connections, HC)架构在大规模训...
阅读原文

RedInk

RedInk(红墨)是开源的AI小红书图文生成工具,致力于简化内容创作流程。用户输入主题后,工具能快速生成吸睛标题、优质正文和精美配图,实现“一句话生成一套...
阅读原文

HY-Motion 1.0

HY-Motion 1.0(混元Motion 1.0)是腾讯混元团队开源的十亿参数级文本到 3D 动作生成大模型。基于 Diffusion Transformer(DiT)架构与流匹配机制,仅需一句...
阅读原文

AutoMV

AutoMV 是M-A-P、北京邮电大学、南京大学NJU-LINK实验室等机构开发的自动化多智能体系统,支持将歌曲转化为连贯、与节奏对齐的音乐视频。系统通过音乐信息检...
阅读原文

Tencent-HY-MT1.5

Tencent-HY-MT1.5 是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。模型支持33种国际语言互译及5种民汉/方言翻译,覆...
阅读原文

PersonaLive

PersonaLive 是澳门大学和 GVC 实验室开源的实时数字人直播工具。工具能在单张 12GB 显存的消费级显卡上运行,实现无限时长的肖像动画生成,支持低延迟互动。
阅读原文
12345166