AI项目和框架

ListenHub CLI

ListenHub CLI是开源的AI内容创作命令行工具,基于Node.js,支持在终端一键生成音乐、播客、PPT、语音及AI绘画。工具支持本地文件上传、JSON输出和异步模式,...
阅读原文

Seeduplex

Seeduplex是字节跳动Seed团队推出的原生全双工语音大模型,实现"边听边说"的实时交互。模型能精准抗干扰(误打断率降50%)、动态判停(抢话率降40%...
阅读原文

OmniVoice

OmniVoice是小米 AI 实验室新一代 Kaldi 团队开源的超大规模多语言TTS模型,支持600+语种零样本语音克隆。模型采用极简非自回归扩散架构,结合全码本随机Mask...
阅读原文

CutClaw

CutClaw是大湾区大学GVC实验室与北交大团队开源的AI视频剪辑工具。工具采用多智能体架构,通过"音乐驱动"方式将几小时长视频自动剪辑成节奏精准的...
阅读原文

Muse Spark

Muse Spark是Meta超级智能实验室推出的首个原生多模态大模型。作为Meta AI重组后的旗舰产品,模型在Artificial Analysis基准测试中从18分跃升至52分,多模态...
阅读原文

MMX-CLI

MMX-CLI 是 MiniMax 专为 AI Agent 打造的全模态命令行工具,支持文本、图像、视频、语音、音乐生成及视觉理解等能力。Agent 可在 Claude Code、OpenClaw 等...
阅读原文

HappyHorse

HappyHorse是空降Artificial Analysis视频生成盲测榜榜首的神秘AI模型,以1347分Elo积分断层领先Seedance 2.0,文生/图生视频双冠。
阅读原文

LifeSim

LifeSim是复旦大学与上海创智学院推出的首个长程用户生活模拟框架,用于评测个性化AI助手。框架基于BDI认知模型,同时建模用户内部认知(信念、愿望、意图)...
阅读原文

Claude Mythos

Claude Mythos是Anthropic推出的最新AI模型,在编程、网络安全等领域性能远超前代Opus 4.6。模型能自主发现零日漏洞、构建复杂攻击链,曾表现出掩盖操作痕迹...
阅读原文

PixVerse C1

PixVerse C1是爱诗科技推出的全球首个影视行业大模型,支持文生/图生/参考生/首尾帧视频生成,最高输出15秒1080P音画同步视频。模型首创多宫格智能分镜功能,...
阅读原文

GLM-5.1

GLM-5.1是智谱推出的全球最强开源模型,8小时长程任务执行。模型代码能力在SWE-Bench Pro基准测试中位列全球第一,超越GPT-5.4和Claude Opus 4.6。GLM-5.1是...
阅读原文

VoxCPM2

VoxCPM2是OpenBMB开源的2B参数语音合成模型。模型采用无分词器扩散自回归架构,支持30种语言及中文方言,输出48kHz录音室级音质。
阅读原文

OpenHarness

OpenHarness 是香港大学数据智能实验室(HKUDS)开源的轻量级 AI Agent 框架,用纯 Python 实现,仅 11,733 行代码(为 Claude Code 的 1/44 体积),复刻了...
阅读原文

LLM Wiki

LLM Wiki是Karpathy推出的自主运行的个人知识库,突破传统RAG"每次查询从零检索"的局限。LLM Wiki通过Schema文件指导LLM主动维护结构化Markdown Wi...
阅读原文

OmniWeaving

OmniWeaving是浙江大学联合腾讯混元、南洋理工大学推出的统一视频生成框架。框架突破传统开源模型单一任务限制,实现多模态自由组合与推理增强生成,能将交错...
阅读原文
123181