AI项目和框架

Qwen3.5-LiveTranslate

Qwen3.5-LiveTranslate 是阿里通义团队推出的实时同声传译大模型,支持60语种输入、29语种输出与3500+翻译组合,通过可读单元流式技术将端到端字均延迟压缩至...
阅读原文

HiDream-O1-Image-Pro

HiDream-O1-Image-Pro是智象未来推出的基于原生全模态架构UiT的图像大模型,超200B参数,在文生图、文字渲染、指令编辑等任务刷新SOTA。模型将图像像素、文本...
阅读原文

Agora-1

Agora-1 是 Odyssey 推出的首款多智能体世界模型,支持人类与 AI 在同一实时生成的世界模拟中互动。模型以经典 FPS 游戏 GoldenEye 007 为研究场景,最多支持...
阅读原文

CloudDM

CloudDM 是 ClouGence 团队开源的数据库研发与管控平台。CloudDM将数据查询、SQL 审核、权限管控等数据库核心能力集成于统一平台,支持 30 种数据源,覆盖 My...
阅读原文

Hy-MT2

Hy-MT2是腾讯混元开源的新一代翻译大模型,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译及 5 种民汉/方言翻译。
阅读原文

Gemini 3.5 Flash

Gemini 3.5 Flash 是 Google 推出的新一代AI大模型,以前沿智能+行动能力为核心定位。模型在 Terminal-Bench 2.1 编码基准得分 76.2%、GDPval-AA 代理任务 16...
阅读原文

Gemini Omni Flash

Gemini Omni Flash 是 Google  I/O 大会推出的视频生成模型,定位从任意输入生成任意输出的统一多模态生成模型。
阅读原文

ESP-Claw

ESP-Claw 是乐鑫推出的物联网设备 AI Agent 框架,采用"Chat Coding"理念,让用户通过自然语言对话可定义和修改硬件设备行为。
阅读原文

Qwen3.7 Preview

Qwen3.7 Preview 是阿里通义千问团队推出的下一代旗舰大模型预览版,包含Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两个版本。
阅读原文

Composer 2.5

Composer 2.5 是 Cursor 推出的自研 Agentic 编程模型。在智能水平和行为表现上较 Composer 2 有大幅提升,在 SWE-Bench Multilingual(79.8%) 和 CursorBen...
阅读原文

Chronicles-OCR

Chronicles-OCR 是腾讯混元联合中国科学院信息工程研究所、安阳师范学院、南开大学及故宫博物院共同推出的业界首个覆盖中国汉字"七体之变"完整演化...
阅读原文

Higgs Avatar v1

Higgs Avatar v1 是BosonAI推出的面向语音智能体的实时 AI 数字人模型。模型仅需一张静态照片,可生成具备口型同步、面部表情与头部动作的实时交互数字人。
阅读原文

MemPrivacy

MemPrivacy 是记忆张量(MemTensor)团队联合荣耀 AI 团队及同济大学共同开源的端云协同 Agent 隐私保护框架。针对云端 Agent 长期记忆场景中的隐私泄露风险...
阅读原文

PPT Master

PPT Master 是开源的AI驱动PPT生成标准化工作流(Skill),可在具备Agent智能体能力的AI IDE中运行,实现PDF、DOCX、XLSX、网址、Markdown、PPTX等任意格式文...
阅读原文

Violin

Violin 是牛津大学博士后 Kevin Lin 开源的端到端 AI 视频翻译工具,打破高质量视频内容的语言壁垒。集成 Whisper 语音识别、大语言模型翻译与 TTS 语音合成...
阅读原文
123190