AI项目和框架

Gemini 3.5 Flash

Gemini 3.5 Flash 是 Google 推出的新一代AI大模型,以前沿智能+行动能力为核心定位。模型在 Terminal-Bench 2.1 编码基准得分 76.2%、GDPval-AA 代理任务 16...
阅读原文

Gemini Omni Flash

Gemini Omni Flash 是 Google  I/O 大会推出的视频生成模型,定位从任意输入生成任意输出的统一多模态生成模型。
阅读原文

ESP-Claw

ESP-Claw 是乐鑫推出的物联网设备 AI Agent 框架,采用"Chat Coding"理念,让用户通过自然语言对话可定义和修改硬件设备行为。
阅读原文

Qwen3.7 Preview

Qwen3.7 Preview 是阿里通义千问团队推出的下一代旗舰大模型预览版,包含Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两个版本。
阅读原文

Composer 2.5

Composer 2.5 是 Cursor 推出的自研 Agentic 编程模型。在智能水平和行为表现上较 Composer 2 有大幅提升,在 SWE-Bench Multilingual(79.8%) 和 CursorBen...
阅读原文

Chronicles-OCR

Chronicles-OCR 是腾讯混元联合中国科学院信息工程研究所、安阳师范学院、南开大学及故宫博物院共同推出的业界首个覆盖中国汉字"七体之变"完整演化...
阅读原文

Higgs Avatar v1

Higgs Avatar v1 是BosonAI推出的面向语音智能体的实时 AI 数字人模型。模型仅需一张静态照片,可生成具备口型同步、面部表情与头部动作的实时交互数字人。
阅读原文

MemPrivacy

MemPrivacy 是记忆张量(MemTensor)团队联合荣耀 AI 团队及同济大学共同开源的端云协同 Agent 隐私保护框架。针对云端 Agent 长期记忆场景中的隐私泄露风险...
阅读原文

PPT Master

PPT Master 是开源的AI驱动PPT生成标准化工作流(Skill),可在具备Agent智能体能力的AI IDE中运行,实现PDF、DOCX、XLSX、网址、Markdown、PPTX等任意格式文...
阅读原文

Violin

Violin 是牛津大学博士后 Kevin Lin 开源的端到端 AI 视频翻译工具,打破高质量视频内容的语言壁垒。集成 Whisper 语音识别、大语言模型翻译与 TTS 语音合成...
阅读原文

Intern-S2-Preview

Intern-S2-Preview 是上海人工智能实验室开源的新一代书生科学多模态大模型预览版,以35B参数规模实现比肩万亿参数模型的科学能力。模型通过"通专融合&q...
阅读原文

OpenHuman

OpenHuman 是 tinyhumansai 团队推出的开源个人 AI 超级智能助手,定位为"Your Personal AI super intelligence",主打私有、简单且极其强大。非传...
阅读原文

Pixal3D

Pixal3D 是腾讯 ARC 实验室联合清华大学、惠灵顿维多利亚大学推出的单图像 3D 生成项目。Pixal3D通过反向投影将像素特征显式提升到三维空间,建立直接的像素...
阅读原文

HiCAD

HiCAD 是开源的 AI 参数化 3D CAD 建模平台,专为 3D 打印爱好者设计。用户用自然语言描述需求,AI 可秒级生成可编辑的 JSCAD 参数化代码,配合实时 3D 预览...
阅读原文

Kimi WebBridge

Kimi WebBridge 是月之暗面推出的浏览器扩展插件,面向 Kimi Code、Claude Code、Cursor、Codex 等本地 AI Agent。
阅读原文
1678910197