Wan2.7-Image

Wan2.7-Image是通义实验室推出的AI图像生成与编辑模型,支持深度自定义人物形象(脸型、眼型、骨相等),告别千篇一律的「AI标准脸」,可精准生成4000+字符及...
阅读原文

小精龙

小精龙是学而思推出的面向学生的AI智能学伴(Agent),基于OpenClaw架构打造。工具通过"大脑映射"持续理解学生的知识漏洞与思维习惯,将学习轨迹沉...
阅读原文

Lightpanda

Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器,用 Zig 语言从零编写,不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16,执行速度...
阅读原文

天工短剧工作台

天工短剧工作台是昆仑万维推出的AI短剧创作平台,基于多Agent协同,整合Seedance、可灵等全球顶尖视频模型。平台支持传统与智能分镜双模式,通过资产提取Agen...
阅读原文

Veo 3.1 Lite

Veo 3.1 Lite 是 Google 最新推出的AI视频生成模型,成本比 Veo 3.1 Fast 降低 50% 以上,同时保持同等生成速度。模型支持文本/图像生成视频,可灵活切换横竖...
阅读原文

TeamClaw

TeamClaw 是AI 员工团队管理平台,定位"一个人的 AI 办公室"。平台能让用户像招聘真实员工一样定义 AI 岗位(CEO、分析师等),角色秒级到岗;支持...
阅读原文

ColaMD

ColaMD 是开源的 Markdown 编辑器。工具解决了传统编辑器在 AI 修改文件后需手动刷新才能看到更新的痛点,实现 Agent 后台修改与前台内容的实时同步,如同观...
阅读原文

harrier-oss-v1

harrier-oss-v1 是微软开源的多语言文本嵌入模型,在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构,通过最后 token 池化和 L2 归...
阅读原文

LongCat-AudioDiT

LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音(TTS)模型,核心创新在于直接在波形潜空间进行扩散生成,非传统梅尔频谱等中间表示,有效避免误差累...
阅读原文

Vision2Web

Vision2Web是清华大学和智谱AI联合推出的视觉网站开发评估基准,用于评估多模态AI Agent的端到端建站能力。Vision2Web包含193个真实网站任务,分为三层递进难...
阅读原文

wecom-cli

wecom-cli(企业微信 CLI) 是企业微信官方团队开源的命令行工具,让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文...
阅读原文

PixVerse V6

PixVerse V6 是爱诗科技推出的最新 AI 视频生成模型。模型在镜头控制、角色表现和多镜头音视频生成方面实现突破,运镜更精准,角色情绪跨帧连贯,物理交互更...
阅读原文

Multi-Shot

Multi-Shot 是 Runway 推出的 AI 视频生成应用,支持实现"一键成片"。用户只需输入场景描述,系统自动拆解为最多5个连贯镜头,同步完成构图、运镜...
阅读原文

Qwen3.5-Omni

Qwen3.5-Omni 是阿里通义实验室推出的全模态大模型,可同时理解文本、图像、音频及音视频输入。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,在215项音...
阅读原文

Pascal Editor

Pascal Editor 是基于 Web 的开源 3D 建筑编辑器,由 Claude 辅助开发。工具无需安装,浏览器可运行,采用 WebGPU 技术实现高性能渲染。
阅读原文
1567891,624