AI工具

Happy

Happy是什么 Happy 是开源工具,能让用户通过手机或网页客户端远程控制电脑上运行的 Claude Code 或 Codex。支持实时查看代码进度、语音交互、消息推送,采...
阅读原文

Step 3.5 Flash

Step 3.5 Flash 是阶跃星辰最新开源的基座模型,专为 Agent 场景推出。模型采用稀疏 MoE 架构,总参数 1960 亿,每 token 仅激活 110 亿参数,兼顾性能与效率。
阅读原文

元宝派

元宝派是腾讯元宝APP推出的AI社交功能,让AI元宝成为群聊中的正式成员,构建"人机共生"的社交空间。用户可随时@元宝进行对话,元宝派性格有趣、能...
阅读原文

Vidu Q3

Vidu Q3 是生数科技推出的全球首款 16 秒音画同步 AI 视频模型,专为短剧、漫剧、广告等叙事场景打造。一次提示即可直出 16 秒 1080p 成片,画面、对白、环境...
阅读原文

UnifoLM-VLA-0

UnifoLM-VLA-0 是宇树科技开源的通用视觉-语言-动作(VLA)大模型,基于 Qwen2.5-VL-7B 架构进行持续预训练。
阅读原文

MOVA

MOVA(MOSS Video and Audio)是上海创智学院OpenMOSS团队与模思智能(MOSI)联合推出的,中国首个高性能开源音视频端到端生成模型。模型突破传统视频"...
阅读原文

TTT-Discover

TTT-Discover(Test-Time Training to Discover)是斯坦福、英伟达等机构推出的AI科学发现方法。TTT-Discover在测试阶段对模型进行强化学习训练,非冻结权重...
阅读原文

Project Genie

Project Genie 是谷歌 DeepMind 推出的实验性 AI 世界模型原型,基于 Genie 3、Nano Banana Pro 和 Gemini 技术驱动。用户通过文字提示或上传图片可创建虚拟...
阅读原文

LingBot-World

LingBot-World 是蚂蚁灵波科技开源的交互式世界模型。模型通过可扩展数据引擎从大规模游戏环境学习物理规律与因果关系,实现动作驱动的精准生成。
阅读原文

Qwen3-ASR

Qwen3-ASR 是阿里云通义千问团队开源的系列语音识别模型,包含 1.7B 高精度版、0.6B 高效版两个 ASR 模型,以及专用的 Qwen3-ForcedAligner-0.6B 强制对齐模型。
阅读原文

SenseNova-MARS

SenseNova-MARS是商汤科技开源的多模态自主推理模型,提供8B和32B两种参数规模。作为首个支持动态视觉推理与图文搜索深度融合的Agentic VLM,模型能像智能体...
阅读原文

SkyReels-V3

SkyReels-V3是昆仑万维开源的多模态视频生成模型,用单一架构实现专业级视频创作。模型能将静态图像转化为动态影像,支持智能延长视频时长和电影级转场,让数...
阅读原文

Mureka V8

Mureka V8是昆仑万维推出的AI音乐大模型,基于MusiCoT(Music Chain-of-Thought)技术架构,实现从声音拼接到类人创作逻辑的跨越。
阅读原文

LongCat-Flash-Lite

LongCat-Flash-Lite是美团推出的新一代高效大语言模型。模型采用创新的混合专家(MoE)+ N元语法嵌入架构,总参数量达685亿,每次推理仅激活约29~45亿参数,...
阅读原文

Zopia

Zopia 是全流程AI短剧创作Agent,定位为"对话式AI影像工作室"。用户通过自然语言描述创意,系统可自动完成从剧本拆解、角色设计、分镜生成到视频成...
阅读原文
123306