yuxinlu1 Gemma4-12B

yuxinlu1 Gemma4-12B 是个人开发者逯雨基于 Google Gemma 4 12B 指令模型微调的开源编程与 Agentic 模型系列,包含 V1 代码版和 V2 Agentic 版 。
阅读原文

LongCat-2.0

LongCat-2.0 是美团开源的大规模 MoE 语言模型,拥有 1.6 万亿总参数,每 token 激活约 480 亿,基于 AI ASIC 超算集群完成训练与部署。
阅读原文

TanStarter

TanStarter 是基于 TanStack Start 全栈框架和 Cloudflare 边缘网络构建的 SaaS 启动模板,专为独立开发者和小团队设计。内置了完整的用户系统、支付(订阅/...
阅读原文

VibeThinker-3B

VibeThinker-3B是新浪微博团队开源的 30 亿参数密集推理模型,基于 Qwen2.5-Coder-3B 构建,通过升级版 Spectrum-to-Signal 后训练流程,在数学、编程等可验...
阅读原文

Agent-Reach

Agent-Reach 是开源免费的 AI Agent 互联网能力脚手架。工具通过一句话指令可为 Claude Code、Cursor、OpenClaw 等主流 Agent 一键安装联网能力,支持 Twitte...
阅读原文

SeedMusic 1.0

SeedMusic 1.0 是字节跳动推出的初代 AI 音乐生成模型,让普通用户能零门槛创作原创音乐。用户只需输入文本提示(如情绪、流派、场景或乐器描述),或提供一...
阅读原文

RedKnot

RedKnot 是小红书开源的长文本 LLM 推理加速引擎,将 KV Cache 按注意力头维度解耦,离线分类为需全局重算的全局头与可局部复用的局部头,配合 SegPagedAtten...
阅读原文

虎牙VAM 1.0

虎牙VAM 1.0(Vivid Avatar Model)是虎牙推出的基于DiT架构的实时多模态数字人基础模型,一张照片可生成能说话、能唱歌跳舞的AI数字人。
阅读原文

Wan-Streamer

Wan-Streamer 是阿里达摩院开源的端到端实时全双工多模态基础模型,通过统一因果 Transformer 架构将文本、音频、视频的输入输出 token 整合为同一条因果序列...
阅读原文

BrowserBC

BrowserBC 是 Einsia AI 旗下 Navers Lab 发布的开源项目,核心目标是将人类在浏览器中的操作轨迹转化为可复用的自然语言技能(Skill),让 Web Agent 能&quo...
阅读原文

Vidy

Vidy是生数科技推出的AI陪伴应用,定位 AI Vibe Buddy,支持文字、语音互动。产品内置Humi等AI角色,具备关系成长记忆系统,能随对话积累理解用户习惯与情绪。
阅读原文

袋马

袋马(daimax)是高德推出的 AI 应用生成平台,主打 Vibe Coding 零代码开发。用户用自然语言描述需求,可在分钟级生成可上线的小程序或 iOS 原生应用。
阅读原文

千问输入法

千问输入法是阿里巴巴通义千问团队推出的独立AI语音输入法,主打"说得随意,写得漂亮"。底层接入千问大模型的CosyVoice语音与文本理解能力,不只是...
阅读原文

Krea 2

Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型,定位为"美学优先"的创意协作者。专注于视觉美学一致性、风格迁移和创意控制,而非单纯...
阅读原文

HTML Anything

HTML Anything 是 nexu-io 团队开源的 Agent 时代 HTML 编辑器,内置 75 套 Skill 模板覆盖杂志、演示、海报、小红书卡片等 9 种交付形态,可自动识别本地 18...
阅读原文
1231,647