MaxClaw部署教程

最近的AI圈几乎都被这只龙虾刷屏了... OpenClaw 可以像真人一样理解指令,并自己拆解任务,自动跑完我们要求的整个工作流程,但部署门槛难倒了一大批人。 ...
阅读原文

Fun-CosyVoice3.5

Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力—...
阅读原文

FireRed-OCR

FireRed-OCR 是小红书团队开源的轻量级文档结构解析视觉语言模型,以仅 2B 参数的规模在 OmniDocBench v1.5 权威评测中斩获 92.94% 综合得分,超越 GPT-5.2、...
阅读原文

Fun-AudioGen-VD

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle&quo...
阅读原文

Epismo

Epismo 是 AI 工作流管理与协作平台,致力于将零散的 AI 操作经验转化为标准化的"技能"单元。平台支持 Gemini、Claude、ChatGPT 等多种 AI Agent ...
阅读原文

theORQL

theORQL 是具备视觉感知能力的前端 AI 编程工具。工具打通了 Chrome DevTools 与 VS Code/Cursor,实现运行时全景感知,能捕获 DOM、CSS、网络请求和 Console...
阅读原文

Goose

Goose 是 Block 开源的本地 AI Agent 框架,能自主执行完整工程任务——读文件、写代码、跑测试、调 API、自动 Debug,出错后自我修正直至完成。
阅读原文

Nano Banana 2 实测

Nano Banana 2 来了。 昨天,谷歌推出最新图像模型 Nano Banana 2(Gemini 3.1 Flash Image),发布即空降 Arena 文生图排行榜第一!Lovart 第一时间就可以体...
阅读原文

DataClaw

DataClaw 是开发者Peter O'Malle开源的AI对话数据导出工具。能自动抓取用户与Claude Code、Codex CLI、Gemini CLI等AI编程助手的完整对话历史,将其转换...
阅读原文

OpenSandbox

OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台,采用 Apache 2.0 协议,专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK(Python、Java/Ko...
阅读原文

MeowTXT

MeowTXT 是在线 AI 音视频转文字工具,主打极速、精准的转录体验。用户只需拖拽上传 MP3、MP4、WAV 等文件,或直接粘贴 YouTube 链接,可在数分钟内获得文字...
阅读原文

TinyClaw

TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架,专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent(如 @coder、@writer)...
阅读原文

OpenFang

OpenFang 是用 Rust 构建的开源 Agent 操作系统,核心创新是 Hands——7 个预置的自主能力包,让 AI 无需人工触发可 7×24 小时自动执行任务(如监控竞品、挖掘...
阅读原文

Transcript LOL

Transcript LOL 是面向专业人士的 AI 音视频转录工具,已服务全球 10 万+用户。基于 OpenAI Whisper 技术,可在数秒内将音频或视频高精度转为文字,支持 70+ ...
阅读原文

AngelSlim

AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音...
阅读原文
1231,608