Browseragent

Browseragent是基于浏览器的AI自动化工具,直接在浏览器中创建和运行AI工作流,无需API调用费用,实现零成本的无限次执行。Browseragent基于无代码可视化编辑...
阅读原文

pdf-craft

pdf-craft 是用在将 PDF 文件转换为其他格式(如 Markdown、EPUB)的工具,专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容,过滤掉页眉、页脚、...
阅读原文

TaoAvatar

TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,支持高分辨率渲染且...
阅读原文

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面...
阅读原文

ReasonGraph

ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、Google 等),涵盖...
阅读原文

MCP.so

MCP.so 是MCP资源平台,专注于收集和整理第三方 MCP(Model Context Protocol)服务器。MCP.so将资源分为三类,MCP Servers(目前有2995个)、MCP Clients,...
阅读原文

AndroidGen

AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模...
阅读原文

Fluently

Fluently 是 AI英语学习应用,帮助用户提升英语水平。Fluently基于评估用户的英语能力,生成个性化学习计划,涵盖发音、语法、词汇和流利度等方面。用户在真...
阅读原文

Revid AI

Revid AI 是 AI 视频生成工具,帮助用户快速创作吸引人的短视频。Revid AI基于分析海量热门视频数据,提供从脚本生成、语音选择到视频风格定制的一站式服务。...
阅读原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴开源的多模态模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具备更符合人类偏好的回答风格、显著提升的数...
阅读原文

瀚海智语

瀚海智语(OceanDS)是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型,模型以360智脑13B和Deepseek-R1-...
阅读原文

LHM

LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构,融合3D几何...

鼠鼠求职

鼠鼠求职是AI求职招聘平台,专注于为求职者和企业提供高效、智能的招聘解决方案。通过AI智聘鼠功能,能快速理解求职者需求,精准筛选并推荐符合要求的岗位,...
阅读原文

龙猫LongCat

LongCat(龙猫)是美团自主研发的生成式AI大模型,通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力,能处理文本、图像等多种数据...
阅读原文

MoshiVis

MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息...