AI工具

Bolt3D

Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型,能在单个 GPU 上,仅需不到七秒的时间,直接从一...
阅读原文

Smithery

Smithery 是 MCP 服务器托管平台。基于 Model Context Protocol(MCP)规范,提供集中的枢纽,用在发现、托管和分发 MCP 服务器。Smithery 基于标准化的接口...
阅读原文

ima知识号

ima知识号是腾讯旗下ima推出的全新功能,为知识库创作者提供集中发布和管理知识库的平台。ima知识号配备数据分析工具,创作者能直观地查看知识库的数量、参与...
阅读原文

Qwen2.5-Omni

Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持流式文...
阅读原文

Cosmos-Reason1

Cosmos-Reason1 是 NVIDIA 推出的一系列多模态大型语言模型,基于物理常识和具身推理理解物理世界。Cosmos-Reason1包括两个模型:Cosmos-Reason1-8B 和 Cosmo...
阅读原文

Video-T1

Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在训...
阅读原文

Oliva

Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强生成)架构,帮助用户在 Qdrant 向量数据库中实时搜索信息。...
阅读原文

Mureka O1

Mureka O1是昆仑万维发布的全球首款音乐推理大模型,全球首个引入“思维链”(Chain of Thought,CoT)技术的音乐模型,Mureka O1在推理过程中加入思考与自我批...
阅读原文

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context learning)技术,使声场更加开阔...
阅读原文

Browseragent

Browseragent是基于浏览器的AI自动化工具,直接在浏览器中创建和运行AI工作流,无需API调用费用,实现零成本的无限次执行。Browseragent基于无代码可视化编辑...
阅读原文

pdf-craft

pdf-craft 是用在将 PDF 文件转换为其他格式(如 Markdown、EPUB)的工具,专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容,过滤掉页眉、页脚、...
阅读原文

TaoAvatar

TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真的3D全身虚拟形象,支持高分辨率渲染且...
阅读原文

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面...
阅读原文

ReasonGraph

ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、Google 等),涵盖...
阅读原文

MCP.so

MCP.so 是MCP资源平台,专注于收集和整理第三方 MCP(Model Context Protocol)服务器。MCP.so将资源分为三类,MCP Servers(目前有2995个)、MCP Clients,...
阅读原文
14142434445232