豆包大模型1.6

豆包大模型1.6(Doubao-Seed-1.6)是字节跳动推出的多模态深度思考大模型。模型支持auto、thinking和non-thinking三种思考模式,能处理文字、图片、视频等多...
阅读原文

Reor

Reor是开源的本地化AI个人知识管理应用。应用支持自动链接相关笔记、语义搜索和Q&A功能,用户基于类似Obsidian的Markdown编辑器进行笔记编辑。Reor基于Ol...
阅读原文

Seedance 1.0

Seedance 1.0 是字节跳动Seed团队推出的视频生成基础模型。模型支持文字与图片输入,能生成多镜头无缝切换的1080p高品质视频,具备原生多镜头叙事能力,能进...
阅读原文

o3-pro

o3-pro 是OpenAI推出的强大推理模型,作为 o3 的升级版,在处理复杂问题和提供精准回答方面表现出色,尤其在科学研究、编程、教育和写作等场景中优势明显。o3...
阅读原文

Tripo Studio

Tripo Studio 是3D 大模型公司 VAST 推出的全球首个 AI 驱动的一站式 3D 工作台,深度融合了 Tripo 核心算法套件,覆盖从模型生成、材质贴图到骨骼绑定的全流...
阅读原文

Magistral

Magistral 是 Mistral AI 推出的推理模型,核心聚焦在透明、多语言和特定领域的推理能力。模型包含 Magistral Small(开源版)和 Magistral Medium(企业版)...
阅读原文

Vui

Vui 是 Fluxions-AI 团队开源的轻量级语音对话模型,基于 LLaMA 架构。模型经过 4 万小时对话训练,能模拟真实对话中的语气词、笑声和停顿,提供沉浸式交互体...
阅读原文

Krea 1

Krea 1 是 Krea AI 推出的 AI 图像生成模型,解决传统 AI 图像生成中的“AI 美学”问题。模型能生成高度逼真、纹理清晰的图像,支持多种艺术风格,提供风格参考...
阅读原文

InftyThink

InftyThink是创新的大模型推理范式,突破传统模型在长推理任务中的局限性。通过分段迭代的方式,将复杂的推理过程分解为多个短片段,在每个片段后生成中间总...
阅读原文

Huxe AI

Huxe AI 是创新的个人音频伴侣应用,由谷歌旗下热门 AI 播客应用 NotebookLM 的核心团队成员创立。通过生成式 AI 技术,将用户关心的内容转化为个性化的音频...
阅读原文

SmolVLA

SmolVLA 是 Hugging Face 开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,模型小巧,可在CPU上运行,单个消费级GPU即可...
阅读原文

ContentV

ContentV是字节跳动开源的80亿参数文生视频模型框架。将Stable Diffusion 3.5 Large的2D-VAE替换为3D-VAE并引入3D位置编码,使图像模型快速获得视频生成能力。
阅读原文

PartCrafter

PartCrafter 是先进的3D生成模型,能从单张RGB图像中生成多个语义明确且几何形态各异的3D网格。通过组合潜在空间表示每个3D部件,使用层次化注意力机制在部件...
阅读原文

MaskSearch

MaskSearch是阿里巴巴通义实验室推出的新型通用预训练框架,提升大型语言模型(LLM)的智能体搜索能力。通过检索增强掩码预测(RAMP)任务,让模型在输入文本...
阅读原文

MAS-Zero

MAS-Zero是 Salesforce 推出的多智能体系统(MAS)设计框架,能在无需人类监督的情况下自动设计和优化MAS。框架基于元级设计,在推理时动态地对每个问题实例...
阅读原文
12345233