AI项目和框架

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面...
阅读原文

ReasonGraph

ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、Google 等),涵盖...
阅读原文

AndroidGen

AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模...
阅读原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴开源的多模态模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具备更符合人类偏好的回答风格、显著提升的数...
阅读原文

瀚海智语

瀚海智语(OceanDS)是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型,模型以360智脑13B和Deepseek-R1-...
阅读原文

LHM

LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构,融合3D几何...

龙猫LongCat

LongCat(龙猫)是美团自主研发的生成式AI大模型,通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力,能处理文本、图像等多种数据...
阅读原文

MoshiVis

MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息...

DeepMesh

DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。通过两项关键创新来优化网格生成:一...
阅读原文

BlockDance

BlockDance 是复旦大学联合字节跳动智能创作团队推出的用在加速扩散模型的新方法。BlockDance 基于识别重用相邻时间步中结构相似的时空特征(STSS),减少冗...
阅读原文

Reve Image

Reve Image 是 Reve 推出的全新 AI 图像生成模型。专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视觉作品。模型在生成图像时展...
阅读原文

RuoYi AI

RuoYi AI 是全栈式 AI 开发平台,提供完整的前端、后台管理及小程序应用,支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案,集成 Milvus/Weaviate 等向...
阅读原文

食神

食神是老板电器推出的首个烹饪垂直领域大模型。基于老板电器46年积累的海量烹饪数据,结合DeepSeek技术,能精准理解烹饪场景需求。用户可通过语音、文字等方...
阅读原文

Soundwave

Soundwave是香港中文大学(深圳)开源的语音理解大模型,专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术,有效解决了语音和文本在...
阅读原文

Motia

Motia 是专为软件工程师设计的 AI Agent 框架,简化 AI 智能体的开发、测试和部署过程。支持多种编程语言,如 Python、TypeScript 和 Ruby,开发者可以使用熟...
阅读原文
12425262728123