在哪儿问问

在哪儿问问是滴滴推出的AI图寻小程序,用户可通过上传照片,让AI识别照片中的地点,获取其大致位置。提供地点查找功能,能推荐相似地点及照片中的相关产品,...
阅读原文

xLLM

xLLM 是京东开源的高效智能推理框架,专为国产芯片优化,支持端云一体部署。框架用服务-引擎分离架构,服务层负责请求调度与容错,引擎层专注运算优化,具备...
阅读原文

SciToolAgent

SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等多领域,可处理数据...
阅读原文

Mano

Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2W...
阅读原文

Tinker API

Tinker API 是 Thinking Machines Lab 发布的首款产品,专为语言模型微调而设计。简化语言模型的微调流程,让研究人员和开发者能专注于算法和数据,无需担心...
阅读原文

LONGLIVE

LONGLIVE 是英伟达等顶尖机构联合推出的实时交互式长视频生成框架。框架通过帧级自回归(AR)模型,结合 KV-recache 机制、流式长视频微调和短窗口注意力 + ...
阅读原文

Dreamer 4

Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)游戏中,Dreamer ...
阅读原文

Logics-Parsing

Logics-Parsing 是阿里巴巴开源的端到端文档解析模型,基于 Qwen2.5-VL-7B。通过强化学习优化文档布局分析和阅读顺序推断,能将 PDF 图像转换为结构化 HTML ...
阅读原文

聆音EchoCare

聆音(EchoCare)是中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)推出的超声大模型。模型依托450万张超声影像数据集EchoAtlas进行训练,数据集...
阅读原文

RoboBrain-X0

RoboBrain-X0是北京智源人工智能研究院开源的全球首个支持零样本跨本体泛化的具身模型。能在无需微调的情况下,驱动多种不同构造的真实机器人完成基础操作任...
阅读原文

Ring-1T-preview

Ring-1T-preview 是蚂蚁集团开源的万亿参数大模型预览版,基于 Ling 2.0 MoE 架构,在 20T 语料上预训练,通过自研强化学习系统 ASystem 进行推理能力训练。...
阅读原文

GLM-4.6

GLM-4.6 是智谱推出的新一代基座大模型,总参数量达 355B,激活参数 32B。模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力及智能体应用等方面实...
阅读原文

豆包大模型1.6-vision

豆包大模型1.6-vision是火山引擎推出的具备工具调用能力的视觉深度思考模型。模型拥有强大的通用多模态理解和推理能力,支持Responses API,能自主调用工具如...
阅读原文

OpenPPT

OpenPPT 是开源的PPT工具,核心服务基于ChatPPT能提供高效、便捷的 PPT 制作体验。工具支持多平台使用,包括 Windows、macOS 和 Linux,让用户能在不同设备上...
阅读原文

Claude Sonnet 4.5

Claude Sonnet 4.5 是 Anthropic 最新推出的最强编程模型。模型在编程、计算机操作、推理和数学等多个领域表现出色,在 SWE-bench Verified 测试中登顶,能专...
阅读原文
1910111213283