AI项目和框架

SIMA 2

SIMA 2是谷歌DeepMind开发的最新一代AI智能体,在虚拟3D世界中展现出强大的交互、推理和学习能力。SIMA 2基于Gemini技术构建,采用“Gemini-SIMA Fusion”三层...
阅读原文

SmartResume

SmartResume 是阿里巴巴开源的智能简历解析工具。SmartResume通过 OCR 文本提取、PDF 元数据解析、版面检测和 LLM 智能结构化处理,将 PDF、图片、Word 等格...
阅读原文

Astron Agent

Astron Agent 是企业级、商业友好的智能工作流开发平台,基于科大讯飞的核心技术打造。平台集成 AI 流程编排、模型管理、智能 RPA 自动化等功能,支持高可用...
阅读原文

文心大模型5.0

文心大模型5.0(文心5.0)是百度推出的原生全模态大模型,参数量达2.4万亿。模型采用统一自回归架构,实现文本、图像、音频、视频等多模态数据的理解与生成一...
阅读原文

GPT-5.1

GPT-5.1 是 OpenAI 对 GPT-5 系列的升级版本,能提升智能性和沟通能力。GPT-5.1包含两个版本,GPT-5.1 Instant 和 GPT-5.1 Thinking。
阅读原文

KaLM-Embedding

KaLM-Embedding 是腾讯团队推出的一系列高性能文本嵌入模型,通过先进的训练技术和高质量数据提升文本嵌入的性能。最新版本 KaLM-Embedding-V2 在架构和训练...
阅读原文

LazyCraft

LazyCraft 是开源的 AI Agent 应用开发与管理平台,由商汤基于其开源框架 LazyLLM 构建。帮助开发者以低门槛、低成本快速构建和发布大模型应用。平台提供从应...
阅读原文

Kosong

Kosong 是月之暗面(Moonshot AI)开源的全新AI Agent开发框架,为开发者提供一个轻量、灵活且高度可扩展的底层支持,以构建下一代智能体应用。通过异步工具...
阅读原文

ERNIE-4.5-VL

ERNIE-4.5-VL是百度文心开源的新一代多模态AI模型,基于ERNIE-4.5-VL-28B-A3B架构,激活参数3B,主打视觉语言理解与跨模态推理。模型通过海量视觉-语言数据训...
阅读原文

Qoder Rules

Qoder Rules 是开源的完整代码规范和模板系统,能帮助开发者使用 Qoder 进行更高效、规范的开发。Qoder Rules 遵循阿里云 AI 架构和最佳实践,涵盖开发需求、...
阅读原文

Doubao-Seed-Code

Doubao-Seed-Code 是字节跳动推出的 AI 编程模型,专为 Agentic 编程任务优化。模型支持 256K 长上下文,可处理复杂代码场景,具备视觉理解能力,能根据设计...
阅读原文

Omnilingual ASR

Omnilingual ASR 是 Meta AI 推出的自动语音识别系统,支持超过1600种语言,包括500种低资源语言。Omnilingual ASR通过扩展 wav2vec 2.0 编码器到70亿参数,...
阅读原文

DeepEyesV2

DeepEyesV2 是小红书团队推出的多模态智能体模型,通过两阶段训练法实现强大的工具调用和多模态推理能力。模型能理解图文信息,支持主动调用代码执行、网络搜...
阅读原文

SenseNova-SI

SenseNova-SI 是商汤开源的空间智能大模型,专注于提升空间智能。模型通过大规模、高质量的空间数据训练,显著增强模型在空间测量、关系理解、视角转换等核心...
阅读原文

Frappe Builder

Frappe Builder 是低代码网站构建AI工具,帮助用户轻松创建和发布美观的网站。通过直观的可视化编辑器,提供类似 Figma 的设计体验,让用户能快速搭建网页布...
阅读原文
11011121314166