多模态交互 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

MiniCPM-V 4.6

MiniCPM-V 4.6 是 OpenBMB 推出的端侧多模态大模型，LLM 参数量仅 1.3B，专为移动设备本地部署优化。模型基于 llama.cpp 框架实现，支持 iOS、Android、Harmo...

阅读原文

AI工具

2个月前

lingbot-VA

LingBot-VA 是蚂蚁灵波科技开源的全球首个面向通用机器人控制的因果视频-动作世界模型。模型将视频世界建模与策略学习统一为自回归框架，使机器人能同时预测...

阅读原文

AI工具

6个月前

Youtu-LLM

Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型，参数规模为 19.6 亿。专为智能体任务设计，具备强大的“原生智能体能力”，在多项任务中超越同规模甚至更大...

阅读原文

AI工具

7个月前

QwenLong-L1.5

QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构，通过系统化的后训练方案，显著提升长文本推理能力。

阅读原文

AI工具

7个月前

GLM-4.7

GLM-4.7 是智谱AI推出的开源模型，专注于提升编码能力、推理能力和工具协同。模型在多语言编程、复杂任务规划、前端设计美学等方面表现出色，支持多种编程框...

阅读原文

AI工具

7个月前

OpenAgents

OpenAgents 是用在构建AI Agent网络的开源框架，将Agent连接到网络实现开放式协作。框架通过创建持久化的Agent网络，让Agent能像人类一样长期在线、相互协作...

阅读原文

AI工具

10个月前

豆包大模型1.6-vision

豆包大模型1.6-vision是火山引擎推出的具备工具调用能力的视觉深度思考模型。模型拥有强大的通用多模态理解和推理能力，支持Responses API，能自主调用工具如...

阅读原文

AI工具

10个月前

DreamVVT

DreamVVT 是字节跳动和清华大学（深圳）联合推出的视频虚拟试穿（Video Virtual Try-On, VVT）技术，基于扩散 Transformer（DiTs）框架，通过两阶段方法实现...

阅读原文

AI工具

12个月前

dots.vlm1

dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于一个从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型（LLM），具备强大的视觉感知...

阅读原文

AI工具

12个月前

Claude Opus 4.1

Claude Opus 4.1 是 Anthropic 公司最新推出的大型语言模型，是 Claude Opus 4 的升级版本。模型在多个方面进行优化和提升，包括推理质量、指令遵循能力及整...

阅读原文

AI工具

12个月前

Intern-S1

Intern-S1是上海人工智能实验室在世界人工智能大会上正式开源发布的科学多模态大模型，融合了语言和多模态性能，具备高水平的均衡发展能力，并富集多学科专业...

阅读原文

AI工具

1年前 (2025)

Pic Answer

Pic Answer 是 Tech Consolidated Inc. 推出的智能教育应用，通过拍照快速解答学术问题。用户只需拍摄题目或问题的照片，应用会借助先进的人工智能技术，迅速...

阅读原文

AI工具

1年前 (2025)

TRAE Agent

TRAE Agent 是字节跳动开源的基于大语言模型（LLM）的智能助手，专为软件工程任务设计。能像资深工程师一样自主完成复杂任务，例如复现问题、制定修复方案、...

阅读原文

AI工具

1年前 (2025)

DeepAgent

DeepAgent是Abacus.AI推出的全能通用Agent，专为企业和专业人士设计，支持基于自然语言输入快速生成风险投资（VC）融资演示文稿，DeepAgent能进行跨学科研究...

阅读原文

AI工具

1年前 (2025)

星流Agent

星流Agent是专为中文用户设计的一站式创意设计Agent。星流Agent延续Lovart的全栈式智能设计能力，全面适配中文语义、东方美学和本地场景。用户只需输入一句话...

阅读原文

AI工具

1年前 (2025)

标签：多模态交互