标签：自然语言理解

LangBot

LangBot 是开源的即时聊天机器人平台，支持多平台（如 QQ、微信、飞书、Discord 等）和多种大语言模型（如 ChatGPT、DeepSeek、Gemini 等）。LangBot具备多模...

阅读原文

AI工具

1年前 (2025)

SANA 1.5

SANA 1.5 是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器（Linear Diffusion Transformer），用于文本到图像生成任务。在 SANA 1.0 的基...

阅读原文

AI工具

1年前 (2025)

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用，支持各类大语言模型（LLM）在手机上离线运行。具备多模态功能，能实现文本生成文本、图像生...

阅读原文

AI工具

1年前 (2025)

Qwen Chat

Qwen Chat是阿里千问团队推出的集成多种Qwen AI大模型的Web交互平台。Qwen Chat具备多模型同台竞技、上传文档精准问答、HTML预览、看图说话等功能，拥有类似C...

阅读原文

AI工具

1年前 (2025)

MiniPerplx

MiniPerplx 是开源的 AI 搜索引擎，基于 Grok 2.0 模型进行搜索。MiniPerplx提供了免费的替代方案，用在搜索网页、推特帖子、研究论文和 YouTube 视频等内容...

阅读原文

AI工具

1年前 (2025)

SPRIGHT

SPRIGHT（SPatially RIGHT）是亚利桑那州立大学、Intel 实验室、Hugging Face 、华盛顿大学等机构联合推出的，专注于空间关系的大型视觉-语言数据集，能解...

阅读原文

AI工具

1年前 (2025)

LaDeCo

LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计构图方法，基于将设计任务分解为层次化的步骤来实现。LaDeCo对输入的设计元素进行层规划，将它们分...

阅读原文

AI工具

1年前 (2024)

twee

twee是专为英语教师设计的AI驱动在线平台，提供一系列教学辅助工具。twee能快速生成针对任何YouTube视频的问题、不同主题和水平的对话、故事、信件和文章。tw...

阅读原文

AI工具

1年前 (2024)

探一下

探一下是支付宝推出的新一代AI视觉搜索产品，基于自研的多模态大模型技术，能够“用AI之眼探索万物”，提供快速、有用、趣味的生成式搜索服务。用户可以通过AI...

阅读原文

AI工具

1年前 (2024)

Mind GPT-3o

Mind GPT-3o是理想汽车推出的多模态端到端大模型，融合语音、视觉和语言理解技术，实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力，能提...

阅读原文

AI工具

1年前 (2024)

Bamba-9B：Mamba2架构驱动的高效解码语言模型展现卓越性能与灵活应用

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的，基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练，能提...

阅读原文

AI工具

1年前 (2024)

Doctronic

Doctronic是提供在线AI医生服务的平台，为用户提供快速、免费的初步健康咨询。Doctronic基于一系列问题收集用户的健康信息，帮助诊断症状或讨论健康问题。用...

阅读原文

AI工具

1年前 (2024)

LeviTor

LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术，结合深度信息和K-means聚类点控制视频中3D物体的轨迹，无需显式的3D轨迹跟踪。LeviT...

阅读原文

AI工具

1年前 (2024)

颠覆视觉认知：Florence-VL引领多模态大语言模型的新纪元

通过融合不同深度的特征，Florence-VL实现了更全面的视觉理解。

阅读原文

AIGC动态

2年前 (2024)

Lyra：提升多模态交互体验的SmartMore创新解决方案

Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型（MLLM），专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...

阅读原文

AI工具

2年前 (2024)

1 234 5…7