标签:自然语言理解

Qwen Chat

Qwen Chat是阿里千问团队推出的集成多种Qwen AI大模型的Web交互平台。Qwen Chat具备多模型同台竞技、上传文档精准问答、HTML预览、看图说话等功能,拥有类似C...
阅读原文

MiniPerplx

MiniPerplx 是开源的 AI 搜索引擎,基于 Grok 2.0 模型进行搜索。MiniPerplx提供了免费的替代方案,用在搜索网页、推特帖子、研究论文和 YouTube 视频等内容...
阅读原文

SPRIGHT

SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛顿大学等机构联合推出的,专注于空间关系的大型视觉-语言数据集,能解...
阅读原文

LaDeCo

LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计构图方法,基于将设计任务分解为层次化的步骤来实现。LaDeCo对输入的设计元素进行层规划,将它们分...
阅读原文

twee

twee是专为英语教师设计的AI驱动在线平台,提供一系列教学辅助工具。twee能快速生成针对任何YouTube视频的问题、不同主题和水平的对话、故事、信件和文章。tw...
阅读原文

探一下

探一下是支付宝推出的新一代AI视觉搜索产品,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。用户可以通过AI...
阅读原文

Mind GPT-3o

Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力,能提...
阅读原文

Bamba-9B:Mamba2架构驱动的高效解码语言模型展现卓越性能与灵活应用

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提...
阅读原文

Doctronic

Doctronic是提供在线AI医生服务的平台,为用户提供快速、免费的初步健康咨询。Doctronic基于一系列问题收集用户的健康信息,帮助诊断症状或讨论健康问题。用...
阅读原文

LeviTor

LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术,结合深度信息和K-means聚类点控制视频中3D物体的轨迹,无需显式的3D轨迹跟踪。LeviT...
阅读原文

颠覆视觉认知:Florence-VL引领多模态大语言模型的新纪元

通过融合不同深度的特征,Florence-VL实现了更全面的视觉理解。
阅读原文

Lyra:提升多模态交互体验的SmartMore创新解决方案

Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...
阅读原文

Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署

Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)...
阅读原文

EMOVA:华为诺亚方舟多模态处理模型全面提升智能交互与应用效率

EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOVA能处理图像、...
阅读原文

Devika AI:智能AI助手助力高效执行复杂任务

Devika AI是印度Stition AI团队推出的开源AI软件开发工具,能理解并执行复杂的人类指令,将其分解为步骤,进行研究和信息搜集,最终编写代码以实现目标。Devi...
阅读原文