标签:智能对话
WorldSense
WorldSense是小红书和上海交通大学推出的,用在评估多模态大型语言模型(MLLMs)在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSen...
Univer:智能办公助手全面提升Word和Excel文档处理效率
Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行,易于集成到各...
AI Chinese
AI Chinese是嗨你好教育推出的AI双语教学中文学习平台,基于AI技术为外国人提供在线中文学习解决方案。平台模拟中国真人老师在线授课,在TikTok用短视频和直...
EMMA-X:具身多模态动作模型推动人机交互的革新与应用
EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenVLA创建。EMMA-X结合层次化的具身数据集...
Apollo:Meta与斯坦福大学携手推出创新多模态模型,实现图像与文本的深度融合与理解
Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解在LMMs中的关键驱动因素,推出“Scaling Cons...
Pika 2.0:Pika Labs全新AI视频生成工具助力创作者轻松制作高质量视频内容
Pika 2.0是Pika Labs推出的AI视频生成工具,在前代产品的基础上进行了重大更新,提供了更多的用户控制和定制化功能。Pika 2.0的核心特性包括改进的文本对齐和...
书生·万象InternVL 2.5:创新驱动的多模态大语言模型提升智能交互体验
书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的基础上进行显著增强,特别是在...