标签:智能对话生成

MetaGPT

MetaGPT是一个创新的元编程框架,结合了大语言模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化操作程序(SOPs)...
阅读原文

Open-Sora

Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规模图像预训练、大...
阅读原文

Mora

Mora是由来自微软和理海大学的研究人员推出的一个多智能体(AI Agents)框架,专门用于通用视频生成任务,目标是模拟并扩展OpenAI的Sora视频生成模型。该框架...
阅读原文

Champ

Champ是由阿里巴巴、复旦大学和南京大学的研究人员共同提出的一种基于3D的将人物图片转换为视频动画的模型,该方法结合了3D参数化模型(特别是SMPL模型)和潜...
阅读原文

Phi-3

Phi-3是微软研究院推出的新一代系列先进的小语言模型,包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在保持较小的参数规模的同时...
阅读原文

商量拟人大模型

商量拟人大模型“SenseChat-Character”是商汤科技推出的一款人工智能虚拟角色对话系统,专注于提供个性化角色创建、定制和对话服务。
阅读原文

GPT-4o

GPT-4o是OpenAI最新推出的一款先进的人工智能模型,具备强大的多模态推理能力,能够处理语音、文本和视觉信息。该模型能够实时响应用户输入,并且在音频交互...
阅读原文

Qwen2

Qwen2是由阿里云通义千问团队开源的新一代大语言模型,该系列涵盖了从0.5B到72B不等的五个规模模型,在中文和英文基础上增加了27种语言的高质量数据,大幅提...
阅读原文

Gen-3 Alpha

Gen-3 Alpha是由AI视频初创公司Runway最新发布的新一代AI视频生成模型,通过大规模多模态训练基础设施,显著提升了视频的保真度、一致性和动态表现。该模型能...
阅读原文

GPT-4o mini

GPT-4o mini 是 OpenAI 最新推出的一款AI大模型,提供更高效、更具成本效益的解决方案。这款新模型替代 GPT-3.5,成为市场上最具成本效益的小型模型。GPT-4o ...
阅读原文

GPT-4o Long Output模型

GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT-4o模型,输出能力提升16倍,但...
阅读原文

Mini-Monkey

Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效解决了传统图像切分...
阅读原文

醒蓝AI

醒蓝AI是一款AI照片生成工具,支持一键生成AI形象照,用户能够轻松制作工作形象照、写真照、证件照和AI换脸照片。醒蓝AI还提供API接口和定制化解决方案,满足...
阅读原文

UniTalker

UniTalker是推出的音频驱动3D面部动画生成模型,能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型,用带有不同标注的数据集,支持多语言和多种音...
阅读原文

Boogie AI

Boogie AI是一款AI跳舞软件,使用AI技术将用户上传的照片转化为舞蹈视频。自发布以来,Boogie AI迅速在美国iOS端免费应用排行榜上升至第18位,并在一个月内下...
阅读原文
12345611