标签:情感分析
HiDream.ai – 多模态AI图像、视频和3D生成平台
HiDream.ai是由前京东副总裁梅涛创立的 AI 初创公司智象未来(HiDream.ai)推出的多模态AI视觉平台Pixeling千象,支持AI图像、视频和3D生成。HiDream.ai 的生...
360AI搜索 – 360推出的新一代答案引擎
360AI搜索是360公司推出的一款集成了人工智能技术的搜索引擎,类似于Perplexity被设计为新一代答案引擎,旨在为用户提供更加精准、全面和智能的搜索体验。当...
OLMo – 艾伦AI研究所开源的完全开放的大语言模型框架
OLMo(Open Language Model)是由Allen AI(AI2,艾伦AI研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界...
MetaGPT – 多个AI智能体协作分工的框架
MetaGPT是一个创新的元编程框架,结合了大语言模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化操作程序(SOPs)...
VideoPoet – 谷歌推出的AI视频生成模型
VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案,支持从文本、图像或视频输入中合成高质量的视频内容,并生成匹配的音频。VideoPoet的核...
Mistral Large – Mistral AI发布的一款先进的大语言模型
Mistral Large是由法国人工智能公司Mistral AI开发的一款先进的大型语言模型(LLM),具备顶级的推理能力,能够处理复杂的多语言推理任务,包括文本理解、转...
EMO – 阿里推出的AI肖像视频生成框架
EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院的研究人员开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语...
DUSt3R – 从任意图像集合中重建3D场景的框架
DUSt3R是由来自芬兰阿尔托大学和Naver欧洲实验室的研究人员推出的一个3D重建框架,旨在简化从任意图像集合中重建三维场景的过程,而无需事先了解相机校准或视...
Claude 3 – Anthropic推出的第三代大模型和AI聊天机器人
Claude 3是人工智能初创公司Anthropic开发的新一代人工智能模型,旨在提供先进的认知能力和智能处理任务。Claude 3模型家族包括三个不同级别的模型,按性能强...
ELLA – 腾讯推出的扩散模型适配器,可增强语义对齐
ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理复杂文本提...
Open-Sora – 开源的类Sora架构的视频生成模型和复现方案
Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规模图像预训练、大...
Mora – 微软等推出的可生成12秒视频的多AI智能体框架
Mora是由来自微软和理海大学的研究人员推出的一个多智能体(AI Agents)框架,专门用于通用视频生成任务,目标是模拟并扩展OpenAI的Sora视频生成模型。该框架...
Voice Engine – OpenAI推出的AI语音合成和声音克隆模型
Voice Engine是OpenAI最新推出的一项AI语音合成和声音克隆技术,能够利用简短的15秒音频样本和文本输入,生成接近原声的自然听起来的语音。该项技术自2022年...
SWE-agent – 普林斯顿开源的AI程序员智能体
SWE-agent是一个由普林斯顿大学NLP组研究人员开发的开源AI程序员和软件工程师系统,利用大型语言模型(如GPT-4)的能力,可以自动解决GitHub存储库中的问题。...
VASA-1 – 微软推出的静态照片对口型视频生成框架
VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时生成逼真的3D说话面部动画。