标签:个性化推荐

Cal AI – 扫描食物热量的APP,AI分析食物中蛋白、碳水和脂肪含量

Cal AI是一款基于AI技术能扫描食物热量的APP,通过用户拍摄食物照片追踪卡路里和营养成分,帮助用户管理饮食和体重。Cal AI基于先进的图像识别技术,分析食物...
阅读原文

Lobe Chat – 免费开源的高性能AI聊天机器人框架

Lobe Chat是一个免费开源的高性能AI聊天机器人框架,提供了高颜值的聊天界面程序和丰富灵活的功能,支持语音合成、多模态、可扩展的插件系统,可一键免费部署...
阅读原文

QAnything – 网易有道推出的开源本地知识库问答引擎

QAnything是网易有道推出的基于子曰教育大模型自研的RAG(检索增强生成)引擎,为企业或个人提供了一个免费开源的本地知识库问答解决方案,支持各种文件格式...
阅读原文

HiDream.ai – 多模态AI图像、视频和3D生成平台

HiDream.ai是由前京东副总裁梅涛创立的 AI 初创公司智象未来(HiDream.ai)推出的多模态AI视觉平台Pixeling千象,支持AI图像、视频和3D生成。HiDream.ai 的生...
阅读原文

OLMo – 艾伦AI研究所开源的完全开放的大语言模型框架

OLMo(Open Language Model)是由Allen AI(AI2,艾伦AI研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界...
阅读原文

EMO – 阿里推出的AI肖像视频生成框架

EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院的研究人员开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语...
阅读原文

ELLA – 腾讯推出的扩散模型适配器,可增强语义对齐

ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的研究人员推出的一种新型方法,旨在提升文本到图像生成模型在处理复杂文本提...
阅读原文

Follow-Your-Click – 腾讯等开源的图像到视频模型,可生成局部动画

Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的研究人员共同研发的图像到视频(Image-to-Video,简称I2V)生成模型,允许...
阅读原文

Open-Sora – 开源的类Sora架构的视频生成模型和复现方案

Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规模图像预训练、大...
阅读原文

Mora – 微软等推出的可生成12秒视频的多AI智能体框架

Mora是由来自微软和理海大学的研究人员推出的一个多智能体(AI Agents)框架,专门用于通用视频生成任务,目标是模拟并扩展OpenAI的Sora视频生成模型。该框架...
阅读原文

Champ – 基于3D的人物图片转视频动画模型

Champ是由阿里巴巴、复旦大学和南京大学的研究人员共同提出的一种基于3D的将人物图片转换为视频动画的模型,该方法结合了3D参数化模型(特别是SMPL模型)和潜...
阅读原文

Gauth APP – 字节在海外推出的AI学习助手应用

Gauth APP是由字节跳动的海外子公司开发的一款智能学习辅助应用,专注于帮助学生高效解决数学、化学、物理等科目的复杂问题。
阅读原文

VASA-1 – 微软推出的静态照片对口型视频生成框架

VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时生成逼真的3D说话面部动画。
阅读原文

Phi-3 – 微软最新推出的新一代小模型系列

Phi-3是微软研究院推出的新一代系列先进的小语言模型,包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在保持较小的参数规模的同时...
阅读原文

IDM-VTON – 逼真的开源AI虚拟试穿框架

IDM-VTON是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。
阅读原文
123412