AI项目和框架
GenCast:DeepMind推出的性AI气象预测模型提气预报精准度与效率
GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast在97.2%的预测任务中超越全球顶尖的中期天气预报系统...
Luma Photon:创新图像生成模型助力无限创意与高效创作
Luma Photon 是 Luma AI 推出的新一代图像生成模型,用创新的架构提供超高图像质量和低成本效率。Luma Photon支持个性化和创造性的图像生成,能理解自然语言...
TeleAI 视频生成大模型:智能视频创作助手助力内容创作与传播
TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜头草图,再基于草图生成视频。TeleAI 视频生成大...
TPDM:创新时间预测扩散模型推动高校科研合作与发展
TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自...
ConsisID:智能文本到视频生成模型实现创意内容的快速转化
ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tun...
复旦联合微软等机构推出的端到端身份一致性视频扩散框架
StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学共同推出的端到端高质量身份保持视频扩散框架。StableAnimator能根据一张参考图像和一...
I2V-01-Live:海螺AI创新图生视频模型助力创意内容生成与视觉表现提升
I2V-01-Live是海螺AI推出的图生视频模型,能将静态二维图像转化为动态视频。模型基于深度学习技术,增强动作的流畅度和生动性,让人物或对象的动作更加自然和...
开源AI检索生成框架,自动生成精确的SQL查询
Vanna是开源的Python RAG(Retrieval-Augmented Generation)框架,能帮助用户基于大型语言模型(LLMs)为其数据库生成精确的SQL查询。Vanna用两步简单流程操...
首尔国立大学推出的单参考图像生成多身份全身图像技术
PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCr...
GeneMAN:创新3D人体模型创建框架助力精准数字化人体重建
GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人...
MagicDriveDiT:高分辨率自动驾驶长视频生成技术创新与应用
MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法,专为自动驾驶应用设计,实现高分辨率和长...
EfficientTAM:Meta AI推出创新视频对象分割与跟踪模型,提升视觉内容分析能力
EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transforme...
Amazon Nova:亚马逊全新多模态生成大模型引领文本、图像与视频创作新时代
Amazon Nova 是亚马逊云服务(AWS)推出的新一代AI基础模型系列,提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazo...
HunyuanVideo:腾讯发布130亿参数开源视频生成模型,赋能创作新纪元
HunyuanVideo是腾讯开源的视频生成模型,拥有130亿参数,是目前参数量最大的开源视频模型之一。HunyuanVideo具备物理模拟、高文本语义还原度、动作一致性和电...
Codel:多功能AI代理工具助力终端、浏览器及编辑器高效执行复杂任务
Codel是全自主AI代理工具,能在沙盒化的Docker环境中执行复杂任务和项目。Codel具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数...