V-Express是一款能够根据参考图像、音频和V-Kps图像生成逼真说话头像视频的工具,具有高度逼真、灵活性和高效性的特点,V-Express官网入口网址
MuseTalk是一款实时高质量的唇形同步软件,通过潜在空间修复技术实现,可广泛应用于影视制作和游戏开发等领域,MuseTalk官网入口网址
Magic Clothing是一款可控制的服装驱动图像合成工具,支持多种服装样式和图像风格的合成,适用于服装设计和艺术创作,Magic Clothing官网入口网址
Hallo是一款基于音频输入驱动的肖像图像动画生成工具,通过先进的扩散模型技术和层次化音频驱动视觉合成模块,实现更加逼真和动态的肖像生成,Hallo官网入口网址
Gen-3 Alpha是Runway推出的下一代视频生成模型,保真度高、动态表现优秀,支持细粒度控制,适用于创意视频制作和虚拟现实体验,Gen-3 Alpha官网入口网址
InstructAvatar是一款基于文本指导的情感和动作控制头像生成工具,支持多种情感表达和动作控制,适用于社交娱乐和营销广告等场景,InstructAvatar官网入口网址
GPT-4o mini是OpenAI推出的成本效益高的小型模型,具有出色的文本智能和多模态推理能力,适用于多种语言和多种输入输出类型,GPT-4o mini官网入口网址
Hyper-SD是一种用于高效图像合成的轨迹分段一致性模型,支持1到8步的推理,具有人类反馈学习和分数蒸馏功能,Hyper-SD官网入口网址
FunAudioLLM是一款基于LLMs的语音理解和生成框架,支持多语言语音识别、情感识别和音频事件检测,以及多语言、音色和情感控制的语音生成,FunAudioLLM官网入口网址
Idea-2-3D是一款基于协作式LMM代理的自动3D模型设计和生成系统,支持多模态输入,能够为用户提供更好的视觉质量和各种新的图像创建功能,Idea-2-3D官网入口网址
MusiConGen是一款基于Transformer的文本生成音乐模型,可精准控制节奏和和弦,支持多种音乐风格,适用于音乐创作、教育和广告配乐,MusiConGen官网入口网址
HoloDreamer是一款基于文本描述生成全景式3D场景的创新框架,支持多种风格的场景生成,视觉一致性强,重建质量高,HoloDreamer官网入口网址
优秀科技公众号,微信号:gh_4f3e1c48488a
Qwen2是阿里云Qwen团队开发的大型语言模型系列,提供多种规模的预训练模型,支持多种语言,具有高性能和高可扩展性,适用于自然语言处理、信息检索、语音识别和数据分析等多个应用场景,Qwen2官网入口网址
Seed-TTS是一款高质量、多功能的语音生成模型,能够生成几乎与人类语音无法区分的语音,支持情感控制、说话人微调等功能,Seed-TTS官网入口网址
腾讯元器是腾讯混元大模型团队推出的智能体开放平台,开发者可以通过插件、知识库、工作流等方式快速、低门槛打造高质量的智能体,支持发布到QQ、微信等平台,同时也支持API调用,腾讯元器官网入口网址
悬河,AI心灵伴侣,带给你更有温度的情感陪伴,悬河-AI心灵伴侣官网入口网址
腾讯混元生图,智能助手,跨领域知识,助您获取信息、知识和灵感。常见问题:1. 混元生图是否支持多语言对话?2. 如何保证用户隐私信息的安全性?,腾讯混元生图官网入口网址
AI Test Kitchen是一款强大的视频特效工具,提供丰富的特效库和个性化定制功能,适用于个人创作、社交分享和商业宣传,Veo官网入口网址
讯飞星火大模型,跨领域知识与语言理解,多功能智能模型,星火大模型官网入口网址
Google DeepMind Imagen 3是一款高质量文本到图像生成模型,支持多种风格和格式,能够生成逼真风景、油画和卡通场景等,Imagen 3官网入口网址
腾讯混元DiT是一款基于Diffusion transformer的文本到图像生成模型,支持中英文细粒度理解,具有多模态大语言模型训练,可生成艺术风格多样的图像作品,腾讯混元DiT官网入口网址
商汤SenseChat-Character,定制AI角色,创造真实互动,满足不同场景需求,商量拟人大模型官网入口网址
CodeGemma是一款强大的AI辅助编码工具,支持智能代码完成、代码生成等多种功能,提高开发效率,CodeGemma官网入口网址
ChatGLM,清华技术,智谱AI开源的GLM系列的对话模型,ChatGLM官网入口网址。
agentgpt,AutoGPT的自主AI代理,在浏览器中组装、配置和部署自主ai开源项目 ,AgentGPT官网入口网址。
MiniMax是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型。MiniMax 开放平台官网入口网址
Bing是一款功能强大的搜索引擎,提供图片搜索、视频搜索、购物搜索、地图搜索、新闻搜索、翻译功能、旅行搜索、房地产搜索等多种功能,适用于学习、购物比较、旅行规划、新闻阅读和语言翻译等场景。,Bing AI官网入口网址
零一万物-AI2.0大模型技术和应用的全球公司(01.AI)提供卓越性能的Yi-34B预训练模型,具有高性能、成本效益和开放性,适用于自然语言处理、语音识别和图像处理等多个应用场景。,零一万物-01.ai官网入口网址
西湖心辰是一家专注于AI大模型技术研究与应用的公司,推出了AI绘画、AI写作等创新产品,以赋能视觉创作、提升写作效率为核心,为用户提供智能化的创作工具和服务。,西湖心辰官网入口网址
Mojo是一种结合了Python的易用性和C的性能的编程语言,为AI开发人员提供了无与伦比的AI硬件可编程性和AI模型可扩展性。,Modular官网入口网址
阅文集团是一家以数字阅读为基础,IP培育与开发为核心的综合性文化产业集团,拥有强大的创作者阵营和丰富的作品储备,覆盖200多种内容品类,触达数亿用户,致力于将优秀的网文IP改编为动漫、影视、游戏等多业态产品。,阅文集团官网入口网址