AI工具
开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模式,...
AI颜色调色板,输入关键词或主题自动生成颜色组合
Colorify Rocks是AI颜色调色板,能根据用户输入的关键词或主题,迅速创建出和谐且吸引人的颜色组合。工具基于先进的AI技术,理解色彩理论、趋势和美学,为设...
AI食谱应用,提供定制化的餐食建议
ChefBot是基于AI技术快速生成个性化食谱的应用。用户输入简单的食材和饮食偏好,ChefBot能在60秒内提供定制化的烹饪方案。ChefBot满足个性化需求、注重健康饮...
英伟达推出的视觉语言大模型
NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统优化...
O1-CODER:智能编码助手O1版提升开发效率与代码质量
O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,提升...
南洋理工推出的VR端3D角色扮演AI系统
SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大学研究团队推出的。支持用户用语音和肢体语言与虚拟角色进行沉浸式互动,基于社交视觉-语言-行为模型,提...
clone-voice:多语言声音克隆工具支持16种语言,实现个性化语音合成
Clone-voice是开源的声音克隆工具,基于深度学习技术分析和模拟人类声音,实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在内的16种语言,能将...
AI文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导 - SwiftBrush)和NASA(负向远离转向注意...
音频驱动的生成肖像说话视频框架,保持身份一致性和表现力
MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性和表现力的...
xAI为Grok AI助手推出的新图像生成模型
Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠)。Aurora 的...
One Shot, One Talk:中科大与香港理工携手打造创新动态图像生成技术,实现实时创作与智能化设计
One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作...
办公小浣熊2.0:智能协作新体验,商汤AI办公助手赋能创作空间
办公小浣熊2.0是商汤科技推出的AI办公助手,集成数据分析、文档解析、智能规划和内容创作等AI功能。工具基于一站式创作空间,让用户在平台内完成所有工作任务...
智谱 AI 免费开放图像理解大模型
GLM-4V-Flash是智谱AI推出的专注于图像理解的AI模型,提供免费的API接口,支持用户上传图片URL或Base64编码图片获取详细的图像描述。模型简化图像分析流程,...
海螺AI Audio:智能语音合成助手打造自然流畅对话体验
海螺AI Audio是MiniMax推出的AI语音合成工具,能创建逼真的多语言、多声音和多情感的语音。用户只需提供30秒的音频素材,可以克隆特定人的声音,支持12种语言...
Meta AI推出的纯文本语言模型
Llama 3.3是Meta AI推出的70B 参数模型,大型多语言预训练语言模型,性能与40B参数的Llama 3.1相当。模型专为多语言对话优化,支持英语、德语、法语、意大利...