AI工具

WebDreamer:利用大语言模型提升网络规划效率的创新框架

WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体,基于大型语言模型(LLMs),特别是GPT-4o,作为世界模型预测网站上的交互结果...
阅读原文

Tatship:个性化纹身设计与试戴效果模拟的智能平台

Tatship是虚拟纹身试戴平台,让用户在实际纹身前,通过上传照片来预览纹身效果。用户可以选择预设纹身或上传自己的设计,基于AI技术生成个性化纹身,在不同身...
阅读原文

BALROG:评估大型语言模型与视觉语言模型在复杂动态环境中推理能力的基准测试工具

BALROG是评估大型语言模型(LLMs)和视觉语言模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏...
阅读原文

AutoVFX:智能化自然语言视频特效编辑工具提升创作效率与灵活性

AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(VFX)视频。框架集成神经场景建...
阅读原文

CopyCoder:智能图像识别助力编码生成的全新AI工具

CopyCoder是创新的AI编程工具,支持用户上传应用程序的截图、UI设计图或完整的应用图像,自动生成详细的编码提示词。提示词涵盖应用结构、组件规划和导入路径...
阅读原文

Markdown-to-Image:在线 Markdown 转海报编辑器让创作变得简单高效

Markdown-to-Image是开源的Markdown 转为海报的编辑器,作为React组件能将Markdown文本内容转换成图像,适用于创建社交媒体帖子、海报和其他视觉内容。工具支...
阅读原文

TÜLU 3:开源指令遵循模型的创新特性与应用潜力

TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本,...
阅读原文

EchoMimicV2:革新数字人生成技术实现个性化虚拟形象定制

EchoMimicV2是蚂蚁集团推出的半身人体动画(数字人)生成方法,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。...
阅读原文

FlipSketch:萨里大学推出的智能文本驱动无约束草图动画生成系统

FlipSketch 是萨里大学推出的创新系统,能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现:微调草图风格的帧生成、用噪声细化保持输入草图视...
阅读原文

Kodezi:智能代码生成与优化平台提升开发效率与质量

Kodezi是面向开发者的B2B AI开发平台,基于命令行界面(CLI)自动改进代码库、修复错误,在代码推送前识别问题,确保代码质量。Kodezi支持30种不同的编程语言...
阅读原文

AgentX:无代码平台助力打造个性化AI代理的全新体验

AgentX是专业的AI聊天机器人开发平台,支持OpenAI、Anthropic、Google等多种大语言模型。用户无需编码即可在短时间内创建定制化AI代理,轻松部署到网站、Slac...
阅读原文

SceneXtras:沉浸式角色互动体验让您与电影和电视剧中的人物亲密接触

SCENEXTRAS是创新的Chrome浏览器扩展程序,基于人工智能技术,让用户能够与超过100万部电影和电视剧中的600多万个角色进行实时聊天互动。支持多语言,能根据...
阅读原文

TattoosAI:个性化纹身设计工具助你创造独一无二的艺术品

TattoosAI是AI纹身设计工具,基于人工智能技术,能根据用户输入的关键词或描述迅速生成个性化的纹身图案。工具通过自然语言处理和图像生成技术,理解用户的创...
阅读原文

GENIE:Luma AI革新3D模型生成工具,轻松创建高质量虚拟场景

GENIE是Luma AI推出的文本生成3D内容工具,能将简单的文本描述转化为生动的三维场景和对象。 用户只需输入文本描述,GENIE能根据描述生成3D模型,支持将生成...
阅读原文

Add-it:英伟达推出无需训练的智能图像编辑工具,实现一键式创作与灵活调整

Add-it是NVIDIA推出的无需训练的图像编辑技术,能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制,整合场景图像、文本提示和生成图像...
阅读原文