谷歌发布全新AI图像生成工具Whisk:以图生图,无需提示词

谷歌发布全新AI图像生成工具Whisk:以图生图,无需提示词

原标题:谷歌发布全新AI图像生成工具Whisk:以图生图,无需提示词
文章来源:小夏聊AIGC
内容字数:2501字

谷歌推出创新生成式人工智能工具Whisk

近日,谷歌实验室在美国正式发布了其最新的生成式人工智能工具——Whisk。这一工具的推出标志着图像生成领域的一次重要突破,它不再依赖传统的文本提示,而是以图像作为核心输入,提供了一种更为直观和富有创意的创作体验。

独特的图像输入方式

Whisk允许用户直接上传图片,或者在工具内部生成图像,并灵活指定主题、场景和风格等关键元素。这些元素可以在Whisk系统中进行混合和匹配,从而创造出独一无二的图像作品。用户甚至可以根据自己的需求添加文本提示,对生成的图像进行微调,进一步增创作的个性化。

大的后台支持

在Whisk的背后,谷歌的语言模型(据推测可能是最新的Gemini2.0Flash)发挥着至关重要的作用。该模型能够自动生成输入图像的详细描述,这些描述随后被输入到谷歌最新的图像生成模型Imagen3中。Imagen3具备捕捉和保留图像主体特征的能力,确保每一幅作品都独具特色,而非简单的复制。

用户体验与反馈

许多早期测试者,包括艺术家和创意专业人士,对Whisk的使用体验给予了高度评价。他们认为Whisk更像是一种全新的创意工具,鼓励用户进行快速的视觉头脑风暴,迅速生成和筛选多个选项,以找到最符合需求的图像作品。

实际测试与结果

我们在AITOP100台上进行了几次测试,上传了几张图片,并查看融合的效果,结果令人满意。比如,当我们将一只绿色的恐龙毛绒玩具作为样式图,并选择一位胖乎乎的穿着唐朝服饰的小女孩作为主题图进行融合时,生成的图像保持了主题图的核心元素,同时融入了毛绒玩具的材质特征,整体效果赏心悦目。如果用户对生成的图像不满意,还可以通过编辑提示词进行微调。

使用体验与未来展望

尽管Whisk的用户体验令人愉悦,但在高流量时段,生成新图像的过程中可能会出现几秒钟的等待。这一情况可能是由于大量用户同时涌入体验这一新工具所造成的延迟。不过,这并没有影响用户对Whisk的热情和期待。

目前,Whisk仅对美国用户开放,用户可以通过labs.google/whisk免费尝试并反馈。虽然其他国家的用户暂时无法直接访问这一工具,但他们对Whisk未来的发展充满期待。

总结

作为谷歌实验室的一部分,Whisk是公司在AI领域进行创新的重要试验项目之一。与Gemini、Imagen以及最新的视频模型Veo2等项目相似,Whisk虽然仍处于实验阶段,但其展现出的潜力和创新性令人期待。可以预见,在不久的将来,Whisk将会在图像生成领域占据重要地位,成为一颗璀璨的新星。

功能亮点

Whisk的核心功能包括:

  • 以图生图:用户只需上传图片,无需费心构思文字提示,工具即可自动理解并生成符合预期的图像。
  • 风格混合:智能算法能够精准捕捉并混合不同图片的风格特征,无论是抽象艺术风格还是具体场景元素,都能巧妙融入新的图像中。
  • 快速迭代:用户可以通过编辑文本提示或上传新图片,轻松实现图像的迭代修改,优化生成结果。

联系作者

文章来源:小夏聊AIGC
作者微信:
作者简介:专注于人工智能生成内容的前沿信息与技术分享。我们提供AI生成艺术、文本、音乐、视频等领域的最新动态与应用案例。每日新闻速递、技术解读、行业分析、专家观点和创意展示。期待与您一起探索AI的无限潜力。欢迎关注并分享您的AI作品或宝贵意见。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...