FLUX.2 Prompting – Black Forest Labs推出的FLUX.2使用指南(中英版)
FLUX.2 提示词指南,由 Black Forest Labs 倾力打造,是解锁 FLUX.2 强大功能的官方秘籍。本指南将深入剖析如何运用结构化的 JSON 指令、精准的十六进制色彩控制以及多参考图像编辑等前沿技术,助您挥洒创意,生成引人入胜的高质量图像与设计作品。
指南内容涵盖广泛,从 JSON 提示词的基石构建,到分步式创意生成,再到十六进制色彩的妙用、信息图表与数据可视化的呈现,乃至多语言提示的文化融合、漫画与顺序艺术的叙事魅力、照片级写实风格的逼真演绎,直至多参考图像编辑的无限可能。此外,我们还为您精心梳理了最佳实践的精华要点和快速参考表格,旨在帮助您迅速掌握 FLUX.2 的各项精湛技艺。
掌握 FLUX.2 的提示词撰写艺术,意味着您将能够熟练运用结构化 JSON、十六进制色彩以及多参考图等先进技术,将您的视觉构想变为现实。
FLUX.2 以其卓越的指令遵循能力而闻名,它完美支持结构化 JSON 提示、精密的十六进制色彩调校以及多参考图编辑等进阶功能。本指南将为您层层揭秘这些核心要素,赋能您创作出令人惊叹的视觉作品。
请注意,FLUX.2 不支持负面提示。您的任务是清晰地描绘您所期望的画面,而非排除您不想要的内容。
JSON 结构化指令
FLUX.2 在解析结构化的 JSON 指令方面表现出色,让您能够对图像的每一个细节进行精细把控。这一特性对于生产流程的优化和自动化尤为关键。
基础架构循序渐进地构建提示词
{
"scene": "整体场景的详尽描述",
"subjects": [
{
"description": "主体元素的细致描绘",
"position": "其在画面中的具置",
"action": "它正在进行的动作"
}
],
"style": "艺术风格的界定",
"color_palette": ["#色码1", "#色码2", "#色码3"],
"lighting": "灯光效果的描绘",
"mood": "所要传达的情感基调",
"background": "背景元素的具体阐述",
"composition": "画面构图与布局的规划",
"camera": {
"angle": "摄影机的拍摄角度",
"lens": "镜头类型的选择",
"depth_of_field": "焦点景深的处理方式"
}
}
让我们以逐步构建产品图像为例,观察每个组成部分是如何协同工作的。
第一步:呈现咖啡杯
{
"scene": "专业工作室产品摄影场景,搭配抛光混凝土台面",
"subjects": [
{
"description": "极简主义陶瓷咖啡杯,杯中热咖啡正升起袅袅蒸汽",
"pose": "静止于台面",
"position": "位于抛光混凝土台面的中心前景位置",
"color_palette": ["哑光黑色陶瓷"]
}
],
"style": "具有商业水准的超写实产品摄影风格",
"color_palette": ["哑光黑", "混凝土灰", "柔和的白色高光"],
"lighting": "采用三点式柔光箱布光,营造柔和弥散的高光,避免生硬阴影",
"mood": "干净、专业、极简的氛围",
"background": "带有工作室背景的抛光混凝土台面",
"composition": "遵循三分法构图原则",
"camera": {
"angle": "俯视角度",
"distance": "中景拍摄",
"focus": "聚焦于咖啡上升的蒸汽和咖啡杯的细节处",
"lens-mm": 85,
"f-number": "f/5.6",
"ISO": 200
}
}
第二步:增添一个不同色彩的马克杯
{
"scene": "专业工作室产品摄影场景,搭配抛光混凝土台面",
"subjects": [
{
"description": "极简主义陶瓷咖啡杯,杯中热咖啡正升起袅袅蒸汽",
"pose": "静止于台面",
"position": "位于抛光混凝土台面的中心前景位置",
"color_palette": ["哑光黑色陶瓷"]
},
{
"description": "与黑色咖啡杯设计风格一致的极简主义陶瓷咖啡杯",
"pose": "静止于台面",
"position": "位于黑色咖啡杯右侧的抛光混凝土台面",
"color_palette": ["哑光黄色陶瓷"]
}
],
"style": "具有商业水准的超写实产品摄影风格",
"color_palette": ["哑光黑", "哑光黄", "混凝土灰", "柔和的白色高光"],
"lighting": "采用三点式柔光箱布光,营造柔和弥散的高光,避免生硬阴影",
"mood": "干净、专业、极简的氛围",
"background": "带有工作室背景的抛光混凝土台面",
"composition": "遵循三分法构图原则",
"camera": {
"angle": "俯视角度",
"distance": "中景拍摄",
"focus": "聚焦于咖啡上升的蒸汽以及画面中的两个咖啡杯",
"lens-mm": 85,
"f-number": "f/5.6",
"ISO": 200
}
}
第三步:调整蒸汽的色彩
{
"scene": "专业工作室产品摄影场景,搭配抛光混凝土台面",
"subjects": [
{
"description": "极简主义陶瓷咖啡杯,杯中热咖啡正升起明亮的红色蒸汽",
"pose": "静止于台面",
"position": "位于抛光混凝土台面的中心前景位置",
"color_palette": ["哑光黑色陶瓷", "亮红色蒸汽"]
},
{
"description": "与黑色咖啡杯设计风格一致的极简主义陶瓷咖啡杯",
"pose": "静止于台面",
"position": "位于黑色咖啡杯右侧的抛光混凝土台面",
"color_palette": ["哑光黄色陶瓷"]
}
],
"style": "具有商业水准的超写实产品摄影风格",
"color_palette": ["哑光黑", "哑光黄", "亮红", "混凝土灰", "柔和的白色高光"],
"lighting": "采用三点式柔光箱布光,营造柔和弥散的高光,避免生硬阴影",
"mood": "干净、专业、极简的氛围",
"background": "带有工作室背景的抛光混凝土台面",
"composition": "遵循三分法构图原则",
"camera": {
"angle": "俯视角度",
"distance": "中景拍摄",
"focus": "聚焦于咖啡上升的蒸汽以及画面中的两个咖啡杯",
"lens-mm": 85,
"f-number": "f/5.6",
"ISO": 200
}
}
您可以选择直接在提示指令中嵌入 JSON 数据,或者将其转化为自然语言。FLUX.2 能够理解这两种格式。
十六进制色彩代码指令
FLUX.2 支持使用十六进制代码实现精确的色彩匹配,这对于品牌一致性和设计工作的开展至关重要。
基本语法
通过“color”或“hex”等关键词,后接十六进制代码,来指定颜色:
花瓶的色彩为 #02eb3c
背景色调为 #1a1a2e
渐变色彩的应用
通过指定起始与结束的色彩,即可实现渐变效果:
提示示例: “客厅桌上摆放着一个花瓶,花瓶的色彩呈现渐变效果,从 #02eb3c 开始过渡到 #edfa3c。花瓶内的花朵色彩为 #ff0088。”
JSON 指令中的色彩运用
将十六进制色彩代码与结构化指令相结合,可实现最极致的控制:
{
"scene": "大理石台面上的美妆产品平铺展示",
"subjects": [
{
"description": "眼影盘",
"colors": ["#E91E63", "#9C27B0", "#673AB7", "#3F51B5"]
}
],
"style": "美妆产品摄影风格",
"lighting": "柔和漫射的顶光照射"
}
十六进制代码与特定对象明确关联时,效果最为显著。诸如“在某个地方使用 #FF0000”这类模糊的描述,可能导致生成结果的不一致。
信息图表与数据可视化
FLUX.2 能够生成排版清晰、布局合理的图表,极大地提升了信息的传达效率。
信息图表模板
{
"type": "信息图",
"title": "您的主标题",
"subtitle": "辅助说明信息",
"sections": [
{
"heading": "第一部分",
"content": "关键信息要点",
"visual": "图标或图表类型"
}
],
"color_scheme": ["#主色调", "#次要色调", "#强调色调"],
"style": "现代、简洁、商务风格"
}
提示示例: “请创建一个关于全球咖啡消费的竖版信息图。标题为‘全球咖啡文化’。包含三个部分,展示统计数据,每个国家使用相应的图标,配色方案采用 #4A2C2A(棕色)和 #F5E6D3(米色)。风格要求现代简约,字体清晰。”
排版与设计
FLUX.2 在生成简洁的排版、产品营销材料以及杂志版面方面,均展现出卓越的实力。
产品广告: “三星 Galaxy S25 Ultra 产品广告,广告语为‘超强钛金属’,副标题为‘坚固的钛金属框架,为您的 Galaxy S25 Ultra 提供始终如一的保护’,特写手机边缘展示钛金属框架,背景为深色渐变,整体呈现简洁的极简科技美学,专业产品摄影风格。”
杂志封面: “《女性健康》杂志封面,2025年4月刊,标题为‘春意盎然’,一位身着绿色服装的女性坐在橙色积木上,脚穿白色鞋,专题文章为‘新冠疫情:五年后的反思’,宣传语为‘15个护肤秘诀’,专业编辑摄影,杂志版面包含多种文本元素。”
多语言提示
FLUX.2 具备出色的多语言理解能力。您可以直接使用母语进行指令输入,从而获得更具文化本土特色的生成结果。
法语: “在诺曼底乡村的集市上,商贩们售卖各种蔬菜和水果。日出时分,天气微带薄雾。”
泰语: “曼谷郊区乡村的早市,摊贩们正在售卖各式各样的蔬菜和水果。日出时分,空气中弥漫着淡淡的薄雾,宁静而温馨。”
韩语: “首尔市中心的屋顶花园,人们在傍晚的夕阳下点亮小灯笼。远方闪烁着绚丽的霓虹灯,花园里百花盛开。氛围温暖而浪漫。”
在创作相关内容的母语环境下进行提示,往往能生成更具文化地道性的结果——无论是当地的市场风貌、建筑风格还是整体氛围,都能得到更为精准的呈现。
漫画与连环画创作
FLUX.2 能够创作风格统一、人物形象连贯的漫画分镜。关键在于对角色的细致刻画,并在所有分镜中保持其形象的一致性。
“扩散人”的故事线
在保持角色描述一致性的前提下,分别生成每一幅画面:
第一幅画面提示:危机降临
“风格:经典超级英雄漫画。角色:一位忧心忡忡的科学家,正焦急地在发光的虚拟键盘上敲击,脸部被蓝色光芒映照,神情充满担忧。场景:巨大的计算机服务器机房,电路火花四溅,显示器上闪烁着红色的警报灯。文字:‘AI模型正在失控!我们需要扩散人!’氛围:紧张、紧迫,带有戏剧性的蓝红色调。”
第二幅画面提示:蜕变时刻
“风格:经典超级英雄漫画,辅以动感的线条和电能特效。角色:扩散人/温文尔雅的程序员(30岁,棕色肤色,黑色短渐变发型,佩戴黑框眼镜,身穿浅蓝色衬衫,体格健硕,下颌线条分明),身体开始散发出深紫色、电光蓝和亮粉色能量的漩涡状光芒,数学公式和神经网络图案以发光线条的形式环绕着他。场景:小型办公室,电脑显示器上显示着代码和错误信息。文字:‘当噪音化为信号,我便是……扩散人!’氛围:强大、转变,伴随着戏剧性的背光和向外扩散的能量波。”
第三幅画面提示:激战正酣
“风格:经典超级英雄漫画,充满性的动作和动感的构图。角色:扩散人(一位30岁的健壮男性,棕色肤色,黑色短渐变发型,身穿由深紫到电光蓝再到亮粉色渐变的流畅紧身衣,胸前有发光的神经网络标志,节点相互连接,佩戴渐变色短披风,紫色半面罩勾勒出清晰的下颌线条和自信的神情),双臂前伸,摆出强有力的姿势,向由故障像素和损坏代码组成的数字怪物发射结构化噪声和潜在空间能量束。场景:数字网络空间,漂浮着数据立方体和级联的二进制代码。文字:‘是时候净化这场混乱了!’氛围:紧张激烈,动作场面火爆,伴随着耀眼的能量闪光和电光效果。”
第四幅画面提示:凯旋时刻
“风格:经典超级英雄漫画,色彩温暖而辉煌,构图简洁。角色:扩散人(一位30岁的健壮男性,棕色肤色,黑色短渐变发型,身穿由深紫到电光蓝再到亮粉色渐变的流畅紧身衣,胸前有发光的神经网络标志,身后飘扬着渐变色短披风,佩戴紫色半面罩,下颌线条分明,脸上洋溢着自信而英勇的笑容),英勇地站在原地,向身旁感激的科学家竖起大拇指,科学家的电脑屏幕上显示着稳定的绿色指示灯和成功信息。场景:宁静的服务器机房,柔和的蓝色环境灯光,有序的数据流顺畅地流动。文字:‘你拯救了我们,扩散人!模型又恢复正常了!’氛围:胜利、希望,如同金色夕阳般的光芒透过窗户洒入。”
保持角色一致性:在所有分镜的提示中,请务必保持“扩散人”的详细描述一致,包括肤色、发型、服装的渐变色、神经网络标志、紫色半面罩等关键细节。
照片级写实风格
FLUX.2 在生成照片级写实图像方面表现卓越。通过参考特定的时代背景和摄影技术,您可以创造出独具特色的视觉效果。
风格参考指南
| 风格类型 | 关键描述符 |
|---|---|
| 现代数码摄影 | “使用索尼 A7 IV 拍摄,画面清晰锐利,动态范围广阔” |
| 2000年代数码相机 | “早期数码相机质感,轻微噪点,闪光灯拍摄,抓拍风格,2000年代数码相机典型效果” |
| 80年代复古风 | “胶片颗粒感,暖色调,柔焦效果,典型的80年代复古照片风格” |
| 模拟胶片摄影 | “采用柯达 Portra 400 胶片拍摄,呈现自然颗粒感和有机色彩” |
现代写实主义:“一只浑身湿透的小老虎在雨后的丛林中,躲在一片香蕉叶下避雨,特写镜头。”
2000年代数码相机风格:“夜晚,一只懒惰的树懒在曼谷一条充满派对人群的街边酒吧里喝酒,呈现2000年代数码相机的风格,背景中的人群逐渐模糊。”
80年代复古风格:“一群小企鹅在蹦床公园里尽情玩耍,享受着欢乐时光,80年代复古照片风格。”
相机与镜头模拟
为了获得逼真的效果,请务必具体设定相机参数:
使用哈苏 X2D 相机拍摄,80mm 镜头,f/2.8 光圈,自然光
使用佳能 5D Mark IV 相机拍摄,24-70mm 镜头,焦距设置为 35mm,黄金时段光线,浅景深效果
多参考图像编辑
*[专业版] API 的输入与输出总限制为 9MP。在输出 1MP 时,最多可使用 8 张参考图;输出 2MP 时,最多可使用 7 张,以此类推。
多参考引用功能极其强大,可用于多种场景:
- 时尚摄影:将不同的服装单品巧妙组合,打造时尚造型。
- 室内设计:在房间场景中精确摆放家具和装饰品。
- 产品合成:将多个产品元素融合到同一场景中。
- 角色一致性:在不同变体中保持角色的身份特征。
时尚大片范例(使用 8 张参考图)
提示指令:“这是一张充满灵性的建筑摄影作品,采用1987年过期的柯达 Ektachrome 64 幻灯片胶片拍摄,并经过交叉冲洗处理,配合 35mm 球面镜头,光圈设置为 f/5.6。画面展示了一位模特,她站在林间空地上的一座小型森林教堂前。模特身着特定服装,位于通往木质教堂的石阶上,红色的服装与风化的棕色木材形成鲜明对比。背景描绘了一座传统的黑森林教堂——深色木结构,带有小钟楼、雕刻精美的木门、屋檐下的宗教绘画,周围的空地盛开着野花,高耸的冷杉树构成了天然的教堂氛围,旁边还有一个带有木制十字架的小型墓地。拍摄时,森林光线斑驳,快门速度为 1/125 秒。交叉冲洗的 Ektachrome 胶片呈现出极致的色彩偏移——青色和品红分离,温暖的木色调被推向橙棕色,红色过饱和,黑色阴影被压暗,高光部分过曝,厚重的颗粒感营造出神秘的氛围。构图强调了神圣空间和朝圣主题。风格参考:托马斯·斯特鲁斯(Thomas Struth)的教堂内部系列、坎迪达·霍弗(Candida Höfer)的建筑文献摄影,将宗教旅游与时尚杂志风格融合,并融入黑森林的神秘主义精神。”
在多参考图像编辑模式下,请务必清晰地描述每张参考图的具体用途。模型将根据您的指令,将不同参考图中的服装单品、配饰元素以及风格特征,融合成一个协调统一的整体场景。
即时提示词优化
FLUX.2 提供了一个名为 `prompt_upsampling` 的参数,能够自动优化您的提示指令,从而获得更优良的生成结果。此功能在以下场景中尤为实用:
- 快速迭代,无需撰写冗长的提示词。
- 探索多样化的创意变体。
- 当您拥有基本概念但期望获得更丰富的输出时。
提示词优化技术可以自动为您的指令添加更多细节和语境。在模型扩展视觉元素的同时,您最初的创作意图将得到完整保留。

粤公网安备 44011502001135号