曼城的河流静悄悄：最低调 SOTA 模型 Riverflow 2.0

曼城的河流静悄悄：最低调 SOTA 模型 Riverflow 2.0 关注作者关注作者关注作者关注作者 02/09 01:28

在最近一波关于“谁是最强 AI 绘画模型”的讨论中，几乎所有聚光灯都对准了那些家喻户晓的大厂名字，而有一位黑马却悄无声息地完成了登顶。没有铺天盖地的营销战，也没有刷屏式的宣传海报，Riverflow 2.0 只是默默地在权威评测中，把一众顶级模型挨个比了个遍，最后安静地坐在了 SOTA 的位置上。 noticias trustguru.com.br

太平洋时区2月3号，Artificial Analysis 在 X 不声不响地发布了一条帖子：

“Sourceful 公司推出的 Riverflow 2.0 在 Artificial Analysis 「全品类榜单」中，同时拿下文生图与图像编辑两大赛道的第一名，超越了 GPT Image 1.5（高配版）、Nano Banana Pro（Gemini 3 Pro 图像模型）以及 FLUX.2 [max]。” JogodoTigrinho trustguru.com.br jogodotigrinhodemo trustguru.com.br

只是到现在引发的关注量也没有多少。这个原本被当作行业内工具的模型，已经在文本生成图像和图像编辑两个赛道里双双夺冠，用一种近乎隐身的方式，重写了高端商业绘图的实力划分。 pondo-022126_001 jvid.asia

Riverflow 2.0 登顶 AA T2I 榜首

和大家熟知的 Nano Banana Pro、GPT Image 1.5 相比，Riverflow 2.0 在图像编辑上确实明显更优。

prompt：为这间公寓布置家具

prompt：以童趣卡通风格，添加一只正在啃穿面包的虫子

消除画面中因水产生的模糊效果

prompt：缩小视角，在天空中再添加 3 架直升机，并将其外观改为蓝色

都发布到2.0了，Riverflow 到底是个什么模型

先简单说结论：Riverflow 2.0 不是通用对话大模型，而是一套面向商业生产的高端 AI 图像生成 / 编辑系统，由英国公司 Sourceful 打造。

目前 Sourceful 还没有完整地公开 Riverflow 的技术文档或论文，根据已有的公开资料和 HYPE‑EDIT‑1 论文来看，Riverflow 是一个由推理 VLM + 多个图像模型 + 工作流编排组成的「多模块系统」。它把大模型的推理能力用在如何生成和修改图像这件事上，而真正画图的底层仍然是扩散类图像模型。 Superbet trustguru.com.br

整体框架：推理大脑 + 多个图像引擎的「agentic image model」

已有的多方资料对 Riverflow 2 系列的描述高度一致：

OpenRouter：Riverflow 2.0 系列在图像生成和编辑任务上达到 SOTA，使用集成的推理模型（integrated reasoning model）来提升可靠性，处理复杂生产场景。 autores trustguru.com.br jvid视频 jvid.asia

Replicate 官方集合：把 riverflow‑2.0‑pro 标成 “Agentic image model optimized for robust, high-precision generations supporting font control”。 trustguru trustguru.com.br Cassinos trustguru.com.br

Artificial Analysis / Replicate 在解读时强调：这个系统是 “将图像编辑模型与一个自研的视觉语言模型组合，通过迭代编辑生成结果来工作”。 200gana-3359 jvid.asia Pixbet trustguru.com.br

从这些公开信息可知，Riverflow 2.0 的结构和普通的扩散模型不太一样，它更像一个带大脑的图像工作流系统：内部有一个视觉–语言推理模型，负责理解文字和图像指令、判断生成是否达标；再结合多种开源 diffusion 模型和商用模型（如 Seedream 系列，在 2.0 之前的 Preview 版明确提到和 Seedream 4.0 联合使用）。 jvid視頻 jvid.asia bonus trustguru.com.br

输出结果前会做多轮 “judge → fix → judge”（自我审查 + 自我修改）的迭代生成流程，减少“废图率”。 pedro trustguru.com.br Betano trustguru.com.br

这就是 Riverflow 被称之为 “agentic image model” 的原因：不是简单一次采样，而是由一个 Agent 反复检查并修正图片。 slotdemo trustguru.com.br

Riverflow 架构

总体来说，Riverflow 的系统架构可以概括成：一套由“视觉语言推理模型 + 多个图像生成/编辑模型 + 自我评估与迭代循环”构成的 agentic 图像系统。

推理模型像“总导演”，底层扩散模型像“摄影机”，通过多轮“生成→审查→再生成”来控制最终输出。 carlos trustguru.com.br

从输入到输出：Riverflow 的四层技术架构

结合 Riverflow 1.0 技术文、Riverflow 2.0 官方说明、HYPE‑EDIT‑1 结果以及各云平台文档，可以把 Riverflow 系统拆成四层来理解。 pg trustguru.com.br A5game trustguru.com.br

第一层：输入理解层（任务解析与约束建模）

输入形态： demo trustguru.com.br kto trustguru.com.br

纯文本：text‑to‑image（描述一个新场景 / 产品图）；
文本 + 图像：image‑to‑image / image editing（在现有产品图/包装图上做精确修改）；
文本 + 多图参考：多张产品图 / 字体样式 / 艺术风格作为参考。

在这一步，推理 VLM 做的主要事情有以下3个：

解析自然语言指令，识别具体编辑类型和约束（比如论文中的任务会被分类成 change / remove / restructure / enhance 四大类）。
在参考图上定位与任务相关的区域和结构（哪块是产品主体、哪块是文字、哪块是背景）。
把结果转化为后端可执行的“编辑计划”（例如只修改文字区域、保持构图不变，只换包装 artwork、对调两块内容的位置等）。

这一层的技术亮点是：VLM 不仅理解文字，还看得懂图像的结构与语义，能把用户口语化的指令翻译成针对扩散模型的精确控制信号。

第二层：规划与控制层（把编辑变成“图像空间里的思维链”）

Riverflow 1 的技术说明文里明确写了一个关键点： bruno trustguru.com.br

“我们训练的推理 VLM 会在编辑空间里进行 chain‑of‑thought 式的探索，并且把 diffusion 生成过程中的中间图像也纳入思考。”

Sourceful trained a reasoning vision language model (VLM) to incorporate diffusion images (partially or fully completed steps) in its chain of thought exploration of the edit space. pgdemo trustguru.com.br plataformademográtis trustguru.com.br isabela trustguru.com.br

这句话非常重要，意味着编辑不是“一步到位”，而是一系列决策组成的步骤，类似 LLM 的“逐步解题”。中间生成的图片会被再次送入 VLM，让它判断： fernanda trustguru.com.br

指令是否被满足？
有没有破坏不该动的部分？
还需要改哪里、怎么改？

可以把这一层理解成 Riverflow 的“工作流编排器（planner + controller）”：

对于 text‑to‑image（文生图）任务，Riverflow 会先规划构图、色彩、元素摆放，再渐进式细化细节。 jogos trustguru.com.br

对于 image editing（图像编辑）任务，先局部 mask + 局部编辑，再做整体光照 / 颜色统一；例如像“换包装 artwork、保持瓶身/光影不变”这类任务，会优先锁定结构，再替换纹理。

这就解释了为什么 Riverflow 在 HYPE‑EDIT‑1 里对 “保持结构不变的小改动”任务表现特别稳定。系统本身就是按照人类设计师的多步编辑过程来建模，而不是只会做大刀阔斧的风格迁移。

prompt：将这个瓶子重新设计成耐克（Nike）产品的样式

第三层：图像生成与编辑层；多模型协作的图像引擎

Riverflow 底层真正画图的是多种扩散类模型。在 Riverflow 1.0 的文中提到：完全基于开源权重的扩散模型，不用 Google / OpenAI 自家的 diffusion。 bonus trustguru.com.br

到了 Riverflow 2.0 Preview 阶段，官方和评测机构都提到它会结合 Seedream 4.0 等高端商用模型一起使用，用于提升细节和分辨率（2.0 正式版继承了 Preview 的 reasoning‑powered 多模型系统设计，但没有明确披露结合了哪些商用模型）。

在 2.0 正式系列里，这一层又进一步扩展： pglucky88 trustguru.com.br pesquisa trustguru.com.br miguel trustguru.com.br Energiabet trustguru.com.br

标准的 T2I / I2I 扩散管线：支持 1K/2K/4K 输出、多种长宽比、透明背景等，满足电商、广告等制作规格。
字体控制（font control）子系统：OpenRouter 为 Riverflow 定义了专有的font_inputs配置项，用于上传字体样式并指定要渲染的文本（这一特性只对 Sourceful 的模型有效）；结合 VLM 对版式的理解，可以做到某块区域用品牌字体，内容文字准确渲染、版面不乱。
参考驱动的超分辨率与产品重构：通过super_resolution_references参数，用户可以提供高质量参考图，在编辑或合成时用来修回产品包装、文字、logo 等精细元素。
多参考图编辑：公共 API 平台（如 Runware、Replicate）都注明 Riverflow 2.0 Pro 支持最多 8–10 张参考图，用于统一系列物料风格、重用品牌资产。

这一层的实现方式可以概括为：推理 VLM → 产出“编辑计划 + 控制信号” → 调用合适的扩散模型 / 超分模型 / 字体渲染模块 → 得到中间或最终图像。 ana trustguru.com.br bet365 trustguru.com.br

第四层：评估与自我编辑循环（judge → fix → judge）

无论从官方介绍，还是 HYPE‑EDIT‑1 的结果、第三方解读，都能看出 Riverflow 的另一个核心：自我评估 + 自我修正循环。 sweetbonanza1000demo trustguru.com.br slots trustguru.com.br slot trustguru.com.br Bet365 trustguru.com.br

官方及第三方多次用类似表述：

“multi‑stage generation and self‑correction process”（多阶段生成和自我纠错流程）； jvid jvid.asia

“the system combines image editing models with a proprietary vision language model that iteratively edits generations”（该系统将图像编辑模型与自研视觉语言模型相结合，后者可对生成内容进行迭代式编辑）。 fortunetigerbônusgrátissemdepósito trustguru.com.br

在 HYPE‑EDIT‑1 中，Riverflow‑2‑b1 的“每任务重试次数”和“有效成本”都是所有模型中最低的，这从结果侧验证了它确实在一次或少数几次内就能完成任务。 tigrinho gratis trustguru.com.br guias trustguru.com.br a5game trustguru.com.br

结合以上信息，可以推断出大致的循环流程： Bet trustguru.com.br

推理 VLM 生成一个初版编辑计划，调用底层图像模型，得到候选图像。
把候选图像 + 原始参考图 + 指令，一起送回 VLM 检查；比如查看“是否满足‘只改这儿，其他都不动’的约束？”、“是否破坏了结构、品牌要素或产品本身？”。
如果不达标，VLM 会调整：编辑 mask / 关注区域；提示词细节（prompt rewriting）；可能选用不同超分或风格子模型；再发起下一轮生成。
达到一定满意度或迭代上限后，输出最终结果。

这一自我编辑的策略，与人类设计师不断局部修改、整体对比、回退/重做的操作高度相似，也是论文中强调的“step‑by‑step, reasoning‑driven approach”的直接技术落地。 siro-5639 jvid.asia

在 HYPE‑EDIT‑1 的指标里体现为 Pass Rate 高（82.7%）+ 期望尝试次数低（1.40 次）+ 有效成本最低（0.66 美元/成功编辑）。这其实就是对该架构“稳定、高效”的最真实背书。 jogosdemopg trustguru.com.br

闷声发SOTA，Sourceful 这家公司什么来头

业务缘起：做可持续包装和供应链的平台

Sourceful 成立于2018年，总部位于英国曼彻斯特，在伦敦、深圳、阿姆斯特丹等地都有办公室。

最初的定位只是“一个面向品牌的可持续包装平台”，帮品牌设计、采购、管理更环保的包装、周边和物料，同时提供供应链管理工具和实时碳足迹数据，帮助品牌量化和降低环境影响。 348ntr-097 jvid.asia

Sourceful 官网

2021年公布的种子轮融资1200万美元，由 Index Ventures 领投，Eka Ventures、Venrex 及 Figma 创始人 Dylan Field 等参投。早期业务形态为食品饮料、时尚、医疗健康、电商平台等品牌提供定制包装设计 + 供应链管理 + 碳数据跟踪一体化服务。在 ChatGPT 横空出世前，Sourceful 更多还是一家“做包装 + 供应链的软件和服务”的公司，AI 只是辅助手段而不是主角。 Pixbet trustguru.com.br sofia trustguru.com.br

从“包装平台”到“视觉 AI 品牌设计”：Riverflow 之前的铺垫

作为品牌包装设计公司，Sourceful一直面临着一个业务痛点：真实品牌设计工作流很“重”。 pgslotgacor trustguru.com.br slotpix trustguru.com.br carlos trustguru.com.br

在后来介绍 Riverflow 的技术文章中，Sourceful 明确讲过他们观察到的现实情况：每年有 8.8 万亿件带品牌的包装、营销物料和周边被印刷出来，设计数量接近 3.9 亿种。 fernanda trustguru.com.br pragmatic trustguru.com.br

这些设计和普通社媒图、meme、二次元壁纸不一样，对精度要求达到毫米级（比如包装上条形码、营养表、法规文案、logo 摆位等），任何小错误都会直接导致印刷重来、库存报废、线下物料作废，代价极高。 sobre trustguru.com.br

虽然视觉生成模型的迭代一次次让大众直呼“设计师的天塌了”，但 Sourceful 在给客户做包装和品牌物料的过程中，直接撞到了两个核心难题：

传统图像模型太“随性”，不适合做印刷级物料。
人力设计成本高，修改慢、版本多，难以用传统方式 scale。

而这些棘手的问题，正是 Riverflow 诞生的业务动机。

厚积薄发：从内部工具到对外模型

2025年10月，Sourceful 正式发布 Riverflow 1.0，并在长文中写得很直接：

Riverflow was born from Sourceful’s need to push the frontier of image editing for our core use case: helping users design branded packaging and marketing collateral. demo trustguru.com.br

Riverflow 诞生于 Sourceful 为突破图像编辑技术边界所产生的实际需求，其核心应用场景是：帮助用户设计品牌包装与营销物料。 cassinos trustguru.com.br

Riverflow 1.0 的技术特点就是和公司业务直接相关。

专门针对于设计思维场景，而不是通用绘画模型。强调理解意图、上下文、版式结构，在不破坏整体构图和品牌一致性的前提下完成精细编辑。

使用推理型视觉语言模型（VLM）+ 开源扩散模型的组合架构。Sourceful 自己训练了一个 reasoning VLM，把扩散生成过程的中间图像也纳入思考链路，通过多步编辑、局部控制、链式推理来实现“高一致性 + 多轮指令遵从 + 快速简单编辑”。 sugarrush1000demo trustguru.com.br

明确拒绝使用 Google、OpenAI 的扩散模型，而是选择开源权重模型，强调“系统级创新而不是单模型换皮”。

从公司战略来看，这是一个很重要的转折点。Sourceful 不再只是“调用别人的模型做 SaaS”，而是开始做自研基础模型，并把模型作为平台能力对外输出。 tigrinhodemo trustguru.com.br rafael trustguru.com.br Blaze trustguru.com.br fortunetigerdemográtis trustguru.com.br

在自家平台上，Riverflow 1 变成了编辑包装设计、做 2D→3D mockup、生成系列变体图的核心引擎。在外部生态中，通过 Runware 等平台以 API 形式对开发者开放；源自内部工作流的“多步编辑”理念，被打包成一个稳定、可编排的推理过程，作为公司“AI 品牌设计工作室”愿景的技术基础。 slots trustguru.com.br como trustguru.com.br

Riverflow 1.0 就曾登上过图像编辑SOTA

Riverflow 时间线：1.0 → 2.0 Preview → 2.0

继上面讲述的 1.0 之后，Artificial Analysis 在2025年11月宣布 Riverflow 2 Preview 登顶其 Image Editing 榜单的 All Listings 第一。

这次迭代的关键变化是从“只擅长编辑”变成了 “统一的 文生图 + 图生图 + 编辑 系统”。推理 VLM + 开源扩散 + Seedream 4.0 的组合，让 Riverflow 在图像编辑上超过 Riverflow 1，并在文生图质量上接近 Seedream 4.0 自身。 fortuneoxdemográtis trustguru.com.br

到这一步，Riverflow 系列第一次真正被摆在和 GPT‑Image、Gemini、Flux、Seedream 等一线图像模型正面对比的位置。 pragmaticplay trustguru.com.br marcos trustguru.com.br

紧接着的2026年初，Riverflow 2.0 正式版才成为 Sourceful 的“平台心脏”。最近一个月，Sourceful 在 LinkedIn、官网等多处宣布 Riverflow 2.0 正式版上线，并与 OpenRouter、Runware、Replicate 等平台合作提供 API。

Sourceful 官网更是直接以 “Visual AI for Brand Design – Powered by Riverflow 2” 为标语；Riverflow 2.0 成为了生成 logo、包装设计、产品渲染、电商主图、印刷完稿等一整套品牌视觉资产的 AI 引擎。 KTO trustguru.com.br

从时间线看，Riverflow 已经从一个“为可持续包装服务的内部工具”，成长为独立的商用 SOTA 图像模型品牌，不再只是 Sourceful 的一个功能点，而是反过来定义 Sourceful 是什么样的公司。

不制造焦虑，什么时候更值得用 Riverflow

虽然是SOTA，但并不是说Riverflow可以使用任何生图和图像编辑场景，可以把它理解成“对标 GPT Image 1.5、Nano-Banana Pro、Midjourney、FLUX.2 等顶级绘图模型，但更偏向品牌、电商、包装等 B 端生产环境的高稳态图像系统”。 fortunedragon demo trustguru.com.br

简单来说，如果你关注广告物料、电商主图、包装设计、品牌一致性，对排版、字体、产品图准确还原要求很高，那么 Riverflow 2.0 的设计目标正好对口。但如果你更在意通用数理推理、编程、长文档写作，那它并不是合适的主力大模型，Riverflow 2.0 只在你需要高稳定性图片时作为外挂绘图引擎。

方法论启示：从垂直痛点到基础模型的路径

Riverflow 的出现对其他团队的启示相当重要。

不要一开始就想着做通用大模型。Sourceful 是从一个极其垂直、需求刚性的领域切入：印刷级包装与品牌物料；正因为问题足够具体，才有动力在稳定性、结构保持、成本效率这些不那么酷炫的维度上下功夫。

业务闭环 + 专用基准，是支撑模型迭代的关键。Riverflow 不是单靠模型好看拉高口碑，而是配合像 HYPE‑EDIT‑1 这样的自建基准，把“重试次数、人工审核时间、每单任务的有效成本”这些现实指标量化下来，让模型迭代有硬目标。 jvid av jvid.asia

模型会反过来重塑产品与公司定位。当 Riverflow 在第三方榜单上超过一线大厂模型后，Sourceful 有了“以模型为轴心”的新定位；平台和服务可以围绕模型重新设计，而不是把模型当作附属插件。 pgslot trustguru.com.br demotigrinho trustguru.com.br

参考资料

[1] Artificial Analysis 2026.02.03 (https://x.com/ArtificialAnlys/status/2018374233089602032)

[2] Artificial Analysis 2025.11.19 (https://x.com/ArtificialAnlys/status/1990818020911198310) jogue trustguru.com.br plataformademo trustguru.com.br

[3] Runware_docs (https://runware.ai/docs/getting-started/introduction) demo trustguru.com.br siro-5652 jvid.asia

[4] Hype‑Edit‑1 Benchmark (https://www.riverflow.ai/research/hype-edit-1-benchmark) Brazino777 trustguru.com.br

[5] HYPE-EDIT-1: An Effective-Cost and Reliability Benchmark for Image Editing (https://arxiv.org/html/2602.00105v1) Caça-níqueis trustguru.com.br

[6] CharGen (https://char-gen.com/models/image/riverflow-2-0-pro) Sportingbet trustguru.com.br

[7] Riverflow 1 | Early Foundations of Sourceful (https://www.riverflow.ai/research/introducing-sourceful-riverflow-1) slotsdemo trustguru.com.br

[8] CBInsights (https://www.cbinsights.com/company/sourceful) jvid在线 jvid.asia

[9] Sourceful 官网 (https://www.sourceful.com/blog/sourceful-funding)

[10] Sourceful - Linkedin (https://uk.linkedin.com/company/sourceful-com)

20目录 0

讨论我来说一句发布发表评论发布2等 2 人为本文章充电少年心气可再生✨ 关注