最近在研究学习一些 AI Coding 相关的东西,加入新的模型

3 月 25 日
 alexwang0707

最近在研究 AI 图片生成,发现了个挺有意思的模型,顺手分享一下。 https://uni-1.me/

用过 Midjourney 和 Flux 的应该都知道,这类模型的通病是"听话"程度参差不齐——提示词写得很细,出来的图还是跑偏,空间关系错,多角色场景更是一塌糊涂。

最近试了个叫 Uni-1 的模型,底层逻辑和别的不太一样——它在生成之前会先做推理,把提示词拆解、分析空间约束、规划构图,然后再出图。实际体验下来,复杂场景的还原度确实比 Midjourney 强一截,多人物合照基本一次过。

另外支持上传最多 8 张参考图做身份锚定,风格迁移也比较稳,不会出那种"参考了但完全不像"的情况。支持 76+ 种风格,日系漫画、电影感、产品摄影都能跑。

生成前先推理——比单纯堆模型参数更有意思,感兴趣的可以看看。

1012 次点击
所在节点    分享创造
2 条回复
Nasdaq
3 月 25 日
感谢分享。测试了一下,严重怀疑是 FLUX-2 的底子魔改的。不过逻辑性确实强点~
alexwang0707
4 月 3 日
非常感谢作者的分享,看完收获很多。

这里也分享一个最近一直在用的工具,Aggiii AI 。起初只是拿来生图,用着用着发现功能比我想象的丰富很多——Nano Banana Pro 现在免费开放,出图质量很稳,光影和细节都不像一般免费工具的水平。视频生成也在里面,不用跳到别的平台,背景替换、水印去除、图片扩展一套流程在一个地方搞定。

对于需要持续产出内容的人来说,这个组合确实省了不少时间和成本。感兴趣的可以看看

https://aggiii.com/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1201008

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX