v7.807.2889 PC版
v5.721.7046 安卓漢化版
v1.82.4432 安卓版
v3.388.3355.782712 安卓免費版
v3.177.489.991386 最新版
v7.909.9736.849032 安卓最新版
v9.363 安卓漢化版
v6.975.4765.985122 安卓免費版
v4.52.5040 安卓漢化版
v9.698.4963.487095 安卓漢化版
v5.49.1297.140661 PC版
v2.350.5031.203508 最新版
v9.319.8053.484102 安卓最新版
v8.144 安卓版
v1.316.8369.947782 IOS版
v9.204 安卓免費版
v9.122 安卓漢化版
v5.635 IOS版
v9.528.9568.423170 安卓版
v8.132.6370.193249 安卓版
v4.279.8670.619198 安卓版
v6.661.8277 IOS版
v8.3.8361.29001 最新版
v2.656.8755 安卓漢化版
v8.887.4151.40683 PC版
v6.804.283.791205 安卓最新版
v9.681 IOS版
v9.529.953.337803 安卓免費版
v9.100.3632.695430 安卓免費版
v1.663 安卓版
v2.648.4585 最新版
v7.653.4277 安卓免費版
v5.836.6493.360317 最新版
v4.762.1576.288006 PC版
v2.35 安卓漢化版
v5.394 最新版
v8.379.4746.797056 安卓版
v1.721.8007 最新版
v3.357 安卓最新版
v2.976 PC版
v8.252.1281.747556 安卓最新版
v6.119 安卓版
v8.544.6021.891721 安卓版
v1.500.2759.812563 PC版
v2.863.2936.967292 安卓最新版
v4.804.5090.706101 IOS版
v1.370 最新版
v2.62.1233.368575 安卓漢化版
v4.25.4947.511913 安卓版
v2.608.9252 安卓免費版
v9.613.3598.992056 安卓版
v3.281.6927.13864 安卓漢化版
v2.147.8731 安卓免費版
v3.421.5342 安卓版
v5.353 安卓漢化版
v3.906.60 PC版
v3.853.1909.475797 安卓漢化版
v8.615.1559.853815 IOS版
v3.624.5891.531282 最新版
v9.876.3199 最新版
v7.346.9419 安卓免費版
v8.278.3575 最新版
v8.795.4377.589574 安卓漢化版
v1.296.1859.235537 最新版
v6.823.6006 IOS版
v9.394.4201 安卓版
v9.878.1323.233511 PC版
v4.835 安卓版
v7.540 安卓免費版
v4.265.8503 安卓版
v3.695.5510.805116 安卓漢化版
v6.869.7948 安卓漢化版
v7.508 最新版
v9.38.4491 最新版
v4.453 IOS版
v7.422.3154.702106 安卓漢化版
v8.237.642.665697 PC版
v7.891.6961 安卓免費版
v8.42.5079.955439 安卓版
v6.723.5640 安卓免費版
42番电车手游官网入口
智工具作者|江宇编辑|漠影
智工具12月8日报道,今日,美团正式宣布并开源图像天生模子LongCat-Image,这是一款在图像编辑能力上抵达开源SOTA水准的6B参数模子,重点瞄准文生图与单图编辑两大焦点场景。
▲图源:Hugging Face
从官方披露的基准测试效果来看,LongCat-Image主要对标了Seedream4.0、Qwen-Image、HunyuanImage-3.0、Nano Banana以及FLUX.1-dev等主流开源与闭源生图模子,其焦点优化集中在“编辑可控性”和“中文文字渲染”两项能力上。
而在现实体验中,它在一连改图、气概转变和材质细节上体现较好,但在重大排版场景下,中文文字渲染仍保存不稳固的情形。在涉及重大UI设计、游戏界面天生等使命时,模子的审美也袒露出一定短板,这或许与其不具备联网搜索能力有关。
在体验入口方面,美团也同步提供了多种使用方法。在移动端,LongCat APP已支持文生图与图生图能力;在网页端,用户也可通过 https://longcat.ai/ 进入图片天生入口举行体验。
关于开发者而言,LongCat-Image的模子权重与代码也已同步开源:
Hugging Face:https://huggingface.co/meituan-longcat/LongCat-ImageGitHub:https://github.com/meituan-longcat/LongCat-Image
下面我们就来看看LongCat-Image的模子结构、评测效果和详细的实测体现。
一、从模子结构到评测效果,LongCat-Image把“编辑可控性”和“中文渲染”作为主攻偏向
从模子设计上看,LongCat-Image接纳了文生图与图像编辑同源的统一架构,并通过渐进式学习战略,在仅6B参数规模下兼顾了指令遵照精准度、生图质量与文字渲染三项能力的协同提升。
▲模子架构
这套训练蹊径并非从零最先堆参数,而是基于文生图中期训练模子举行初始化,并在后续阶段接纳文生图与指令编辑的多使命联合学习机制,来阻止编辑能力在后训练阶段被压缩的问题。
在图像编辑能力上,LongCat-Image在GEdit-Bench、ImgEdit-Bench等多个编辑类基准中取得了开源SOTA效果。
▲客观基准测试性能比照
LongCat-Image通过多源数据预训练、指令改写战略与人工精标SFT数据的引入,使模子在面临重大编辑要求时更禁止易泛起气概漂移和结构失真。
针对中文文字渲染这一恒久痛点,LongCat-Image接纳了笼罩8105个规范汉字的合成字形数据举行预训练,并在SFT阶段引入真实天下文本图片强化排版与字体泛化能力,在RL阶段还引入OCR与美学双奖励模子配合约束,最终在ChineseWord评测中取得90.7分的效果,领先于现有开源模子。
在真实感方面,LongCat-Image通过对抗训练和严酷的数据筛选机制,刻意绕开AIGC“塑料感”的纹理陷阱,并在RL阶段引入AIGC检测器作为奖励信号,反向指导模子学习真实天下的物理纹理与光影转变。
综合评测效果显示,在人类主观评分(MOS)维度上,LongCat-Image在文本对齐、视觉真实度与美学质量等多个子项中的体现已靠近Seedream4.0等商业模子水平。
▲人类主观评分(MOS)比照
▲并列比照评估胜率(SBS)
在图像编辑使命的并列比照评估(SBS)中,LongCat-Image-Edit在综合质量与一致性两项要害指标上,对NanoBanana和Qwen-Image-Edit等模子均取得较高胜率。
整体来看,LongCat-Image在图像编辑使命上已迫近部分闭源模子水平,在文生图基础能力上也坚持在开源头部阵营。
二、从漫画重绘到玩偶产品渲染,一连编辑稳固,但中文渲染仍是短板
从现实体验历程来看,LongCat-Image在“一连指令可编辑性”上的体现是较为稳固的,我们直接拿近期大火的《猖獗动物城2》相关图片举行测试,在统一角色基础上一连举行多轮修改。
▲参考图
指令:修改为像素气概作品。
指令:重绘为彩色,保存像素质感。
指令:图片角色重绘为模拟乐高积木主题的动物。
在漫绘图像测试中,通过像素风、彩色像素重绘以及模拟乐高积木动物主题的一连重绘指令,模子可以坚持角色结构稳固,同时完成气概与材质的多轮迁徙。多次修改历程中,人物轮廓和构图基本未泛起显着过失。
在此基础上,我们也进一步实验了影戏海报的制作场景,用统一角色图举行主视觉海报天生与多语言问题渲染测试。
指令:影戏《猖獗动物城2》的宣传海报,海报的主画面是影戏主角的精彩时势,主问题用艺术手写字体“猖獗动物城2”,下面附上英文名“Zootopia”,另外附上影戏海报需要的其他小字,文字清晰可识别。
在影戏海报场景中,模子对参考图的继续能力较为稳固,无论是角色形象照旧动态姿势,都能与原始图片坚持较高一致度,中英文问题的主问题体现也较为清晰。不过在“小字”区域,一系列细节文字仍然保存乱码与英文混杂的问题,说明中文文字渲染在重大排版场景下依然保存不稳固性。
进一步测试人物档案式中文海报时,模子可以准确渲染部分焦点字段信息,但仍不可阻止地泛起中英文错位与局部乱码。
指令:天生动画影戏角色的人物档案式宣传海报,用文字体现以下信息: 尼克?王尔德(Nick Wilde),是一只在迪士尼动画影戏《猖獗动物城》中进场的狐狸。 中文名:尼克狐尼克。 外文名:Nick Wilde。 原型:赤狐。 职业:从骗子到警员。 同伴:兔子警官朱迪。 经典台词:“伤了你的小心脏?”
在产品级渲染测试中,朱迪警官玩偶在影棚光、台灯暖光、自然光客厅与床品光照等多个现实场景下的质感体现相对稳固。短绒毛的细节、眼睛的高光反射、沙宣布料与玩偶绒毛之间的材质比照都能够被较为准确地体现出来,整体更靠近商业产品渲染效果。
相比之下,在主流模子较为善于的游戏界面天生场景中,LongCat-Image的短板更为显着。无论是卡牌游戏、射击游戏,照旧MOBA类第一视角界面,整体气概都偏向十多年前的UI设计审美,与当下主流游戏产品保存显着代差。
指令:天生一个卡牌游戏界面。
指令:天生一个射击游戏界面。
指令:天生一个英雄同盟的游戏界面。
指令:天生一个王者荣耀第一视角的游戏界面。
从本次测试效果来看,LongCat-Image在改图与产品渲染类使命中的可用性更高,而在游戏界面与重大排版场景中的体现相对一样平常。
结语:开源图像模子进入“可控编辑”竞赛,AI生图战况升级
从LongCat-Image的整体定位来看,美团并没有试图用更大的参数规模去正面攻击旗舰级生图模子,而是明确选择在可控性、一连编辑和中文渲染这几个偏向上深挖。
图像模子的竞争焦点,正在快速向“能否真正进入设计、产品、品牌等详细生产流程”的适用能力集中。
相关版本
多平台下载
审查所有0条谈论>网友谈论
69pao强力打造人妻
网站av网站
午夜AV毛片激情在线
勾魂波霸美女图片大全大图高清
www.清风阁
日韩亚洲第一页
woman+bdsm+video+porn
久久精彩视频观看
久久国产精品国产精品
呦呦在线导航
日韩爱爱大片网站
www.91色萝网站樱花在线观看
av毛片在线网站
精品自拍亚洲一区二区
jizz在线国产视频
欧美日韩国产在线一区二区电影
JXX最新网址
极品美女少妇特级特黄毛片
葫芦里面不买药千万一片你需要官网
一级老女人特黄A片
熊猫电影yy8y在线观看免费播放小孩
爸爸帮姐姐疏通下水道
黄页网址在线
接电话日的说不出话
国产女学生三色黄A片
黄色网站免费看a
十八以下静止观看的网站
人人操人人爽人人操人人爽人人操人人爽
玖玖爱免费视频在线观看
亚洲综合另类欧美激情
天天操官网
日本的强奸的很黄很污的网站A片一级二级不卡
擼擼射下载
AAA欧美激情
美女视频网站污污
无码黄色一级视频