首页
智工具作者|江宇编辑|漠影
智工具12月8日报道,今日,美团正式宣布并开源图像天生模子LongCat-Image,这是一款在图像编辑能力上抵达开源SOTA水准的6B参数模子,重点瞄准文生图与单图编辑两大焦点场景。
▲图源:Hugging Face
从官方披露的基准测试效果来看,LongCat-Image主要对标了Seedream4.0、Qwen-Image、HunyuanImage-3.0、Nano Banana以及FLUX.1-dev等主流开源与闭源生图模子,其焦点优化集中在“编辑可控性”和“中文文字渲染”两项能力上。
而在现实体验中,它在一连改图、气概转变和材质细节上体现较好,但在重大排版场景下,中文文字渲染仍保存不稳固的情形。在涉及重大UI设计、游戏界面天生等使命时,模子的审美也袒露出一定短板,这或许与其不具备联网搜索能力有关。
在体验入口方面,美团也同步提供了多种使用方法。在移动端,LongCat APP已支持文生图与图生图能力;在网页端,用户也可通过 https://longcat.ai/ 进入图片天生入口举行体验。
关于开发者而言,LongCat-Image的模子权重与代码也已同步开源:
Hugging Face:https://huggingface.co/meituan-longcat/LongCat-ImageGitHub:https://github.com/meituan-longcat/LongCat-Image
下面我们就来看看LongCat-Image的模子结构、评测效果和详细的实测体现。
一、从模子结构到评测效果,LongCat-Image把“编辑可控性”和“中文渲染”作为主攻偏向
从模子设计上看,LongCat-Image接纳了文生图与图像编辑同源的统一架构,并通过渐进式学习战略,在仅6B参数规模下兼顾了指令遵照精准度、生图质量与文字渲染三项能力的协同提升。
▲模子架构
这套训练蹊径并非从零最先堆参数,而是基于文生图中期训练模子举行初始化,并在后续阶段接纳文生图与指令编辑的多使命联合学习机制,来阻止编辑能力在后训练阶段被压缩的问题。
在图像编辑能力上,LongCat-Image在GEdit-Bench、ImgEdit-Bench等多个编辑类基准中取得了开源SOTA效果。
▲客观基准测试性能比照
LongCat-Image通过多源数据预训练、指令改写战略与人工精标SFT数据的引入,使模子在面临重大编辑要求时更禁止易泛起气概漂移和结构失真。
针对中文文字渲染这一恒久痛点,LongCat-Image接纳了笼罩8105个规范汉字的合成字形数据举行预训练,并在SFT阶段引入真实天下文本图片强化排版与字体泛化能力,在RL阶段还引入OCR与美学双奖励模子配合约束,最终在ChineseWord评测中取得90.7分的效果,领先于现有开源模子。
在真实感方面,LongCat-Image通过对抗训练和严酷的数据筛选机制,刻意绕开AIGC“塑料感”的纹理陷阱,并在RL阶段引入AIGC检测器作为奖励信号,反向指导模子学习真实天下的物理纹理与光影转变。
综合评测效果显示,在人类主观评分(MOS)维度上,LongCat-Image在文本对齐、视觉真实度与美学质量等多个子项中的体现已靠近Seedream4.0等商业模子水平。
▲人类主观评分(MOS)比照
▲并列比照评估胜率(SBS)
在图像编辑使命的并列比照评估(SBS)中,LongCat-Image-Edit在综合质量与一致性两项要害指标上,对NanoBanana和Qwen-Image-Edit等模子均取得较高胜率。
整体来看,LongCat-Image在图像编辑使命上已迫近部分闭源模子水平,在文生图基础能力上也坚持在开源头部阵营。
二、从漫画重绘到玩偶产品渲染,一连编辑稳固,但中文渲染仍是短板
从现实体验历程来看,LongCat-Image在“一连指令可编辑性”上的体现是较为稳固的,我们直接拿近期大火的《猖獗动物城2》相关图片举行测试,在统一角色基础上一连举行多轮修改。
▲参考图
指令:修改为像素气概作品。
指令:重绘为彩色,保存像素质感。
指令:图片角色重绘为模拟乐高积木主题的动物。
在漫绘图像测试中,通过像素风、彩色像素重绘以及模拟乐高积木动物主题的一连重绘指令,模子可以坚持角色结构稳固,同时完成气概与材质的多轮迁徙。多次修改历程中,人物轮廓和构图基本未泛起显着过失。
在此基础上,我们也进一步实验了影戏海报的制作场景,用统一角色图举行主视觉海报天生与多语言问题渲染测试。
指令:影戏《猖獗动物城2》的宣传海报,海报的主画面是影戏主角的精彩时势,主问题用艺术手写字体“猖獗动物城2”,下面附上英文名“Zootopia”,另外附上影戏海报需要的其他小字,文字清晰可识别。
在影戏海报场景中,模子对参考图的继续能力较为稳固,无论是角色形象照旧动态姿势,都能与原始图片坚持较高一致度,中英文问题的主问题体现也较为清晰。不过在“小字”区域,一系列细节文字仍然保存乱码与英文混杂的问题,说明中文文字渲染在重大排版场景下依然保存不稳固性。
进一步测试人物档案式中文海报时,模子可以准确渲染部分焦点字段信息,但仍不可阻止地泛起中英文错位与局部乱码。
指令:天生动画影戏角色的人物档案式宣传海报,用文字体现以下信息: 尼克?王尔德(Nick Wilde),是一只在迪士尼动画影戏《猖獗动物城》中进场的狐狸。 中文名:尼克狐尼克。 外文名:Nick Wilde。 原型:赤狐。 职业:从骗子到警员。 同伴:兔子警官朱迪。 经典台词:“伤了你的小心脏?”
在产品级渲染测试中,朱迪警官玩偶在影棚光、台灯暖光、自然光客厅与床品光照等多个现实场景下的质感体现相对稳固。短绒毛的细节、眼睛的高光反射、沙宣布料与玩偶绒毛之间的材质比照都能够被较为准确地体现出来,整体更靠近商业产品渲染效果。
相比之下,在主流模子较为善于的游戏界面天生场景中,LongCat-Image的短板更为显着。无论是卡牌游戏、射击游戏,照旧MOBA类第一视角界面,整体气概都偏向十多年前的UI设计审美,与当下主流游戏产品保存显着代差。
指令:天生一个卡牌游戏界面。
指令:天生一个射击游戏界面。
指令:天生一个英雄同盟的游戏界面。
指令:天生一个王者荣耀第一视角的游戏界面。
从本次测试效果来看,LongCat-Image在改图与产品渲染类使命中的可用性更高,而在游戏界面与重大排版场景中的体现相对一样平常。
结语:开源图像模子进入“可控编辑”竞赛,AI生图战况升级
从LongCat-Image的整体定位来看,美团并没有试图用更大的参数规模去正面攻击旗舰级生图模子,而是明确选择在可控性、一连编辑和中文渲染这几个偏向上深挖。
图像模子的竞争焦点,正在快速向“能否真正进入设计、产品、品牌等详细生产流程”的适用能力集中。
《人人草网》,《Q8X2R7L1T4J5M9B6W3》黄色网站视频网址
“长途巴士韩漫”
欧洲无码一级毛片无遮挡
……
12月10日
“uiui网页版入口”鼠鼠被最好的朋友撕准考证
↓↓↓
12月10日,财政部:今年将落实好结构性减税降费政策,青青青国产手机视频在线观看,精品一区二区三区在线观看,男人 插入女人 A片,污污黄色网站
12月10日,我国首部“银发经济”政策文件出台 多个亮点勾勒出幸福晚年生活图景,亚洲图片视频偷拍二区,一区视频在线观看高清视频,一级亚洲免费黄色视频,一级特黄大片欧美久久久久
12月10日,2024年黑龙江省“北疆·石榴情”各族青少年主题交流活动启动,最新中文字幕免费大全视屏,欧美高潮喷水在线观看,www.weishuoba.com,久久99久久99,久久99久久免费观看视频
12月10日|网红城市竞相揽客 流量变“留量”需思量|免费看的一级片|久久黄视频|啊不要进不去好疼|一级片 AAA片
12月10日|宁夏新能源汽车保有量高速增长 已突破5万辆|33thz桃花论坛入口免费在线看|臭小子轻点|一级毛片爱aaa免费视频|五万捷克币原版视频播放
12月10日|安徽7万余人次获全国无偿献血奉献奖|大雷打狙免费观看高清版网站视频|亚洲天天久久婷婷爱综合一区|插逼逼网视频|免费国产黄网站在线观看特黄在线……
12月10日,北交所公司(企业)债券市场正式开市,桃花综合久久久久久久久久网,欧美一级黑人片,国产拍在线视频免费观看,久久无码福利专区
12月10日,东西问·中法建交60周年丨这座“隐匿”于村落的古建,因何吸引中法携手保护研究?,www.色色色插插插插,日本专区第一页首页视频,极乐神教,殴美色色色
12月10日|中国创新创业大赛颠覆性技术创新大赛在大连开赛 展示未来材料领域发展潜能|精品国产影院最新发布网址|91a v|国产自产在线A级毛片|麻豆精品丝袜一区二区
12月10日,全面准确把握进一步全面深化改革的重大举措,你懂的在线激情视频网站,ⅹⅹⅹⅹbbbb,色色爱视频,一级a视频在线观看播放
12月10日,天目一号星座完成阶段组网,热热伊人,18禁止观看的黄在线网站,一级免费黄色网站,可以直接看的av网
12月10日,道路因雪崩阻断 新疆喀纳斯景区暂停开放,欧美黑人粗暴交的一级视频,妈妈帮你打脚枪文章,亚洲国产性爱在线gk,久久久无码精品国产一区
12月10日|乘地铁同站进出10分钟内免费吗|男人扒开女人添高潮的视频|国产熟睡乱子仑视频|精品国产三级大全在线观看|三人行bangbangbang
12月10日|藏医白淑军:破解藏医药传承“密码”|动漫 大胸 老师 美女 黄漫|美国一级黄片免费视频|国精产品亚色精久久网在线|欧美黄片子视频
12月10日|法国南部一座犹太教堂遭纵火 官方启动反恐调查|人人射人人摸人人澡人人干|www.wudu365.com|免费久久黄色A片|女士开禁网站
大理寺少卿游,12345回应男孩入住酒店后确诊川崎病|(巴黎奥运)冯彬女子铁饼摘银,黄博凯撑杆跳第7(巴黎奥运)综合消息:再取双冠 中国21金重回榜首|91精品手机国产在狼线|9·1短视频蘑菇官方版下载|亚洲综合网站|苍井空被叉动态图
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
陕西一高校送毕业生五千余份“甜蜜”礼包
中央企业以产业援疆带动就业工作推进会在北京召开
植物为什么发育出丰富多彩的苞片?研究揭示背后机制
台湾青年盼奥运明星赴台交流 国台办:将鼓励支持两岸各领域青年交流往来
住房城乡建设部:保交房有力推进 全国已交付285万套
兴业银行2024年半年报:持续打造价值银行 营收利润增速回正
海内外电商“龙”元素火爆
烟台市牵头发起《国际零碳岛屿合作倡议》
重庆兴隆场编组站供电扩能改造完成 提升中欧班列运能
中消协呼吁:加快完善预付式消费领域相关立法
欧美日韩视频在线第一区_欧美va天堂在线电影_欧美阿v视频在线大全_欧美牲交a
国产伦精品一区二区三区视频播放
激情亚洲内射一区二区三区
扒开双腿猛烈进入抽搐潮喷免费看
色18黄网站
深夜免费网站
人人人爱性生活草操
人人操人人操97
国产女人乱人伦视频
国产AV大片网址

闽公网安备 35010302000113号