Google发布Nano Banana 2生图模型,相比上一代,文字准确度大幅提高,2K成本下降50%,4K出图降40%。
|
Nano Banana 2 正式发布,作为目前最强的生图模型,相较于上一代又有多少提升? 网上对它的评价也是褒贬不一,有说提升巨大的,也有说不如 Nano Banana Pro的。于是我设计了五个测试维度,从中文、英文、混排到写实、艺术风格,一张一张跑图,看看具体的效果如何。 一、中文文字生成 汉字一直是各大生图模型最头疼的问题,即便是上一代的Nano Banana Pro也会存在汉字乱码的问题,看看 Nano Banana 2 能不能把汉字写对、写好看。 图 1 · 新年快乐海报 提示词:一张简洁的中文海报,白色背景,正中央写着"新年快乐"四个大字,红色毛笔字风格,字体饱满有力。 ![]() 效果相当惊艳。新年快乐四个字笔画完全正确,毛笔质感也还原得很到位——墨迹的飞白、收笔的力度都有,不像很多模型生出来的伪书法,字形歪扭、笔画粘连。下方"岁岁平安·阖家幸福"和落款印章"恭贺新禧"同样清晰无误,整体构图干净,红白对比有节日感,直接拿去发朋友圈都不违和。 图 2 · 咖啡馆菜单 提示词:一张咖啡店菜单,上面清晰写着"拿铁 ¥32 / 美式 ¥28 / 卡布奇诺 ¥35 ![]() 这张更考验模型,同时要生成中文、英文、数字和符号,还要融合进一个真实感极强的咖啡店场景里。最终的图片上所有文字全部正确,无一错字,黑板手写粉笔风格自然流畅。背景里的人物、设备、光线高度写实,很难分清这是实拍还是 AI。 二、英文文字生成 第二个环节就是英文测试,用多行英文菜单测试字母准确率、手写字体还原度,以及文字融入真实场景的能力。 图 1 · 纽约小馆黑板菜单 提示词:A chalkboard menu at a New York diner with handwritten text: "TODAY'S SPECIALS" "Classic Burger with Fries - $14.99" "Grilled Salmon with Vegetables - $22.50" "Caesar Salad with Chicken - $12.00" "New York Cheesecake - $7.50" "Fresh Orange Juice - $5.00" Realistic diner atmosphere, warm lighting ![]() 五条菜品信息,一字不差。标题、菜名、价格(含小数点和 $ 符号)全部准确无误。粉笔手写风格相当自然,字母粗细变化、轻微的不规整感都拿捏得恰到好处,完全不像硬生的字体,反而像真人随手写的。每行菜品旁边还配了对应的小插图——汉堡、鱼、沙拉碗、蛋糕、橙汁杯,粉笔画风,辨识度高,和整体风格高度统一。背景红砖墙、暖光吊灯、坐满顾客的吧台,照片感极强。 三、中英字体混排 如果中英文同时出现,它的效果又如何呢? 图 1 · 双语晚宴节目单封面 提示词:A bilingual event program booklet cover with the following text: English title: "SPRING NIGHT GALA 2026" Chinese title: "2026 春日夜宴" Event details in both languages: "Date 日期: February 28, 2026 · 2026年2月28日" "Venue 地点: Grand Ballroom · 大宴会厅" "Dress Code 着装: Formal Attire · 正式礼服" Program highlights: "Opening Performance 开场表演" "Keynote Speech 主题演讲" "Cultural Showcase 文化展示" "Gala Dinner 晚宴" "Lucky Draw 幸运抽奖" Footer: "Welcome · 欢迎莅临" Elegant design, gold and deep navy color scheme, luxury event style ![]() 这张是三个文字测试里信息密度最高的。标题、副标题、活动详情、节目列表、页脚,共计超过 20 处文字区块,中英文交替出现,还夹杂着日期、间隔点(·)、项目符号(•)。逐行核对下来:文字全部正确,没有一处错漏。 排版上更令人惊喜。英文标题用了华丽的衬线哥特体,中文副标题切换成现代粗体,两者字号拉开层级却不违和;正文中英同行排列,间距匀称,完全没有常见的"中文偏大"或"英文挤压"问题。藏蓝底色配烫金文字,配上精致的花纹边框,质感像真实印刷的请帖。 四、写实图像生成 Google官方表示,Nano Banana 2 生图的真实性有着一定提升,我们就来看看能否做到以假乱真。 图 1 · 咖啡馆看书的女生 提示词:一位年轻女性在咖啡馆窗边看书,自然光,电影感,写实摄影风格。 ![]() 这张几乎可以以假乱真。窗边柔和的自然光打在人物脸上,背景里的顾客、吧台、书架全部虚化但轮廓清晰,景深控制非常精准。人物皮肤质感、衣服的针织纹理、木椅的年代感都处理得相当细腻。值得一提的是她手里的书封面清晰写着"林中书"三个汉字——写实场景里顺带过了一次中文文字测试,同样准确无误。 图 2 · 香蕉特写 提示词:A close-up photo of a ripe banana on a wooden table, natural lighting, shallow depth of field, high resolution ![]() 这张图堪称是一张教科书级别的产品摄影风格图。香蕉表皮的斑点、蜡质感光泽、尾部的枯茎都还原得极其真实,侧面窗光带来的柔和阴影让整体质感更上一层楼。如果不说是 AI 生成,完全当得了食品品牌的素材图。 五:艺术风格生成 最后一个环节,我们来考验它的风格迁移能力、色彩表现和创意构图。 图 1 · 赛博朋克城市夜景 提示词:赛博朋克风格的城市夜景,霓虹灯倒影,雨后街道,高细节插画风。 ![]() 信息密度极高的一张图,画面塞满了霓虹招牌,英文和中文交替出现,雨后地面反光、空中飞行器、人群、摩托、高架轻轨……每一个元素都有交代,却没有杂乱感。冷蓝主色调配合高饱和霓虹形成强烈对比,虽然部分招牌的文字出现乱码,但可用性依旧很高。 图 2 · 梵高星夜风格香蕉 提示词:A banana in the style of Van Gogh's Starry Night, swirling colors, expressive brushstrokes, vibrant yellow and blue ![]() 旋涡星云、柏树剪影、远处的山丘全部到位,香蕉本身被处理成了厚涂油画质感,笔触方向和《星夜》原作高度一致。香蕉的黄色和星夜的蓝色形成自然的互补对比,没有违和感,像是梵高真的画了一根香蕉。 总结 和上一代相比,它对于真实世界的理解能力和汉字的处理能力提升相当明显。写实和艺术风格方面同样表现稳健,没有明显短板。如果你的使用场景涉及带文字的图——海报、菜单、封面、活动物料——Nano Banana 2 就是目前最好的选择,没有之一。 当然,它的成本相较于上一代也有着大幅下降,2K 图片仅需 5 毛钱,只要过去的一半,4K 出图费用也降低了 40%。对于商业工作流来说,Nano Banana 2 真的是降本增效的最佳诠释,Google 大善人再次实锤了。 |
IT百科
热门搜索
网友评论
甄选好物








