高能预警,谷歌神器一句话P图全网震动!PS直接淘汰,模特广告业不存在了?

转自:新智元

编辑:Aeneas KingHZ 

【导读】谷歌的Gemini 2.0 Flash凭一句话PS的功能,还在全网不断掀起新的风暴!广告业直接被颠覆,模特从此彻底不存在了。去水印、梗图、交叉图像,已经被网友玩疯。甚至有人预言:谷歌已全面超越OpenAI,将率先实现AGI。

最近,谷歌的种种AI产品是全方位领先,大有全面超越OpenAI的架势。

如今已经有人预测:谷歌DeepMind将比OpenAI率先实现AGI!

原因很明显,如今谷歌DeepMind在多个领域布局下的产品,已经表现出全面获胜之势,而且,它们并没有炒作。

最佳通用模型:Gemini 2.0 Flash最佳多模态:Gemini 2.0 Flash / Gemini 2.0 Pro Experimental最佳原生图像生成:Gemini 2.0 Flash最佳文本/图像到视频:Veo-2最佳图像生成:Imagen-3最大的上下文窗口:2M(Gemini 2.0 Pro Experimental)

此外,谷歌的原生音频生成功能也将很快上线。

对比之下,OpenAI近期最令人印象深刻的行动,大概就是发出15页提案,呼吁美国政府全面封禁DeepSeek、锁死中国AI了,这么一对比,简直高下立判。

总之,谷歌DeepMind不炒作,不对其他竞品评头论足,只是默默做事,给大众留下了非常清新的印象。

如今,它已经愈发势不可挡,而在机器人开发领域,如果仅是将额外开发的技术推向市场,或许就会引发巨大的冲击波。

左右滑动查看

学会超强推理的模型,更懂怎么生图了

四天前,谷歌宣布,自己的首个向公众发布的全模态图像生成器上线,Gemini 2.0 Flash可以进行原生图像生成了。

「一句话就能PS」的功能,当即震惊了全部网友。

Gemini生成的开怀大笑的蒙娜丽莎

几天过去了,Gemini 2.0 Flash引发的余震,还在不断回响。

一句话去水印、交叉图像生成等功能,被网友们玩疯了。大家公认:它已经可以轻松取代Photoshop。

全模态图像生成器,跟其他AI生图模型最大的区别在哪里?

因为它自身具备的超强推理能力,能结合现实世界的知识生成更符合上下文的图像,理解更多细节,更遵循文化背景特征。

其中,全程都是由Gemini模型完成,无需调用其他模型,只需通过自然语言提示。

此外,传统的AI生图器需要分开处理文本和图片,它则是能同时输出文本和插图,保持惊人的一致性。

真正的多模态能力:同时理解文字、图像,以及二者联系理解世界知识:能做智能推理,结合现实世界知识生成准确内容自然语言交互:仅用对话修改图片,真正实现一句话PS

 

如此强大、令人震撼的修图功能,不禁让网友Oleks推测:以买图为主业的公司,股价将暴跌、一泻千里!

一句话PS,收费PhotoShop被创飞

如今看来,PS是已经被彻底颠覆了。

从11岁起从事视觉特效的Bilawal Sidhu表示,谷歌的Gemini新功能「一句话PS」将消除PS高手和小白之间的技术壁垒。

他展示了5个例子,用Gemini搞特效就是这么简单。

1. 将自己化身为Roblox和Minecraft角色

2. Gemini深刻的场景理解能力

演讲图片变三维线框模型

2D变3D线框模型渲染效果

3. 给不同人物添加墨镜,表现良好

4. 3D线框+语义激光雷达点云测试

3D测试

雷达点云测试

5. 补画与扩画(in-painting and out-painting)

补画:添加红色激光眼

扩画:扩大画面场景

把梗图改成自己想要的样子,从此以后so easy。

想脑洞大开制作其他「梗图」,也是轻而易举。

这张黑夜的照片,Gemini 2.0 Flash能让它秒变白天的图。

上下滑动查看

可以看出,在把夜景转化为白天的实景时,景观基本上准确的,没有幻觉,如果要挑毛病,就是根据夜景图像产生的图产生了对光照条件的幻觉。

简直让人疯狂。

有人不信邪,亲自上手尝试了一遍后,不得不承认:谷歌这次真的厉害了。

最令人惊喜的是,它几乎没什么限制,可以毫无阻碍地生成名人肖像和受版权保护的角色图像。

比如说,CMU机器学习博士James Campbell就尝试把马斯克P到了自己的办公桌上。

这活灵活现的神态,人物和背景自然地融为一体,就问谁能看出来是P的?

网友们也纷纷展开实测。感受就是:这个功能太伟大了!

从此,一句话p图真的到了next level。

上班要迟到了,需要火速编个理由,怎么办?打开Gemini 2.0 Flash,一键搞定。

上下滑动查看

一句话,美女手中的手机就变成了我们指定的那款。

Gemini 2.0 Flash和pika的结合,也发挥出了奇效。

给模特一键换装,简直做到了极致。

从此,我们不必再去消息工作室拍写真或者证件照了,直接上传一张高清生活照就可以!

上下滑动查看

同理,一张正面肖像照,也可以切换至侧视图,或者缩小的视角。

各种角度的图片都能生成。

结合Kling后,直接就生成了广告大片,有望颠覆模特和广告行业。

角色一致性的保持程度,也令人吃惊。

另外,这个功能还可以用来给我们设计房屋。

比如让家具消失,然后将房屋装修风格改成现代时尚美学。要知道,在美国找室内设计师干这个活,可能会需要五千到一万刀的费用。

甚至,它还能帮我们复原老照片。

去水印,网友们玩疯了!

而在去水印方面,Gemini 2.0 Flash也是一绝!

这个意外解锁的新技能,可是把网友们激动坏了。

这个功能不要钱,免费无限用,也不会因为删除水印,产生的明显的空白区域。

左:有多个水印的图片;右:Gemini去水印后的效果

在谷歌AI Studio上,可以使用「动动嘴,就能PS照片」的功能。

网友对去水印功能情有独钟。很多人实测之后,大为惊喜。

不过,这也引发了不少争议,比如摄影师、设计师的作品被盗用,就会导致版权上的违法行为更加泛滥。

交叉图像功能,一句话「讲故事」

谷歌DeepMind研究及深度学习负责人,Gemini项目共同负责人Oriol Vinyals,被Gemini的新功能惊呆了!

在它看来,它的交叉图像生成功能简直是颠覆性的。

怎样向2岁女儿的班级解释AlphaFold的工作原理?

只要输入提示:「Write an illustrated story about AlphaFold for toddlers」,图文并茂,符合幼儿园风格的科普书,瞬间产生,Oriol Vinyals直呼这就是魔法!

左右滑动查看

AI可以让AlphaFold这样复杂的主题,对幼儿来说都变得更易理解。

Oriol Vinyals赞叹道:Gemini 2.0 Flash交错图像生成是一项革命性技术!

这个简短的demo向世人展示了AI+教育的无限想象空间,以后启蒙教育或许变得更加有趣!

而且,Gemini 2.0 Flash现在可以让我们输入任何人或物的图片,在此基础上创作出全新的形象,同时还能较好地保持原始人物/角色的特征。

游戏、漫画、动漫圈都炸了

Gemini 2.0 Flash这个新功能,甚至可以用来迭代图像,创建任何游戏!

同时,Gemini 2.0 Flash也直接攻陷了漫画圈。

现在用它来生成漫画,只需要动动嘴的功夫。

有网友尝试后,发现自己根本停不下来。只需一个简单的提示,就能进行选择性修改,而不会破坏整个图像。

他激动地表示,「用它来制作漫画和故事分镜会变得非常轻松」。

给漫画加个色,也是一句话的事儿。

就连漫画角色的动作——抬起手臂,也能用嘴完成。而且,输出图像与原图保持了高度的一致性。

动漫圈的二次元们更是激动不已,有人惊呼,这是史上最佳动漫模型!

动漫创作的全流程,它都能依指示完成,比如把素描转换为线稿;填充基础色;添加一些柔和的阴影,光源位于左上角;添加一个室内背景,使其与当前的光源和阴影环境相匹配,使用合适的角度;调整为单色灰度,以符合轻小说插画风格等等

更多的测试demo,自己体会。

谷歌最新生成模型Gemini API

而且刚刚,又有好消息传来。

今天,开发者可以在Gemini 2.0 Flash Thinking Experimental的API中,使用图片生成功能了!

用户免费使用限制为1500次/天,最多10次/分钟请求。付费价格也很便宜,每百万tokens要0.40美元。

Gemini API的开发者Logan Kilpatrick,宣布Gemini  API文档已更新,使用代码也可以生成图像了。

开发者们可以用 API 来生成图片做各种有意思的应用。

不懂编程,也没关系,还可以把示例代码作为参考发给Cursor之类AI编程工具,帮助写生成图片代码。

比如,在文档中,利用Pyton代码,生成的「一只戴着高顶帽、长着翅膀的猪」在一座充满绿色植被的未来科幻城市上空飞翔。

在API文档中,谷歌也指出了利用Gemini修图时的一些限制,如下图。

Gemini API文档:使用编辑图片功能,建议使用简体中文等获得最佳效果。

参考资料:

https://x.com/bilawalsidhu/status/1901078553736999340

https://x.com/OriolVinyalsML/status/1901328862656503826

https://x.com/gingfreecss325/status/1900798964305457448

https://x.com/deedydas/status/1901042632958345369

(0)
wd123_cnwd123_cn
上一篇 2025年3月19日 上午9:59
下一篇 2025年3月19日 上午10:02

相关文章

  • 六岁男孩弗雷迪·奥斯本在克鲁夫茨犬展上荣获最佳老将奖

    在克鲁夫茨犬展上,六岁的弗雷迪·奥斯本以其平滑狐狸梗犬Penny赢得了最佳老将奖,这一成就超出了他和家人的预期。虽然克鲁夫茨官方无法确认弗雷迪是否是该犬展历史上最年轻的获奖者,但他被认为是最年轻的之一。弗雷迪的学校甚至特别批准他请假一天以参加此次犬展。 弗雷迪的犬展经历 弗雷迪在接受BBC新闻采访时表示,他“非常享受克鲁夫茨犬展”,并称赞Penny是“有史以…

    2025年3月12日
  • 专家揭示:脱发原因与有效生发维生素选择指南

    脱发或头发稀疏是生活中常见的问题,可能由多种原因引起,包括遗传、压力、疾病、荷尔蒙失衡、营养缺乏以及某些药物的副作用。根据美国毛发协会的数据,美国有3500万男性和2100万女性受到脱发困扰。 脱发的主要原因 皮肤科医生Michelle Henry博士指出,遗传性脱发(也称为雄性激素性脱发)是最常见的原因。此外,压力、疾病、荷尔蒙失衡、营养缺乏和某些药物也可…

    2025年3月7日
  • 儿童品牌面粉中发现疑似老鼠异物 ,秋田满满称排除生产线带入可能,宜春市监:正调查

    来源 | 潇湘晨报 记者 | 黄康睿 近日,有天津网友在网络平台反映,其购买的秋田满满品牌面粉中发现疑似老鼠的异物。3月20日,潇湘晨报记者从江西省宜春市场监管局宜阳分局处了解到,市场监管部门正在调查此事。 据这名网友发布的视频显示,3月15日,她在秋田满满品牌面粉包装中发现不明异物,随后就去拿手机拍照取证,该异物疑似老鼠,并且散发异味,视频发布者…

    2025年3月21日
  • 告别传统花盆:日式苔玉(Kokedama)成园艺新宠,DIY乐趣与潮流设计完美结合

    你还在用传统花盆养花吗?今年春天,不妨尝试一种新颖又充满禅意的园艺方式——苔玉(Kokedama)。它不仅能让你的植物以一种更有机、更自然的方式呈现,还能为你的家居空间增添一抹独特的日式风情。 什么是苔玉? 苔玉,字面意思是“苔藓球”,是一种日式盆景艺术。它摒弃了传统花盆的束缚,将植物根部包裹在泥土和苔藓中,用细绳固定,形成一个浑圆可爱的绿色球体。你可以将它…

    2025年3月25日
  • 马修·麦康纳93岁母亲登上杂志封面,分享长寿秘诀:拒绝压力,享受生活

    马修·麦康纳的母亲登上《奥斯汀生活》杂志封面 好莱坞影星马修·麦康纳(Matthew McConaughey)的93岁母亲凯(Kay McConaughey),近日成为了《奥斯汀生活》(Austin Lifestyle)杂志的封面人物。作为一位93岁高龄的长者,凯在杂志的访谈中分享了她保持心态平和、无压力的秘诀。 “MaMac”凯:不包揽一切,享受生活 在家…

    2025年3月29日
  • 纽约官方就误杀宠物松鼠道歉,主人悲愤:尸体何在?

    纽约州环境管理局(DEC)近日就去年秋天“误杀”宠物松鼠P’Nut一事公开道歉,承认处理方式“过于严厉且冷酷无情”。然而,这份迟到了数月的道歉并未平息P’Nut主人的怒火,他仍在苦苦追寻爱宠的遗骸。 事件回顾:一场生命的悲剧 去年10月30日,DEC接到匿名举报,称纽约州希芒县一处住所可能存在感染狂犬病的动物。随后,执法人员进入马克·朗戈(Mark Long…

    2025年3月29日