第一批被AI抢饭碗的设计师已经出现了。
随着各个互联网大厂纷纷发布如何将AI工具融入日常工作流中,美工、设计、原画等众多岗位纷纷出现了裁员爆料,毫无疑问这一波AI浪潮的降本增效已经真切开始影响大家的饭碗了。
就在最近,海外一款名为的生成式营销软件, B端用户月活迅速突破百万 ,ARR达到300万美金。
△官网地址:
看来,老营销人也逃不过这一波AI的失业潮了。
据悉,ZMO.AI旗下的AI背景生成生成, 只需商家上传一张产品图,便可以在 100%保留产品细节 的前提下,依据指令生成成千上万不同风格的背景。
其逼真度堪比大片的商用场景图,无论是光影还是清晰度,都完胜超过10年经验的PS大师。
它家的另一个产品 Marketing Copilot ,更是只需上传一张产品图,便可从拍摄、到海报制作、到后期投放优化全部嵌入AI workflow的自动化流程,利用AI强大的创造力和分析能力实现运营秒秒钟优化。
这么开箱即用的产品,让不懂拍摄和PS的小老板也能上手。
△官网地址:
实际上,ZMO.AI在营销生成领域扎根已久。
从2020年底便在服装营销领域推出AI模特功能,和国内知名服装品牌有众多深入的成功合作。
此次Diffusion的大火,ZMO也在2022年9月趁势推出了更广泛受众的AI内容生成产品ImgCreator.AI,并将营销人群作为主要服务对象,强化产品中背景生成、海报生成和数据优化的AI能力,并为B端用户提供Marketing Copliot的增值功能。
此举为ZMO赢得超过百万月活的高价值小B端用户,并且用户付费意愿强烈,传来迅速达到300w美金ARR的喜讯。
生成的产品货不对板?
和其他纯玩目的的AI绘画C端用户不同,B端的用户面对的是非常专业的场景,无论是对质量的要求,还是对可控性、准确性的要求和C端用户相比都极高,这也许也是类似于ZMO这样专业化的AI内容产品能获得成功的原因。
Rowdy 是英国创业公司e-Bike的CEO, 他们是一个不到10人的小团队,旗下产品e-bike主打电动自行车防盗系统。
据Rowdy介绍,对于小公司而言,网站搭建和博客撰写所需要的大量素材非常昂贵,AIGC的出现大大解放了他们的生产力。
不过Rowdy发现大量的AIGC网站往往是艺术美学风格,和他所需要的真实照片风格相去甚远,而ZMO.AI的真实照片风格逼真度非常高,并且分辨率可以达到, 完全看不出来是AI生成的图片了。
这半年来,Rowdy的团队一直在用ZMO的产品为网站设计和公司博客配图,每周能生成200多张照片。
据Rowdy描述:
△图为Rowdy使用ZMO.AI生成素材后的公司网页
Nila是一家跨境电商的负责人,他们的户外沙发在欧美地区增长非常迅速,不过她也遇到了营销的难点。
于是Nila团队聘请了许多美工人员,通过P图的方式来完成素材的制作。
然而头疼的点也随之而来, 虽然Nila团队雇佣了许多外包的修图师,但想要P出非常真实的效果,往往需要10年以上的经验,而修图师的水平参差不齐,使得P图效果以及数据表现都和原图差距很大。
经过圈内好友介绍,Nila开始使用ZMO.AI的文字P图,她发现仅仅输入一段文字,照片就可以毫无P图痕迹的按照指令修改,完全不需要任何高门槛的工具学习或者经验,她这个小白也能成P图大师。
在使用ZMO.AI的产品前,Nila每天会花大量的时间和修图师反馈,前前后后要磨好几天才能上线比较好的效果。“万一内容表现不好,还需要重新P,这里的时间和金钱消耗都不小。”
和Nila不同,Nick是美国一家专业营销代理的营销经理,,负责帮助广告主搭建官方社媒账号和设计广告素材。
Nick的客户既有线上电商客户,也有传统实业甚至餐饮行业的用户。
Nick如是说道。
AIGC的出现确实给这个行业带来了很大的变革,然而Nick发现网上盛传的Midjourney或者很多其他的AIGC产品完全满足不了他的需求,因为生成的图片中产品的细节会变化,无法100%保持原样。
Nick说:
Nick在twitter上发现ZMO.AI这款软件不仅可以完全保持产品的所有细节,还可以逼真的生成光影,无论从分辨率还是真实度上都能完全满足运营人员的需求,这是其他AIGC软件所无法达到的。
不仅如此,让Nick最为惊叹的是ZMO的Marketing Copilot功能完全重新定义的营销人的工作流。
Nick将客户以前数据表现良好的素材上传到了Marketing Copilot训练了自己的专有化生成模型,这样模型的输出就能更符合自己客户的受众喜好和品牌调性。
Marketing Copilot的模型往往会先需要1-2周的内容方向自适应调教,反复进行生成素材——数据反馈——素材优化的流程,之后特有模型根据指令以及品牌调性自动生成符合受众喜爱的营销图片,在这个过程中来自高质量营销数据的反馈功不可没,并且这些数据是私密的,商家完全有控制权。
在Nick看来Marketing Copilot不再是一个简单的内容生成工具,而是改变营销流程的一整套解决方案,通过AI更强的分析能力和生成能力,极大的缩短营销各个环节的消耗和协作生产,并以最终数据为导向24小时不停歇的优化整个营销内容。
Nick表示团队确实AI出现后在考虑缩减一部分营销人员,因为当团队熟悉Marketing Copilot这个新的工作流之后,每一个SKU的出图量从原来的不到10张瞬间暴涨到200张,并且开始借助Marketing Copliot大量进行AB测试和迭代,将原来三四个月的优化周期缩短到了2-3周,销售额更是增长了3倍。
终极的AI workflow到底应该是什么样的,当下下结论为时尚早,但很可能不只是一个空白文本框,后面还连着一个不属于你的API。当下对于创业公司更重要的是做出能解决商家痛点的产品和用户一起不断迭代,而非空谈和迭代demo视频。
特定场景下更需要专门优化的大模型
ZMO.AI的惊人增长,不禁让人联想到了TypeFace和Adobe这两家公司。
和火爆的OpenAI、Stability AI这些做通用大模型的公司不同,TypeFace、ZMO、Adobe都不约而同选择了有应用场景的垂类大模型方向进行产品打造。
市面上有一种普遍的观点,认为未来所有行业都将被极少数通用AI大模型主导。那么这种应用场景的垂类大模型还是否有进一步的意义呢?显然,这几家公司给出了不同的观点。
Typeface虽然是一家2022年6月才成立的初创公司,但它的创始人却是大名鼎鼎的Adobe前CTO—Abhay Parasnis,也在创立之初就获得了来自谷歌风投、微软风投和光速的6500万美元的投资。
除了明星创始团队,Typeface让人印象最深刻的就是针对大型品牌,创建基于企业品牌定位和受众目标而生成的个性化文字及图像内容。
和面向大众的通用内容生成不同,大品牌对于品牌调性以及内容可控性的要求无法通过直接调用Stable Diffusion达到。
Parasnis表示:
目前Typeface通过个性化训练的品牌独有模型以及内容审查算法帮助这些大品牌解决上述痛点。
而设计界鼻祖Adobe也在前段时间发布了自家的AIGC产品Firefly。
面对设计师丢掉饭碗的担忧,Adobe提出“并非替代,而是赋能”的口号,并在更加专业的设计层面给出了可实用落地的AIGC功能。
比如生成矢量的功能,只需要一张草图,就可以生成自定义向量,这对于设计师而言非常的实用。
但普通的AIGC生成器往往是一个整体平面图生成,无法真正生成矢量和图层。
然而Adobe2022年10月就在发布会上提到会将AIGC的能力嵌入PS内,目前尚未落地植入,Firefly上的许多功能点也都还处于开发中,可想而知要将Firefly集成到Adobe复杂的工具生态中还是一项非常浩大的工程。
与Typeface、Adobe相似,ZMO.AI同样也是面向专业用户的垂类大模型,只不过ZMO的用户群体更多的是营销方向的小B。
在ZMO.AI的联合创始人 马里千 看来,虽然基础大模型在许多任务上可以表现出平均人类的水平,但它们在特定垂直领域中表现不佳。
这是因为这些领域的领域知识不是常识,相关数据也不容易公开获取。
例如,ZMO为了完整的保留产品细节会需要用到自研的高精度抠图算法。抠图是一项复杂的视觉任务,它涉及准确估计每个像素的 alpha 值,以从图像和视频中提取前景对象。
这可能会因为复杂的背景、光照条件和物体透明度等因素而具有挑战性。
此外,这项任务的标注是困难、特定和昂贵的,ZMO花费了一年的时间和高昂的成本才获得这些高精度的标注数据。
马里千表示:
从Typeface、Adobe和ZMO的产品中不难看出,大模型终究是需要细分场景的数据和规则的,在特定场景中需要大量专门优化通用大模型来提升生成质量,并且符合这个专业场景的可控输入和输出才能真正的落地使用。
创始人:图像生成质量已到达拐点
为了更深入了解ZMO.AI疯狂增长背后的秘诀,ZMO的创始人张诗莹进行了一次专访,以下是对话内容:
Q1:AIGC这一年以来不仅涌入众多创业公司,还有许多大厂下场,您认为什么是创业公司的机会呢?
在我看来目前AI公司是有生态分层的,大模型层、纯应用层和垂类大模型层。
大模型层就像操作系统,是属于少数人的机会,更适合大厂或者大佬这种有雄厚财力人力的玩家,创业公司更适合后两类。
而纯应用层在底层大模型不断变动的时代壁垒很低,可持续性不强。垂类大模型是我们坚定的方向,这类的公司比如Character.AI、Midjourney、Typeface、ZMO。
垂类大模型公司通过搭建端到端的工程栈,覆盖模型的研发、训练、数据、应用整条价值链,这类公司的产品并不依赖第三方API,迭代非常迅速并且能很好地利用应用侧用户的数据反馈形成数据飞轮。
比如ZMO就将我们应用端大量的高价值用户反馈数据和模型完全打通,通过数据飞轮对垂类大模型的内容生成方向进行重要的引导和优化,并积累自己的专有数据集。
Q2:垂类大模型难道不会很快就被通用大模型取代吗?ZMO的模型有多大?
我并不认为垂类大模型和通用大模型是一个对立的概念,相反我认为垂类大模型是可以站在通用大模型的肩膀上进一步优化专业领域的模型。
对于非常细碎,需求个性化的C端场景,通用大模型会更合适;然而像营销这种非常专业的toB场景,AIGC产品不会是简单的一个对话框和后面的第三方API组成。
因为专业场景对于可控性、准确度以及质量的要求极高,这必然会是一个复杂的系统结构,需要在通用大模型的基础上进行专门的模型优化才能符合营销场景的需求。
我们的模型参数量是SD的3倍——有2.3B ,当然我们还在不断利用用户反馈进行RLHF优化,50台机器同时做优化训练, 保持每月一迭代版本的速度 。
Q4:Midjourney和你们已经盈利了,文生图公司盈利的可能性相对于其他类型的大模型公司是不是更高?
我不是非常了解其他大模型领域,所以不便评论。然而对于CV的AIGC领域,我认为确实生成质量已经到达了拐点,这也解释了为什么付费用户会大量持续增长。
对于我们的用户而言,生成的内容能给他们切切实实的降本增效,甚至能提高收入,他们以前拍摄动则几万美金,而现在几十刀的订阅费就解决了,所以我们的付费用户很快涨到了2万个。
Q5:您认为ZMO的优势是什么?
首先ZMO在生成式营销领域积累了2年半,对于这个领域的know how和用户痛点有深刻的认知。
比如用户对于产品细节不能货不对板的需求,比如拍摄和PS费时费力的痛点等等,所以我们才能搭建起来深刻绑定营销AIGC原生workflow的产品。
其次我们拥有大量营销领域的专业数据,比如我们积累的6000万高清真实照片数据集用于训练超高分辨率的逼真照片,比如我们积累的海量alpha抠图数据集等等。
最后一点是我们搭建并验证跑通的专业营销用户的RLHF反馈系统,这种高质量的专业用户数据反馈是比较高的商业数据壁垒,属于特定行业私有数据,通过这种反馈才能在细粒度参数下不断优化内容生成方向。
Q6:如何应对大厂的竞争?
我认为竞争是在所难免的,不过目前大厂推出的功能在我看来更多是防御性反应,做的应用仍搭载在现有业务上,只针对有技术和愿意付高价的一小部分人做了一些附加功能;而像我们这样的AIGC初创公司从一开始就在新的内容创作范式框架下去创造产品,构建完全不同于传统工作流的AI Native Apps。
大厂是否能做出强大的新一代AI产品还是要看能不能革自己的命吧。
Q7:是如何做到用户洞察的?
我非常喜欢和用户聊天,每天会花2个小时阅读用户的反馈,很多用户的痛点都是在这当中发现的。
我认为早期看数据很难看出来真正的痛点,因为巨大的流量中既有我们目标用户,也有大量纯”玩”的用户,所以找到大量的目标用户观察他们的使用,和他们聊天就成了我日常必备,当然我也经常会去拜访客户的公司,和不同环节的营销人员交朋友。