如果你的朋友圈,正在被“朋友们”的各种写真照刷屏,先别慌,只要9块9,一杯瑞幸咖啡的价格,你就能拥有一整套。
如果你更愿意喝一杯瑞幸,或者实在找不出20张个人自拍照当素材,也别慌,因为这个“在线生成专业质感大片”的小程序,应该火不了太久。
“妙鸭相机”突然火了,很多人通过它,生成各式各样的个人写真——商务风、古装风、日系校园风。因为体验的人太多,导致“服务器被挤爆了”。
【资料图】
这个应用操作起来不复杂。上传20来张个人自拍照,选择一个模版确定风格,然后等待AI生成。具体的出片效果,这里不再赘述,朋友圈搜“妙鸭”,应该会有案例展示。
图片来源于妙鸭相机微博
更值得关注的是,这是一款AI应用。准确说,这是国内第一个、面向C端的、收费的、刷屏的AI应用。
这很了不起。因为从今年初AI大模型火起来之后,几乎所有的大型互联网公司都在做AI,拼了命地往里砸钱。但是,一直没有出现一款普通人能轻易上手、大范围使用的产品——百度的文心一言、阿里的通义千问,这些聊天机器人没有开放给大众;华为的盘古大模型、腾讯的混元大模型,是面向B端的企业,也跟普通人无关。
但是妙鸭正在改变这个现状,而且,它是要收费的。
9块9,看起来不多,但过去出现的几乎所有类似的照片类应用,刚开始都是免费的——脸萌、ZAO等等,都曾火得一塌糊涂,没有谁一上来就收钱。
妙鸭在为用户生成照片的同时,也在狠狠打投资人的脸:“谁说AI大模型不赚钱?”
这让妙鸭成为一个很好的研究样本。虽然昙花一现几乎是必然的,但它依然给AI创业者带来了启示。
AI写真,从“炼丹”开始
在讨论妙鸭之前,我们先把镜头拉到“小某书”,有一堆人在那里展示“炼丹”。
所谓“炼丹”,不是炼那种长生不老药,是训练AI模型。“炼丹”的过程很依赖显卡,电脑全速运作,一次可能需要几十个小时,故有炼丹之名。
炼丹干吗?——用AI生成高质量人像。
AI绘画火起来之后,国外开源的Stable Diffusion模型(以下简称“SD”),以及普通人能上手的Midjourney,开始被更多人使用。这两个软件极其强大,生成的照片效果惊艳。尤其是SD模型,现在是很多文生图应用的底层技术支撑。
一些“爱吃螃蟹”的人抢到了早鸟票,利用SD和Midjourney,先是为自己生成偏卡通风格的头像,然后尝试生成更逼真的真人头像,再到解锁更复杂的场景,生成一些在现实世界里拍不出来的大片。
在妙鸭出现之前,已经有一些人把自己的微信头像换成了AI写真。还有一些人,把这门手艺变成了生意——教别人AI写真,或给人定制生成AI写真。定制写真的价格,从十几元到几十元不等。
一批野生“炼丹师”,开启了轰轰烈烈的调教AI之旅。
“小仙女的工具人”(为了好记,我们暂且就叫他“龚具仁”吧)从5月份开始琢磨、捣鼓一些程序,然后自己做LoRA模型。花了大半个月的时间,利用上百张真人照片,他给自己的老婆做出了LoRA模型。6月初,他用模型生成了第一张AI照片。
这张照片由“小仙女的工具人”用Midjourney+SD LoRA人物模型合成
LoRA模型,你可以将它理解为一个插件,能对SD大模型进行定制化微调。它只需要很少的数据,就能训练出模型的风格和特征。比如上半年很火的美少女AI图,就是有人用日韩美少女的头像,训练出了对应的LoRA模型,其他开发者拿过来很快就能生成美少女风格的照片。
用SD作底层,用LoRA炼丹,这套方法被很多开发者运用。这其中涉及到的技术和代码,基本都是开源。AI写真的门槛,上半年就被降下来了。
龚具仁并非计算机专业出身,也不从事AI相关工作,在做AI写真之前,他仅有的基础,是会一点Python,而且是自学的。而他做这个事的出发点,是为了给老婆拍出好看的照片,之前是用相机,现在用AI。
他对「定焦」说,妙鸭在7月17日一上线,他就关注了。他认为妙鸭的产品实现方式和他做的是一样的。
“应该是SD做的,结合LoRA人物模型,固定几个人物模板,让用户上传20张照片用来练LoRA,再用生成的LoRA套入大模型里做好的模板里换脸。”龚具仁分析。
多位关注AI赛道的投资人也认为,妙鸭的技术原理就是SD+LoRA。
英诺天使基金管理合伙人王晟对「定焦」分析,“我猜测妙鸭是用的SD开源模型,然后增加LoRA这样的风格化的训练数据集,他们给每个人单独训练一个小的LoRA,然后淡化各种背景内容。”
有投资人对「定焦」说,妙鸭是“底层LoRA炼丹+场景提示词”。因为20张照片,就是用来训练LoRA的基础数据量。
妙鸭把人物写真场景做成了模版,比如职场、情绪、江南、春日等,用户点击选择场景,就类似对AI输入提示词,确定照片风格。用户上传20张照片后,系统开始训练个人LoRA,也就是妙鸭所说的数字分身。
综合多位投资人、从业者的观点,妙鸭的AI写真,实现起来难度不大,技术门槛不高。
一杯瑞幸的价格,值吗?
虽然没有技术门槛,但妙鸭使用起来还是有门槛的。
事实上,妙鸭的用户体验并不算好。
首先是要提供20多张自拍照,这就把一大群直男劝退了;其次生成照片要排队,人多的时候要等十几个小时;另外它还收费,9块9;你要下载高清无码的照片,还得再充值买钻;如果你对生成的照片不满意,对不起不退费。
作为一款面向C端的产品,在用户敏感的每一个环节,它几乎都设置了障碍。
妙鸭凭什么刷屏?就因为它是大模型吗?
“他们做对了方向,抓住了用户需求最强的点,产品实际上是有门槛的,这是一个产品和运营的事情。”王晟说。
从产品维度,在个人头像这个方向,历史上我们已经见过太多类似的产品刷屏。十年前主打生成个人卡通形象的脸萌,后来在朋友圈爆火的微信圣诞头像,以及陌陌孵化的换脸应用ZAO,都抓住了用户需求。
对于用户而言,无论是图新鲜、好玩,还是用晒图的方式社交,满足某种心理需求,底层逻辑都大同小异。
而在AI写真这件事上,需求是早已存在的。
去年12月,海外有一款AI写真应用Lensa火了。它的玩法是让用户上传20张左右的个人照片,AI生成不同风格的头像或写真,需要付费。它使用的绘画模型是SD和开源数据集LAION-5B。这是严格意义上最早刷屏的AI写真产品。
只不过,国内的AI写真,之前主要在AI开发者、摄影爱好者的小圈子里流行,普通人都分不清SD、LoRA的概念,更别提上手了。现在,妙鸭通过一款产品,将普通人使用AI写真的门槛降到了零。这是妙鸭能够火的前提。
妙鸭的开发团队背靠阿里大文娱,对这款产品进行了推广。在一些种草平台,能看到博主的推广博文。“大厂的执行力还是很强的。”龚具仁评价。
价格是一个有争议的点。
类似的产品在过去十年里的通用玩法是:先用免费吸引用户,短期不考虑盈利。只要用户规模起来了,不愁赚钱。换言之,刷屏比收费更重要。
妙鸭一上来就收费,后期还有增项,会将一大批尝鲜用户拒之门外。
有人可能会说,跟天真蓝、海马体这种收费数百元的线下摄影棚相比,9块9太便宜了。对,的确是更便宜,但不是所有人都是冲着拍证件照去的,“我就是来图个热闹的,还要收钱?”
妙鸭收钱,背后原因不难理解。AI大模型烧钱是公认的事实,算力跟不上则是当下几乎所有AI公司的痛。
龚具仁对「定焦」说,SD都是开源的技术,技术壁垒并不高, 可以做的是在算法和模型上进行一些自己的优化。此外,所谓的数字分身,即是生成用户人物LoRA, 这个模型训练需要时间,如果大量的用户同时涌入,算力必然吃紧,所以就会造成大量的用户排队等待。而且一旦开始训练模型,就会消耗算力, 这个都是实在的成本,妙鸭应该是测算过成本的,所以一旦使用就必须收费。
另外,妙鸭生成的图片一般是像素不高的, 如果需要高清大图, 还需要进一步消耗算力做图形放大,所以导出高清图片还需要钱。
不过,这让妙鸭从一开始就具备了变现能力,成为中国大模型里第一个C端变现的应用。
抛开这个没有太大实际意义的名号,现在摆在妙鸭面前的问题是:如何在技术壁垒不高、产品体验一般、收费限制传播的情况下,能一直火下去?
妙鸭真的火过吗?
在探讨妙鸭的前景之前,我们先回答一个问题:妙鸭真的火了吗?
作为对比,脸萌可以称之为火过,它曾在一周时间内,APP下载量达2000多万。ZAO也刷过屏,它在上线的第二天,冲到了App Store娱乐类免费榜第二名,在被下架前一直稳居榜首。Lensa霸榜了美国、加拿大、英国等多国的App Store下载榜单,最高单日下载量超过1500万。
妙鸭的成绩如何?
妙鸭没有APP,现在是小程序。国内有个专门统计小程序热度的平台叫阿拉丁指数,我们在阿拉丁的各大榜单中,没有看到妙鸭相机。
微信指数显示,妙鸭相机在7月17日上线后的四天内,指数一直很低,第五天开始上升,在7月25日达到峰值,但从7月26日开始,指数便扭头向下大幅下滑。它的热度,也就维持了大概一周时间。
百度指数显示,妙鸭相机的热度从7月23日开始上升,24日达到峰值,随后就开始缓慢下滑,最高峰也就不到8000。从城市分布来看,关注的人群主要集中在北京、上海、广州等一线城市。
我们可以初步得出一个结论:妙鸭不算出圈。
“刷屏也就是在媒体和相关行业,以及投融资这块。”盛景嘉成董事总经理刘迪对「定焦」说。
在9块9的门槛之上,第一把没冲上去,妙鸭后期想再刷屏,很难了。
龚具仁认为,现有的AI模型, 在画人物全身照的时候,由于分配给脸部和手脚的像素不够, 所以很难一次生成准确的全身照片,基本上都需要after detailer等面部修复插件来修复脸部或者人工修复手指。所以妙鸭的照片多为大头照、半身照,以突出人物,虚化背景为主, “这也容易形成定式,容易审美疲劳,大家看腻了就没意思了。”
妙鸭的“前辈”Lensa,已经给出了答案。
根据数据分析公司Sensor Tower的统计,Lensa从去年11月中旬开始下载量上升,12月中旬到达顶峰,今年1月中旬回落到低水平,整个生命周期的热度也就两个月时间。其他头部AI+图像应用也是几乎完全相同的轨迹。
数据来源 / Sensor Tower
相比之下,妙鸭的热度不及Lensa。
相比功能层面的讨论,这几天外界对妙鸭讨论最多的,反而是两个对公司不太有利的点——数据隐私和退费问题。
在妙鸭最初的用户服务协议中,有一条“霸王条款”。翻译过来就是,用户提交给妙鸭的个人自拍照,妙鸭团队可以无限制使用,使用的范围甚至包括元宇宙等虚拟空间。
20张个人自拍照,完全可以搭建出人脸肖像模型了。有了这个模型,平台可以生成用户在任意场景的自拍照片。
即便平台不作恶,也难以避免别有用心之人利用。“妙鸭怎么保证20张照片里面没有私货?现在已经有人在20张里面掺明星照片,为了让自己后面的照片好看了。”刘迪说。
这让一些用户表示担忧,并要求注销账号。现在,妙鸭已经删除了这一条款。
另外就是退费问题。按照妙鸭的规则,用户付费生成照片后,视作服务完成,即便用户不满意,也不会退费。
这个规则不过分,毕竟你去实体店拍照,很少有承诺不满意退费的。差别在于,妙鸭的服务是模板化的,有时候AI生成的照片就是达不到理想的效果,但没法像跟人一样协商微调,有点一锤子买卖的意思。
龚具仁对「定焦」分析,LoRA模型有个问题,20张照片不足以练出和本人一样的照片,会有些人像有些人不像。
针对退费问题,妙鸭还专门出了一个回应。这说明有退费诉求的用户不少。
这些争议,在为妙鸭增加热度的同时,也在限制它出圈。
妙鸭给AI创业的启示
无论如何,妙鸭还是在一些人的朋友圈里火过了。在“百模大战”如火如荼的今天,有一款产品刷屏,是对AI创业者的一种鼓舞。
当年在移动互联网创业大潮中,刷屏打头阵的,就是相机类应用,现在进入AI创业潮,第一个出头的也是相机类产品。这种路径的相似性,让一些创业者感到兴奋。
然而,投资人却保持谨慎乐观。
刘迪认为,“妙鸭跟之前的小程序换头像一样,大家就是图个新鲜,技术上没什么门槛,意味着很快会被做烂。”他认为妙鸭真正的需求就是证件照或头像照,这块的市场空间不大。“AI写真照的本质还是社交诉求,玩的心态过去之后,剩下的才是真需求。”
如果是纯玩的话,就像羊了个羊,如果门槛足够低,娱乐性够强,也是有商业前景的。矛盾点在于,因为算力限制,AI应用不支持大规模同时在线。玩的人越多,算力消耗越大,成本会非常惊人。
所以,AI创业不能照搬APP创业的思路。
从产品形态来看,究竟是做一个工具,还是要做内容创作平台,对应着截然不同的商业前景。
王晟对「定焦」分析:“我初步感觉妙鸭更像工具,如果这样,那它在本质上又和脸萌、ZAO没有区别。这种工具的生命周期都是比较短暂的,可替代性很强,除非它能够逐渐生态化,变成一个以AI生成的内容为基础的创作平台。”
快手是一个典型的例子。它最早的产品定位是动图工具,后来变成了一个社区和内容创作平台,这才打开想象空间。
做工具的话,最直接的弊端是竞争壁垒低。前文我们分析过妙鸭的技术原理,基本上其他大厂也都能做。妙鸭刷屏后,美图旗下的美颜相机,把AI写真的价格下调到了3.9元。B612咔叽的AI写真套餐也只要5.8元。
还有一些开发者,迅速推出了功能相似的产品。一个妙鸭跑出来,“妙狗”“妙鸡”全出来了。
如果想做平台,又面临着流量从哪里来的问题。
王晟认为,在C端市场,现在无论是打造一款用户规模很大的应用,还是一个新的生态平台,都非常困难。“系统性流量红利没有了,已经被大的APP握在手里,靠单一功能点取胜,那是远远不够的。”
一位创业者对「定焦」直言,“妙鸭大概率热度不会太久,是工具属性就没办法长久。”
数据安全和隐私问题,则是所有AI项目无法绕开的屏障。刘迪认为,妙鸭这种刷屏的AI应用,被监管层以个人隐私为由盯上几乎是必然的事情。
在妙鸭上线之前,就有创业者明确表示,自己做服装AI、宠物AI,不做人像AI产品,因为用户隐私肖像权不可控。
综合来看,妙鸭火了,但又没火。这是AI2.0时代,中国创业者想要做出爆款产品的一次大胆尝试。
所有的创新和探索都是值得鼓励的。至于妙鸭,即便飞不起来,至少曾经飞过。
*应受访者要求,龚具仁为化名。
关键词: