作者 | 邓咏仪
编辑 | 苏建勋
2022年,整个科技行业经历了疲惫。但下半年,AI华丽的回归——
登台的新宠儿名叫AIGC又称生成式AI”(Generative AI)。这一领域正以引人注目的速度发展,将创新和技术拉回世界舞台的焦点。
今年4月,一家人名叫Open AI公司公布其旗下DALL-E 2模型,用文字生成的图像质量高,令人震惊——以前,AI画画只是一小群人的游戏,AI画出来的画和小学生一样简单稚嫩。
但很快,大家都发现了AIGC快速进步。仅仅四个月后,一名游戏设计师就依靠它AI模型Midjourney一幅画获得了著名艺术奖,引起了争议。
获奖作品《太空歌剧院》
过去的10月,AIGC另一家代表公司Stability.AI,仅仅两年后,就宣布完成种子轮融资1.01亿美元,估值10亿美元,进入独角兽行列。
AI领域沉默太久了。AI要追溯到2016年,吸引巨大的公众关注——AlphaGo最终在围棋比赛中击败了韩国国手李世石。在过去的几年里,AI有点像科技圈的网络名人,技术上很少有大众惊喜。在中国,AI公司的更多消息是上市受挫,利润遥遥无期。
如今,AIGC接棒AlphaGo,带着全新的故事回来。
最新的进展是,AIGC商业化的迹象很强。一家名为Jasper的公司,用AI帮助企业和个人客户撰写社交媒体、博客等内容。Jasper近日,该公司成立仅18个月,就宣布今年收入预计近亿美元。
浪潮已经来了。AIGC它已经在爆发前夕,一个技术和商业化的十字路口。巨大的关注背后,是整个产业链的蓄势待发,摩拳擦掌。
以AI文字、图像、音频等内容的生成是长期存在的深度学习方向。2017年,一副由AI学了很多画,最后模仿生成的作品,在佳士得拍卖了40多万美元。
但从今年开始,各种各样的东西AI绘画应用就像雨后春笋。无论是大厂还是小厂,都像约定一样发布AI绘画产品:2月,Disco Diffusion推出AI图像生成平台;7月,微软旗下Open AI推出新模型WALL-E八月,Stability AI推出Stable Diffusion,并开放注册……
与2017年相比,现在AI画画到了“Text-to-Image(文本生成图像)的新阶段。也就是说,用户以描述图片中的内容、风格、材料、位置等,并提供一个词组(如深空间、达利绘画风格愿景),机器可以分析,最后输出一幅画。
在过去,人们普遍感受到AI技术改革在很大程度上是一些决策性行为,如识别人脸(是否符合我)、下棋(如何获得最佳解决方案)等。
而输入文本-AI画画最大的区别在于底层AI通过学习文字、图片、数据等信息,模型的学习模式是发散的——简而言之,AI要开始模仿和创造新事物。这大大降低了人们的创作门槛。
AI绘画发展如此之快的第一个原因是,在过去的几年里,全球科技产业花费了大量的资金和人力,并进行了实践AI为大模型奠定基础。
AI顾名思义,大模型就是样本量巨大的模型。2017年,Transformer结构的提出使深度学习模型参数超过1亿。随着深度学习技术的发展,模型中的数据量逐渐达到10亿到100亿。
以前用于训练AI画画的名字对抗生成网络模型GAN,是一个百亿级的大模型。但以前,GAN学习绘画模式只能无限接近原作,而不是创新。
来源:Stability.AI
真正让AI绘画有几个突破AI公司接力,包括Open AI和Stability.AI公司,包括深度学习模式CAN、Diffusion等,和GAN模型的创新结合相当于让AI另一种学习绘画的方式。AI绘画真的摆脱了模仿,走上了创造的道路。
而此前的AI绘画需要大量的计算能力,通常是半天的生成时间。Stability.AI在新模型上改进机器运行模式,大大压缩了所需的内存和空间——从一天到秒,硬件要求也降低到很低,C端用户可以无障碍创建。
AI星星之火生成内容开始燎原,现在新战场已经从图像走向视频领域。9月,Meta、 Google都公布了自己的AI视频技术进步的生成。Meta的Make-A-Video技术可以使平面上的物体短时间移动。
来源:Meta
9月,红杉资本发表了一篇题为《生成式》的文章AI:一个性的新世界(Generative AI: A Creative New World)文章。红杉在文章中表示,生成式AI,让机器开始大规模参与知识和创造性工作,这涉及数十亿人的工作,预计未来将产生数万美元的经济价值。
AIGC它的商业前景看起来很吸引人,这是必然的。与之相比。VR/AR、新能源汽车等领域仍处于市场教育的早期阶段,需要投入大量的教育成本。AIGC计算能力稍强的计算机将来甚至可以在云上运行,其内容生成的边际成本无限接近0。
在写作、设计、影视、广告等领域,已经出现了巨大的商业空间,AI可以作为人类的副手,可以快速提供最基本的创造性指导。
但AIGC无限扩展和输出的特点也伴随着人们的担忧:商业壁垒在哪里?
市场上有很多关于调包侠的讨论。现在市场上所有的人AI绘画产品基本上是基于几种开源模型开发的。当内核保持不变,只是简单地搭建外壳时,调用类似的模型。如果它们都给了AI喂类似的数据,这些产品输出的结果会逐渐趋同吗?
大型制造商多年来一直投资于计算能力和数据培训,底层基础设施注定是大公司的游戏。然而,由于大型工厂的严重滚动,成本迅速下降。根据一家美国风险投资机构NfX统计,在过去的两个月里,AI生成图像的成本下降了100倍。
显然,底层技术和模型不能成为障碍。应用层的竞争已经开始——希望让它成为障碍AIGC打开新的商业形势,真正实现规模化,市场需要杀手级应用。
NfX创始人James Currier以博客为例——Facebook当它成立时,市场上有50种具有相同功能的产品。Facebook最巧妙的选择是从哈佛大学的学生群体中推广,最终吸引各大学的学生跟随。
淘到第一桶金AIGC公司也很相似,大部分都抓住了很好的垂直场景。比如Copy.AI,从公司成立之初就看广告营销场景,让AI帮助客户在营销场景中优化文案等内容。Copy.AI商业化进展迅速-两年内ARR(年常性收入)已达1000万美元。
远在大洋彼岸AIGC热潮也点燃了国内市场的热情。
7月,百度在百度世界大会上用1秒恢复了《富春山居图》的残卷——背后是千亿级AI大模型文心。
除了百度,创业公司也有彩云梦,Tiamat、蜜度、6pen、MuseArt其他公司,包括投资多年的公司,涵盖文字、图像等方向。今年,他们也成了VC圈内的新香饼。
但国内技术发展和商业化正处于更早的阶段。国内市场层出不穷AI在抖音、闲鱼等平台上开展代画服务,提供短语调试策略等小型绘画业务,许多人声称AI画画,月收入过万。但这些生意相对边缘。
短期内,AIGC为了有足够的资源支持底层技术的快速迭代,我们仍然需要依靠企业端。特别是在中国,中文数据NLP(语义识别)比英语复杂,要做中文版AI生成技术不是简单的汉化就能解决问题。像百度和清华一样AI模型是自主研发的,底层模型的训练成本仍然很高。
在一位AIGC在观察者的博客中,一家初创公司MuseArt创始人曾提到:每次训练AI该模型的成本约为2万元。通过收取C端用户费,无法支付如此巨大的费用。最近刚刚完成融资的国内AIGC平台TIAMAT,还宣布与多家龙头游戏企业和广告平台合作。
现在AIGC载体上没有太多的枷锁。在寻求商业化的道路上,未来需要解决更多的法律、监督和伦理问题。不久前,日本绘画AI平台“mimic许多日本画家很快画家抵制,声明禁止AI学习自己的画。现在,包括Stability该平台还涉及到版权等诸多争议。
AI绘画足以让人类一窥技术创造的未来图景,但它需要更多的时间来改善自己。对于感兴趣的人来说,对技术进步有更大的宽容和关注可能会更好AI为己所用。
正如Stability.AI的slogan所言——“AI by the people, for the people”。
相关内容: