专访SOULO:首支全AI制作短片幕后揭秘,大胆操盘后的分享

举报 2023-05-22

AI,人工智能,AIGC,淘宝,短片

采访:吴小宝、lily
编辑:lily

先来看片吧。

告诉我,看完是什么感觉?
如果我告诉你,这支短片由AI制作完成,你又会是什么感觉?
是不是忍不住再次点开,又看了一遍?
......

这支短片来自淘宝造物节和创意厂牌SOULO,一推出就在行业从业者心中掀起波澜,或感慨于AI的强大,或焦虑于自身的命运。

从年初爆火的接近人类水平的对话机器人ChatGPT,到当下Midjourney等不断刷爆网络的强大内容生成能力,这支短片和无数AIGC作品证明着,独属于人类的创造力领域已被AI叩响大门。

创造力是广告营销行业的核心竞争力,广告人是否可以驯化AI?还是会被AI取代?
门后的世界会是怎样的,描绘出的未来广告图景是什么样子?

这支行业首支全AI制作短片的大胆试探,或许可以让我们窥见问题的答案。为此,我们找到项目主创之一SOULO创始人 赵晓松,一探项目背后的故事。

一些辅助你更好地阅读此文、了解AIGC的小知识。
赶紧码起来~

AIGC,全称AI-Generated Content,指基于人工智能技术,通过已有数据寻找规律,并让AI通过算法生成的各种类型内容的技术,例如AI对话、文本续写,文字转图像、AI数字人等。

AI模型,指通过训练算法和大量数据,使得人工智能系统能够学习和识别模式,并做出相应的决策或预测。这些模型可以用于各种任务,如图像识别、自然语言处理和推荐系统等。

Discord社区,一个在线聊天和社交平台,由共同兴趣、话题或目标相连的人组成,用户可以在Discord上进行交流、合作和分享资源,包括与AI技术相关的讨论。

语言类AI,是一种能生成文本、图像等内容的AI工具,可以与人类进行实时对话,生成不同风格的文案,甚至计算机代码等。

图形类AI,可以由文字内容直接生成各种类型的高质量图片的AI工具,可以辅助人类进行绘画设计和发散想象力。

Prompt,指给AI系统输入的提示或指令,可以是一个问题、一个陈述或一个需求,用于引导AI系统生成相应的响应或结果。Prompt的选择和设计对于AI系统的输出和性能有着重要的影响。


一、既然担忧人类被取代
干脆直接和AI比试一下吧

去年12月的一天,赵晓松拿出电脑注册了Discord社区,开始第一次探索。

赵晓松是从理工科生转到的广告领域,曾在甲方乙方都有过任职经历,后来因为喜欢表达,决定自己开家广告公司。SOULO从诞生之日起,就是一家对新技术充满好奇和探索的公司,SOULO整体团队也对AIGC有所了解,此前还曾多次运用AI辅助提案。

在其他项目中,SOULO利用AI辅助提案

AI,人工智能,AIGC,淘宝,短片AI,人工智能,AIGC,淘宝,短片

你一定很好奇为什么突然开始介绍这段背景。

这段背景很重要,为此次项目提供了重要支撑——对AI有了解和相对熟练的操作经验储备,这也是后来淘宝市场部大胆提出“让AI给淘宝造物节拍片”,而SOULO努力一试的底气。

时间来到今年3月,AI的热度喧嚣尘上,淘宝市场部找到SOULO,希望为淘宝造物节的优秀单品打造一支宣传视频。

一开始这份Brief内容与AI一点关系也没有,转折发生在第二轮两轮提案之后,淘宝市场部团队发起沟通,提出新的方向:做一支与AI有关的短片。

Brief的变更不是没来由的,随着项目的推进,外界关于“AI取代脑力工作”的讨论越来越激烈,越来越多的人被裹挟在焦虑的情绪之中。创造力是淘宝造物节的核心标签之一,淘宝市场部团队认为:

“既然大家有‘AIGC取代人类’的担忧,为什么不把话题摊开来讨论一下。”


一般情况下,面对这样的变更的正常反应是迟疑,毕竟这件事太新了。行业虽已有过几次试水,但整体还只限于平面创作层面,用AI创作视频还是第一次,作业模式、制片流程全都没有成熟的参考,能不能做成是一个很大的问号。

这样的变更对SOULO来说却是正中心怀,团队面对“AI vs 人类”这样经典而吸引力十足的课题跃跃欲试。

AI,人工智能,AIGC,淘宝,短片

围绕这个思路,SOULO只花了半小时就给出了新的创意方案。

SOULO围绕AI的两个提案方向

AI,人工智能,AIGC,淘宝,短片AI,人工智能,AIGC,淘宝,短片

两个创意方向,一个尖锐的檄文式长文案,直戳痛点;一个更纪录式事件,真切地用AI做一次项目合作。

淘宝造物节选择了后者,打造一场真正的人类和AI的想象力PK。

1684668579671568.jpg

人类的想象力很好解决,淘宝造物节的一众单品就是很好的代表。但是,AI的想象力要如何呈现呢?

于是大家找到了邹飞。

在和目前国内AI领域最专业权威的导演邹飞进行深入沟通后,团队结合当下可施行的AI视频创作方式进行倒推。一个是拍摄原片,利用AI转译画面;一个是通过输入Prompt,用AI创作的图像合成视频。最终团队选择了尽量用第二种去落地。

1684668722769560.jpg

采访中我们问及原因,赵晓松直率地说:

“我们的创作逻辑是想象力PK,落地点在‘想象力’三个字。把拍摄的视频投入AI,进行画面转译,这不是想象力,是百分百还原人的思考。用Prompt某种程度上也是在还原人的思考,但是图片的呈现形式和具体细节AI可以有自己的‘想法’,这更符合我们的创意初衷。”——SOULO创始人 赵晓松


二、AI制片怎么出执行案?
应对核心难点,先上三道“保险”

具体如何落地AI的想象力

毕竟是首次让AI“操盘”项目全流程,为保障项目的顺利推进,在进入具体执行之前,SOULO团队还需要给此次项目上几道“保险”,即结梳理AI特性和创意课题,制定高效有序的制片方案。


难点1:建立高效的工作流程

以AI为主创,此次项目没有【正式拍摄】环节,前期准备-正式拍摄-后期制作的一般广告制片流程并不适用。

如何保障各方的高效协作和项目的有序推进?SOULO团队结合过往制片经验和AI的实战运用,制定出整体工作逻辑:通过问语言类AI一个发散的问题,将得出的结果投入图形类AI进行创作,以此与淘宝造物节的代表单品进行想象力比拼。

一般广告片制片流程vs此次项目的制片流程

AIGC,项目背后,广告,营销,创意,淘宝造物节

在这样的逻辑下,很大一部分的工作压缩到了【前期准备】中。采访中,赵晓松向我们讲述整支短片的【前期准备】步骤,为便于大家阅读和梳理,我们总结如下:

此次项目的前期准备流程

AIGC,项目背后,广告,营销,创意,淘宝造物节

具体每一部如何执行,稍后揭晓!


难点2:让AI的输出结果可控

结合SOULO给出的制片流程不难发现,AI参与创作是此次项目的核心之一,而这也是此次项目中最不可控的部分:

  • 语言类AI给出的回答

  • 图形类AI创作的图像

众所周知的是,当下的AI只会做命题作业,未经过海量训练的AI给出的回答不可预见,更不可控制。为了在有限的执行周期内,尽可能地让制片全程可视、可控,保证最终的成片效率和质量,团队需要采用简单直接的方式——海量测试。通过前期的预判和全流程人工筛选过滤,辅助AI创作出更优质的作品。


难点3:让AI高质量创作视频

虽然,目前某些AI工具也具备一定的视频创作能力,但是整个团队在实践过后发现,这些AI工具大部分只适配于单一的表现形式,嵌套的风格也很雷同。必须要针对此次项目多话题、多画风的特性训练出新的AI模型。AI训练师的角色至关重要,需要邹飞导演进行AI模型训练,结合导演个人的审美能力、整合能力,给AI注入灵魂。

核心难点解决完,剩下的就是按步骤推进执行。接下来,我们沿着项目执行流程向大家逐步拆解这支短片的创作过程。


三、AI的想象力怎么样?
我们问了AIGC数百个问题

先来看看整支视频的完整创作流程:

1684398760562007.png

点击查看高清大图

正如前面所述,有非常大量的工作集中在【前期准备】阶段。

在和赵晓松交谈中,我们了解到,这几乎是他从业以来在前期投入精力最多的一个项目。采访中他说,“(这)比单纯拍个片,麻烦多了。”

(想要快速总结版可直接滑到此部分最后,但是,可能会错过精彩哦~)


STEP 1 _选品阶段:看似简单

单看视频,选品看上去是整个创作过程中最简单的一步。

但在和赵晓松沟通后,我们发现选品实则非常关键,不仅承载着品牌的商业诉求,而且一切的话题探讨、创意落地都需要产品本身的特质来承载。这部分淘宝市场部团队也一直在给到最敏锐的意见。

选品绝不简单,必须具备足够的视觉表达空间、开阔的创意发散空间,能经过AI的演绎后呈现出足够的想象力、视觉冲击力。这使得执行过程变得更繁重,需要在淘宝造物节7个频道,近50余件单品中挑选符合标准的产品,并确定成片中AI创作的视觉风格。

这意味着,SOULO团队除了需要进行主观筛选,还需要进行AIGC绘画测试,去检验挑选出的单品符合标准。

此次项目的选品流程和标准

AIGC,项目背后,广告,营销,创意,淘宝造物节

赵晓松以一款稀有岩彩颜料举例:“当时列了很多的品去跟AI测试比对,以便于保留设计和视觉冲击强烈的单品,其中有一款岩彩颜料我们一直很喜欢,但这个东西很不好发散,AI画出的图也不够具象,我们只能‘忍痛割爱’。”

不止如此,在此次项目背后,团队实则还列了近十款产品进行了测试,在多方位考量淘宝造物节的商业诉求、产品延展空间和视觉表现力等标准,最终挑选出了成片中大家看到的这6款单品。

最总入选的6件单品以及3件备选单品

1684668758643512.jpg1684668758826629.jpg


STEP 2_AI创作阶段:AI沟通/创作

确定选品时,也将每件单品的视觉风格一并确认下来。接着团队需要按照计划,用AI创新演绎指定风格的单品,形成图片集。这种“演绎”不能是毫无亮点的拼接、套模板,必须要足够有新意,要呈现出AI的想象力。

人类与AI语言不通,能获得什么内容并不一定可控。在这种执行标准下,项目执行瞬间被提升至魔鬼级难度。


  • 问了AI几百个问题

首先,SOULO结合每个单品的特性提炼出话题,与语言类AI进行交流。

以陶瓷潮鞋花盆为例,除了短片中呈现出的“未来,生命还能装在什么容器里”的话题,还有“如果,人类成为植物的生长容器会是什么样”“如果宇宙鲸鱼可以穿梭宇宙,人类可以如何在其腹腔内生活”等话题方向。短片中所呈现出的问与答,仅是幕后工作的“冰山一角”:

针对部分话题,AI给出的回答

1684668988423783.jpg1684668988783039.jpg

需要注意的是,和语言类AI沟通并不是输入话题就能获得高质量的回答,大多数情况下,得到的可能是这样空泛的答案:

1684397222634275.png

如何提高与语言类AI的对话质量?在经过大量的测试后,总结出沟通的技巧,在此也一并分享大家:

1、⿎励语言类AI扩展其回应,通过补充提出,帮助引导对话
2、监控对话的⽅向,根据需要进⾏调整,引导对话⾛向有意义的⽅向
3、提⽰需要简明扼要,避免包含不必要的细节或说明
4、使⽤具体、有针对性的问题,避免过于模糊或开放
5、可以使用角色扮演,帮助语言类AI更好地理解角色和人物
6、以及最重要的:只有带着想法和语言类AI沟通,才能得到有效的答案


到这里还没完,AI的回答并非全都具有视觉表现力,还需要经过一道筛选工序,由团队挑选出优质回答,然后才能投入下一步骤——用图形类AI将文字转化为图像。

针对部分话题,AI给出的回答

1684669246461058.jpg1684669246689296.jpg1684669246134677.jpg


  • 一场输入Prompt的硬仗

图形类AI的创作像潘多拉魔盒,各种Prompt如“咒语”般,仅些微的变动就可能带来完全出乎意料的结果。

赵晓松告诉我们,敲开AIGC制图的大门并没有想象中那么复杂,具备基本的英语能力和会上网就能很好地掌握,笑。但是若想要图形类AI尽可能还原人脑中想象的画面,仍需要进行多次Prompt测试和调整。

例如,狗狗滑板的简单Prompt是“Cute magic dog skateboarding”,但如果仅这样输入,只会得到这样的结果:

1684669316318536.jpg

但是如果输入:“Cute magic dog skateboarding,Purple Rainbow symbol, magic effect, bioluminescence, cute environment, neon lights, complex details, surreal, 8K, triple lighting, high resolution, Vray rendering 3D 8k”,给到特定的画面元素、视觉效果、画风、光线、渲染效果等细节指令,得到的图片就会完全不一样。

1684669350465551.jpg

沿着这个逻辑,不断调整词汇,丰富细节,就能越接近期待中的效果。

或许大家从这段AI绘画的描述中能感知到,用AIGC绘图虽然不再需要大量的人力投入,但是在没有丰富经验和词库的辅助下,仍是一个相对耗时的过程,且仍需要人的创造力加持才能产出惊艳的作品。

和AI对话越多我们越会发现,核心思想、创意仍然来自人本身。如果你脑袋空空地去问AI,得到的只能是空空如也的答案。——SOULO创始人 赵晓松


STEP 3_脚本阶段:主打一个反常规

采访中,赵晓松告诉我们:此次项目以文字脚本为主,没有常规的细化分镜脚本。

和邹飞导演的沟通中,团队认识到AI创作视频是非常开放性的,拍摄手法、构图、细节场景等都没不可控。若想AI按照分镜脚本中人构想的画面输出精准的内容,只能做模板视频进行强引导,而这可能需要花费的时间是去线下实际拍片的好几倍。

因此,以文字脚本的方式,让AI在有限的空间内随机发挥是此次项目的最优方案。

看到这里,想必大家也就明白了:前期的选品、与语言类AI问答、图形类AI绘画等一系列测试和筛选看似给自己“找麻烦”的复杂操作,其实皆是为了让脚本更具有参考性和可执行性。

初版文字创意脚本

1684669404337056.jpg1684669404384355.jpg1684669404254894.jpg

平面转变为视频的过程中,素材的表现力各有不同,是否适合视频格式,需要哪种构图和色调均不得而知,这就导致一般流程里确定性的文字脚本和画面描述并不可行。因此,这版创意脚本其实更可以理解为一份脚本逻辑参考,即人类与AI究竟进行想象力对决的故事大框架。

与客户在这个框架之上达成共识后,团队还需要通过排布、补充不同的“血肉”(内容素材),在AI训练模型中生成、测试后才能给到一份直观、可参考、可执行的视频脚本。

至于在没有布景、演员、拍摄环节的情况下,如何呈现视频脚本?具体选择哪一种组合、哪些素材,问题就交到了邹飞导演手中。


STEP 4_后期制作:导演注入魔法

其实,邹飞导演对AI模型的训练早在选品阶段就已经开始了。例如,在产品画风选择时,邹飞导演导入AI模型提供了更多风格参考,也为后期视频创作导入更多数据参与。

因为每一步都在跟进并不断投喂给AI进行测试,所以在内容细化时邹飞导演已经掌握了足够的数据基础,能结合前期测试的各种素材、AI训练效果,和预览动画,输出更加精确版的视频脚本。

整支短片的制作过程大致如上。

在采访的2个多小时里,为了解清楚具体的创作过程,有近三分之二的时间都花在了具体执行步骤中的要点、细节探讨上。我们希望通过这样的沟通,以及在本篇内容中对制片流程的尽可能还原,能帮助大家进一步了解AI,构建起对AI时代的想象。

为了方便大家快速总结,就具体一个画面的制作流程,我们也给大家放在这儿了:

1、确定选品与视觉风格

1684669560960939.jpg

2、与语言类AI进行问答

1684669581498682.jpg


3、在图形类AI中将回答转化成画

1684669581878251.jpg

4、导入AI训练模型创作视频

AIGC,项目背后,广告,营销,创意,淘宝造物节


四、驯化?还是被AI碾压?
行业首支全AI制作短片的启发

聊完了项目创作经历,我们很直观地感觉到,流程的复杂和繁琐。这与我们采访前“AI解放双手”“AI取代人类”的猜想相去甚远。

在思考为什么会有这种差距之外,让我们更好奇的是,为什么自己会有这样理所当然的猜想?

AI一定意味着更便捷、更高效,性价比更高吗?我们究竟应该对AI持何种态度?

就这些问题,采访中,我们也与赵晓松进行了讨论。


数英:就SOULO的整体实践来看,用AI进行全流程广告制作的性价比如何?

赵晓松:前阶段有一些客户来问过类似的问题,我觉得现在AI还处于有信息差门槛的阶段,需要一定的技术储备以及如何解决版权问题。所以,能不能减少制作成本并不是一件十分明朗的事情。并且,受众经过一段时间后,也可能会对目前的AI感视觉产生审美疲倦。

一方面,AI还没能达到创意人的水平,它没有真正创造的能力。背后的逻辑都是大数据抓取-再编辑。所谓尸体的拼凑。

另一方面,目前的AI只能给到很多开放性的答案,并不能准确还原人设想的东西。如果非要用全AI的方式百分百还原人脑海中画面,它的制作成本和时间成本是可能会超过传统的视频制作成本。

数英:成本主要都集中在哪些地方?

赵晓松:研究AI技术,引导AI发想。同时收取的素材量非常大,细节错误很多,需要人工去不断修正。项目中充满了,处理不可控因素而牵连产生的成本投入。

数英:在你看来,在正式的项目操盘中,AI技术可以如何帮到广告人?

赵晓松:在提案阶段,AI可以帮助我们迅速让想象力可视化,给提案加分;在执行阶段,对于部分项目AI可以给出一些引导,例如人物设计、场景设计、线下装置概念等。它的定位是一个好的工具,并非一个真正的新员工。

数英:所以,目前的AI发挥空间还很有限,只能作为工具使用,而不是如其他人担忧的那样会取代人?

赵晓松:我觉得不会,目前的AI还在由0到1的阶段。项目的核心,是人在做绝对的主导决策。

数英:你也提到“项目出街后,引发了很多探讨,有迷茫的,也有不解的”。就你个人来看,行业对AI的普遍态度是怎样的?

赵晓松:有人认为AI会动摇产业结构。AI真的有朝一日替代了大批量的执行岗。还有一些人觉得AI创作的东西没有灵魂,是“尸体的拼凑”。他们认为这不是一个正确创作模式和创作生态,会养成创作者的惰性依赖。

我们AI会替代体力劳动,但是它看上好像更想先替代脑力劳动。所有人都处在AI带来的巨大冲击中,不是只有广告人。所以,大家有危机感在所难免。就像人们有说到的。AI就像我们时代的“蒸汽机”,蒸汽机都出现了,行业的“工业革命”是不是也快来了?

数英:现在的技术革新太快了,我们应该如何正视AI技术给广告行业带来的变化?在这种广告行业的“工业革命”的可能性中,哪些岗位和公司可能会被AI替代?

赵晓松:我从16、17年开始做广告,那时候social很火,很多传统广告公司被迫着做改变。这几年经济红利在退热,市场的挑战更大了,利润下降的时候营销预算会挨第一刀。

我曾经和一位4A的老前辈聊,他说他经历过90年代用电脑绘画代替手绘的阶段,他觉得现在跟当时是一样的,也是一种工作模式的改变。当时电脑代替手的冲击不比现在AI带给我们的小,但是我们现在还是需要绘画的艺术审美,甚至还在进行手绘。

至于替代与否,我觉得还是谈不上,更多的可能性是,AI会改变我们的工作方式。

数英:工作方式?怎么解释?

赵晓松:广告在AI技术的加持下,可能个人工作模式会越来越多。AI能解决人的思考效率和专业落地的问题。在AI的帮助下,一个复合型人才、一个真正的核心内容创作者会越发如鱼得水。不免让人想象,在未来真的可以以一敌十的方式去工作。

但同时,人性永远是一个好故事的灵魂。AI的发展让我们更容易的获得视觉的形式感,于是形式大于内容的东西会越来越审美疲劳。因为AI可以呈现好看,而好的内容需要人去赋予。

数英:当个人工作模式越来越多地替代公司作业模式,品牌会不会不再需要广告公司?这种趋势其实已经有了,很多公司都在训练AIGC,减少创意外包的需求,在这样的趋势下,广告公司会消失吗?

赵晓松:我觉得不会,就像这条片的官方视频号下面,排名第一的热评说:“AI还是天真了,广告人是个体力活。”哈哈。

数英:在这种情况下,广告公司怎么提升自己的竞争力?

赵晓松:拥抱技术变化是个有趣的事,但我仍然觉得我们不能完全依附于此,否则广告公司最终会变成一个批量AI素材的公司,价值会烟消云散。

内容还是核心竞争力,我相信内容的价值,这也是为什么对各种新技术不会感到害怕反而拥抱的原因。AI目前很热是因为它足够新,等大家对它祛魅之后,最后比的还是AI背后的东西。

我还是一个后辈,入行不算太久,对于这个行业也谈不上什么特别的观点,也没有特别强烈的使命感。我只是觉得,在有想法就能生成很fancy的形式的未来,真正创新的、有人性的内容会更稀缺,挑战也会更高。而且,从目前,AI也只能帮助我更好地去表达内容,无法替代去独自创作。所以,我相信,好内容始终是有价值的。


还记得短片最后的“回马枪”吗?

4.jpg

这个问题的答案我们还不得而知,可以确定的是,AI时代是一座未知的“黑暗森林”。在这样的未来中,必将诞生出新的产业结构与商业形式,无论是否会被AI淘汰,我们都没有“不回答”的选择项。

AI不一定是我们的竞争对手,但必定是人人都需要掌握的武器,是我们最终能在时代的跌宕、新技术的冲击中幸存下来的关键。

“人类用好想法喂饱了AI,然后呢?”
在评论区留下你的思考与观点,或者对此次项目的任何疑问,我们将邀请项目主创与大家共同探讨。
最后,祝福大家都是“幸存者”。


注:
* 文中所有图片为内部测试使用,严禁商业用途 

本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    参与评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    参与评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    全部评论(10条)