对话B站AI获奖创作者,3条私人经验分享

举报 2026-05-14

700x700.jpg

在AI作品评论区,常能见到这两张梗图——

作者与AI的关系

AI短片

终于写完提示词的作者

AI短片

AI的不确定性显然还困扰着很多人,神秘的提示词prompt仍被普遍视为影响结果的核心因素。

但是,后者被相当程度地否认了。无论是公开访谈,还是此次数英对话,AI创作者们态度都是:其实提示词很简单,并不复杂。

一同过时失效的还有「视觉奇观」这种形式。万物皆可伸缩形变,或巨人化,或异形化,只要简介加上“超现实、荒诞”,似乎一切就变得合理。但观众的疲劳速度比想象中要快,甚至快于前两年的CGI。

  • 有追求的甲方把颇受好评的AI广告作为reference写进brief:打平,最好超越。

  • 广告人从最初的被动破防逐渐找回手感,俗一点说“找回AI时代的主体性”,把AI作为方法。

  • 更多创作者自觉审视,片子为什么要用AI来做,以及观众为什么要看这样一条内容?就因为是AI短片吗……

泡沫在散去,理性渐回归,我们也从B站大赛获奖者Keanu98那里听到了共识与非共识回答。有一手工具使用经验,有个人化的技巧,当然还有一些你可能不会认同的发言。


受访嘉宾:Keanu98  本名邵凡
采访/撰文:Dreamer

获奖作品《马上好》


一、用AI是个过程活儿,找对途径省力一半

8300多条投稿中,《马上好》获得开放赛道三等奖。

虽不是冠军,但作品的拟真效果、明显高出一截的镜头水准,留下了深刻印象。深到不少品牌慕名而来“我们也想要合作这样的AI片子。幽默、台词不俗,整体真人感很强。”

“可我不想重复自己”

在谈到“是否对我们明确的采访需求感到意外”,聊飞了问他“如果给你二等奖,会觉得受之有愧吗?”对面传来爽朗的哈哈哈哈:“当然不会!”

邵凡,98年出生,戏剧影视导演专业,用AI创作不过半年,8条作品在B站播放量总计近150w,现在全职AI创作。

从他的AI作品中能同时看到「代表性」「特殊性」

前者指向创作共性:为了好上手,从AI动画做起;做过惊悚短片,这样可以巧妙利用AI短板。

后者更能体现创作者特质注重剧情叙事;用AI创作却不放低对运动镜头质量的要求,通过镜头切分技巧地解决了AI长镜头的不足;以及以实拍思维去控制AI角色的表演……

AI动画《赤瞳》和AI真人惊悚短片

WechatIMG777.png
WechatIMG765.jpeg

总之,凡是能想到的AI典型毛病,包括人物说话动作僵硬、PPT式转场、假人感、配音口型,在他这里几乎不存在,至少不明显。

这些构成了作品气质,也成为B站评论区被讨论最多的核心优势。

1778321734862706.png

数英:我们注意到你在AI创作上经历了一些过程,从AI动画到恐怖悬疑题材(改编番茄小说),再到如今原创脚本,表达变的更自由。
迭代过程很有逻辑,即策略性地用好AI。
AI动画更好上手,这个能理解。但是为什么连续做了好几条惊悚短片,除了题材吸引人,还有什么更实际的原因吗?

邵凡:AI很适合用来做惊悚悬疑片。

技术的典型缺陷放到到惊悚片能让恐怖的更恐怖。比如人物看起来有点假,这放在剧情短片很扣分,但是换成惊悚片,面部有点假、动作僵硬,反而加剧了恐怖感。

而且这种类型片对表演的要求相对低一些,不用那么细腻的情绪表现。重点在于悬疑性。这就又避开了AI的短板。

还有就是节奏。恐怖片有一个特点在于,需要不断地铺垫,不断要让观众觉得我要吓你了我要吓你了,但其实没有。直到稍松一口气放下心的时候,突然再起劲儿。这种惊悚节奏,非常适合用AI来做。

数英:这些惊悚短片确实很不错,但挑剔地来说并没有体现出你的作者特质,优势也不如《马上好》那么差异化。
我们好奇的是,创作《马上好》时到底发生了什么?

邵凡:客观地说当时正碰上seedance2.0上线,技术层面解决了之前我想做但很难实现的运动镜头的问题。如果要做有质量的AI真人短片,这一点很重要。

回到个人角度,我一直很想拍有点黑色幽默的故事,对脚本要求很高,最好能脱胎于生活。

正巧发生了一件事。原本我是想做一个犯罪类的短片去参赛的。剧本写了改,改了写,尤其到后半段,无论是从故事逻辑,主题表达,还是我个人的观点,很难平衡。

总之越写越觉得可能会跑偏,有点失控了。就一直拖,拖到我女朋友一直催。下意识说了几次“马上好”后,把这个点子记了下来,后来又有了创意雏形:

如果一个习惯说“马上好”的人,有一天醒来发现所有人用同样的态度对他,那会发生什么……

数英:而且又是马年。

邵凡:对,算是沾了点便宜。但重要的是,《马上好》几乎是第一条我个人有所表达的片子。它确实不如作者电影那么宏大,但至少迈出了第一步。

讲好一个故事,和有个人表达地讲好一个故事,是两回事。

数英:说到作者性,最新的《这是艺术!你不懂》又往前进了一步。甚至从中能感受到创作冲动。
「不得不说的创作冲动」和「策略性地讲好一个故事」又有明显差别。

邵凡:坦白说《这是艺术!你不懂》是做完《马上好》奖励自己的一条。

你说有创作冲动,但其实我已经很努力地克制过,尽可能把想说的收一些,或者换种姿态换种情绪表达出来。

虽然是奖励自己的一条,但不想把它做得过于作者性。短片底色其实是有点丧的,原本的文学剧本更低沉。

数英:好像能明白你的顾虑,即使是大导演,作者性特别强的文艺电影一般都不叫座。对于大多数观众来说,也有一定门槛。

邵凡:是的,况且这时我需要被大家看见。


二、揭秘完整工作流,AI角色拟真有方法

数英:这两条片子的创作周期都是近一个月,成本(除去人工)也都在5000以内。为什么在做完一条爆款之后,再做仍然没有降低各项成本?
在聊这个之前,可以先以《马上好》为例,回顾一下整个工作流.

邵凡:我可能没有其他作者那么清晰的工作流,分一二三四,只能说说个人的工作方式。

剧本3周左右,AI制作1周以内,周期比例大致在3:1。但这个AI制作速度不适用于现在,因为现在AI变得不聪明,普遍没那么好用了。

剧本部分:

  • 确定人物性格→根据人物性格确定若干情节→情节之间得有事件升级感,这就有大致的剧本了。

AI制作部分:

生图 确定角色形象

确定整体的视觉风格
我想要带点复古的调调,那种模糊、有点颗粒。你想虽然讲的故事是现代的,但是只要我们回忆脑海里的画面永远都有一种滤镜感,当时seedance2.0恰好只能生成720p,那种模糊的感觉刚刚好。

根据视觉风格生成所有场景图
依次是工位,他女朋友吃饭的餐厅,酒吧,卧室,小区,机场,公路……

人物图、场景图都确定好,就到了跑视频阶段
喂人物图和场景图,用提示词描述清楚想要的画面。对了,就是在这个阶段,我意识到其实和我作为一个实拍导演引导角色表演没什么差别。

部分视频提示词

AI拍片

AI工具部分:

定人物、定视觉风格都会用Midjourney。因为它的风格够多够全,相对来说,nano banana生成的风格比较单一。

但是nano banana是个很好的修图工具。而且在改视角,比如从全景切特写、切一个侧拍,它给的结果很稳定。

seedance2.0呈现的运动镜头更有质量。以及如果想要魔幻色彩的东西,它能展现得更有逻辑。

可灵在人物情感、微表情的变化控制上更有优势。

数英:可以具体一点,就说生人物角色有没有小技巧可以分享。毕竟你的人物真实到我们都以为你喂了真人照片。

邵凡:很多人以为王延就是我本人(笑),但确实没喂图。

一开始生的角色有点偏向东南亚男性的形象,就得往中国人调一调。还有过明星脸的问题,太完美了也不真实,再往普通人靠一靠。

今年是马年嘛,我就想他的脸是不是可以长一些。

数英:感觉你在用选角导演的视角在生成AI人物。

邵凡:是这样,而且真实感和角色表演也有关。

有些AI角色说话时只有嘴巴在动,或者它在和另一个角色对戏时,没什么反应,人物互动只停留在口头,这就很假。谈不上表演。

真人说话是有「口癖」的,比如说话时嗯嗯啊啊嗷嗷,或习惯说“然后”。王延的口癖体现在,他说话节奏是一顿一顿的,有点懒散,这才符合他拖延症的性格。总之不是光把台词写得口语化就够了。

数英:还有点气虚的感觉,总觉得他有气无力。

邵凡:哈哈哈有点儿,总之得关注你的AI角色的表演质量。两个人物一起互动时,角色A说话,角色B是不是要有点反应。不可能是像机器人一样,你说完我再有动作,不是这样的。

人在真实环境里会遇到风、灰尘,类似的可以增加一点真实世界的物理质感。

还有一个技巧,涉及情绪时可以多用「中性词」去描述。

比如无奈、沮丧、不耐烦,总之不要用很具体的情绪词。如果提示词是“这个男人在哭/愤怒”,AI生成的就很假,表情很夸张。写之前想想,和目标情绪相近的还有哪些。

AI理解情绪词时也很有意思,有可能你换个描述,它就有了。

数英:中性是说比想要的情绪,弱一点、淡化一点?

邵凡:是的。

情绪提示词参考

“沮丧”

1778322146943386.png

“疑惑”

1778322256926736.png

“尴尬”

1778322351778977.png

人物互动提示词参考

AIGC

数英:除了拟真感,镜头语言是你的另一优势。但是你说,到目前为止都是直接从剧本进到AI制作。中间甚至连火柴人那种简单的分镜都不画?

邵凡:可能跟我的专业有关,确定好剧本后,具体镜头怎么呈现,场景怎么配合剧情转换,这些都在我脑子里有个七七八八了。

剩下的就可以边做边调整,比如有时候设计的分镜是不错,但是实际生成未必能达到那个效果。或者AI人物表演还是有瑕疵,怎么抽卡都抽不出来,这时就需要改分镜。

数英:相当于脑搓分镜!

邵凡:是这个意思!

无论是手搓剧本、还是脑搓分镜,这些都是由创作者个人意志、主观判断完成的。这部分不仅决定了作品的风格特征,也是AI永远无法替代的。

数英:科班专业出身确实让你有更多办法解决镜头质量不足的问题。
但是长镜头呢?你对长镜头没有执念吗。它依旧是AI最大的短板。
而且个人认为,好的长镜头是无法用分镜技巧替代的。

邵凡:执念?我只能说谈不上,这也可能是不得已的妥协。

长镜头是客观存在于影视表演里的,它有太多作用了,比如辅助情绪延续、氛围感的强化,空间调度……有时候真人演员的情绪流露得太美了,不好打断它,这就是惊喜的一面。

但是怎么办,AI现在给不了这些……

有时候我都害怕自己做得同质化,不是我想同质化,而是因为是有些镜头AI做不到,你只能用一个切碎的风格去替代原先想有的表达。

数英:那AI的短板会反过来影响你写剧本吗?比如根据AI生成特性,预设情节、场景。
毕竟“懂得管理AI弱点”已经被默认为一种技巧,或者策略。

邵凡:剧本阶段基本不会,故事还是那个故事。到了要做片子前后会因为AI的一些原因去调整,AI确实会影响最后的成片效果。

数英:有没有某个问题是反复出现的,每次都是因为AI被迫更改?

邵凡:主要还是人物在空间里的调度问题。比如一个男孩从房间,砰地打开门走出来,跟父母说了什么。这场戏结束。

但是AI怎么生成,结果都很怪,不合逻辑。为了效率,只能把这场戏变成固定镜头。

吃饭这场戏

1778322563294845.png

数英:你这样说让我想到,有些AI短片的场景看上去宏大,但人物和空间关系其实很简单,简单得只能称得上整齐。人跟空间的关系、包括运动轨迹也是线性的。

邵凡:这也是我坚信AI没办法替代实拍的原因之一。理解复杂性、处理复杂性是AI很明显的劣势。

比如,现在要拍一场10个人围坐在一桌的戏。就要做镜头的拆分,让空间关系合理化。如果还需要人物在里面走动、涉及调度镜头的话,AI就会乱掉,就是无限抽卡也会疯。

没有这样复杂的镜头语言,你的画面逻辑就会很简单,戏就不好看。可能短片还好说,放到长片这个短板就会非常明显。

数英:看来,AI目前还拍不了邵艺辉导演的戏。

《好东西》《爱情神话》饭桌戏名场面

WechatIMG778.jpeg


三、了解AI的强大与惯性,才能用得更趁手

数英:落了一个没聊,为什么《这是艺术!你不懂》依旧没有降低成本?

邵凡:直白说做这条时AI没那么好用了,给的结果不精准,需要抽更多次卡,而且seedance2.0和可灵都在排队。

为了质量和效率,一个镜头我几乎会用所有软件同时跑。现在做应该更贵,软件又涨价了。(苦笑)

还有一个原因,这个片子要比《马上好》更“复杂”,它的人物呈现,也就是主角王岛比王延更丰富,他有很多留白的部分。而王延几乎只展现了性格的一面——他的拖延症。

《这是艺术!你不懂》有点文艺片的感觉,需要更多视听呈现,对各种运动镜头的质量要求更高,这就蛮费钱的。

数英:你一直在强调视听、分镜,但这些对于非科班来说还是有门槛。有没有更落地的经验。

邵凡:可能有点反经验——从默片开始做起。学着用镜头讲清楚一件事,而不是用台词。

因为这样能让你真正理解什么是分镜,以及镜头语言的重要性。这关系到你作为导演讲故事的方式方法。

糟一点的是,一上来就用AI去拆分镜。那种分镜没有灵魂,它拆得很流水线。如果真照这种习惯去做片子……

数英:还有用AI拆风格提示词的。甚至有「提示词风格库」这种非常工具化的概念。其实在你的B站评论区网友就简单拆过:大致是90年代复古风,加什么滤镜之类的。

邵凡:风格提示词这个东西有点玄,我自己都不知道《马上好》的风格词具体是什么,而且就算你把得出来的提示词扔给Midjourney,它也不一定能生出完全一样的风格。

而且当你习惯了后很容易撞风格。对于大多数人来说或许不重要,但是作为原创作者,很忌讳这点。

类似的用AI拆风格提示词的教程

WechatIMG760.jpeg

AI社区会把「风格提示词开源」作为一种流量密码

AIGC

数英:审美、技术手艺活儿被配方化、工业化了。我还看过那种教程,风格A、B、C融合起来能形成某某题材海报。举例「赛博霓虹+故障艺术+液态金属」→ 秒出科幻电影海报 「水墨丹青+飞白笔触+古卷做旧」→ 齐白石看了都愣住

邵凡:感觉像在数学题,冷冰冰的。如果说多点「工作流」这个说法我也不是很习惯。就好像有了提示词、视觉风格、各种参数就够了。做片子不是数学题~

数英:以技术为背景的概念确实有反人性的色彩,它本身是为了功能服务的。用AI这么久,有没有那种自我警惕的时候?

邵凡:有,比如写完故事去想怎么呈现时,那第一反应的视听模式可能是之前重复过的。属于一种思维上的惯性。

但AI也会因为它的限制逼你锻炼出某些能力,或尝试某种视听风格,这种呈现方式是以前不太会做的。这点挺好~

数英:AI有影响你的创作欲吗?强了还是弱了。

邵凡:肯定变强了。可能和我不吝啬表达有关,对于想表达的也不会计较成本。

数英:AI非常有利于那些有表达欲、“有话要说憋着不说难受”的人。如果会用,它是一个非常趁手的武器。

邵凡:如果技术非常成熟它可能会促成那种天才型的导演。AI就像他的毛笔,挥洒自如,天马行空。

但前提是这个人从来没有学过视听/影视制作,没受过专业训练。他的叙事逻辑和绝大多数人都不一样,自成一派。

数英:对于技术上限呢?看到过一个很好的洞见,如果创作者意志不坚定,其实很容易被AI技术吞噬。或为了技术而创作;或一味跟随AI的上限,丢失了自己的风格/语言/创作本心。

你的感受是怎样的?

邵凡:我这边倒还好,只要别忘了动力常常来自于自身的表达,不要忘记自己想和这个世界说什么,以及自己眼中的世界是什么样的,把“感受”交给自己而不是AI。

数英:你应该不会有“需要保持个人风格”那种时候~

接下来的AI作品里,你在乎的作者性会越来越清晰吗?允许自己表达得更多一点、更释放。

邵凡:会。坦白说,之前不清晰,有一部分原因是因为自己不敢清晰。能力还没到。

能力不只是使用工具,还有视听化叙事的能力、以及整体的控制力。

因为(要想做成)清晰的东西(清晰的作者性)很容易犯错。

只有当你各方面能力都足够,才敢去表达得稍清晰一些。

数英:你说清晰容易犯错,是不是有点像《马上好》之前没能做成那个片子那样。可能表达欲、主观意识太强,反而导致最后有一点不知道怎么收尾了。

邵凡:当时的能力驾驭不了想要的表达,结果只能是失控。

某种程度上说,作者性是沉淀+控制出来的。并不是你想有就能有的。你说了一大堆,可能作者性依然为0。

数英:你说更喜欢《这是艺术!你不懂》,因为它更像你。里面有几个片段我们也很喜欢,比如那句“父母常常用笑和多吃点,来遮盖对我的不理解”,每次看到这都能精准戳到笑点。
还有妈妈最后说的那一段台词,非常动人,应该是整部短片情绪浓度最高点。
这里面以及主角要拍《天井》这个故事,有没有哪部分和你个人经历有关?

邵凡:都有,我的故事基本都是根据自己的经历写的。

台词节选

“你那片子我后来又看了一遍, 这次我没睡着
那个人坐在那里 我看久了也觉得有点意思
不知道他想什么
就是看着那个天一会亮一会暗 云飘过去又飘过来
看着看着我也跟着发呆了
你小时候也这样 坐在奶奶家天井边一坐一下午
 也不知道你在想什么 
你要是还想拍 就继续拍下去”

AI短片


四、保持怀疑,直到找到漏洞

“我拒绝被AI驯化”
“为什么一定要AI替代实拍,就不能共存吗”

对话中邵凡时不时会露出坚定的一面。对于技术确定性发展,他也报以肯定态度。「积极主动用AI」和「对于实拍创作有渴念」,这两件事在他这里并没有被对立看待。

原本预设的关于导演身份危机的问题,被空置了。这可能是客观意识的体现,也是他对于目标路径保持清醒认知的那面。

坦白说类似没那么主流的回答反而让我们更安心。因为它给了一种根本性解释——

  • 这种作品为什么可以不太AI?叙事方式依然是实拍时代的,只是全流程由AIl完成。

  • 以及如果去掉所有短片的「AI标签」,回到同一起跑线上,哪些能胜出?那时观众的投票结果或许会稍稍有所变化。

文章怀疑的当然不是技术,也不是它的未来,而是现阶段的内容呈现方式。新的AI内容品类离成型还有距离,观众阶段性审美疲劳就证明了这一点。

从吐槽AI味儿重,到对视觉奇观、快节奏场景切换日渐脱敏。雷同的模版、方法论流行得有多普遍,用户口味迭代得就有多快。

非此即彼、二元论,类似的错误我们犯了太多次。“实拍还是AI”、“AI短片和其他”、“AI广告和其他”…… 有没有可能问题本身是伪命题,分类方式根本不存在?或者分类、新定义是让大家更好的理解,而不是选边站队,甚至要你放弃另一边。

准备稿件期间去看了迈克尔的传记电影,那两个小时时不时就会升起一个念头:AI统治不了的地方还有很多,以及那句风靡AI圈的宣言“解决人工智能,然后用它解决一切”一定有逻辑漏洞的地方。

这些漏洞就是机会。它不只属于擅长自定义的创作者们,更属于每一个,人。

求迈克尔杰克逊巨星之路真实影评_1_风中的帆布包_来自小红书网页版.jpg

更多经验分享:

数英:除了关注角色表演外,还有没有提高真实度的技巧方法?

邵凡:镜头有呼吸感也很重要。呼吸感的意思是,在合适的时候镜头可以有一点点不稳定,模拟出手持镜头的感觉。

数英:在保证人物一致性上呢?

邵凡:我的方法是,一定要喂一张角色的面部近景图。提示词里都不需要写“要以这个人为主角”,软件能理解。

喂面部近景图

1778323287723455.png

数英:虽然你说在AI配乐上没有探索出特别好的方法,但是不是有些经验、尝试是可以分享的?

邵凡:后续我还是倾向于哼一个demo,让做音乐的人写一个简单的曲子,然后再交给suno去编。这可能是一个方向。

因为这样音乐才是为故事服务的。如果反过来,故事跟着AI生成的音乐走,就会很被动。原本设计的情绪高点、渐弱,都有可能被AI音乐的节奏影响。

对了我能说些不好的方面吗?

数英:当然可以。

邵凡:suno的音乐风格确实很多,但是它识别不了唢呐这种乐器。

我经常想试着在曲子某个地方加一段(唢呐),但是它就理解不了。很头疼。

数英:配音也可以聊一聊,两个片子的台词情绪、气口,都非常不错。还以为是真人配音。

邵凡:主要还是声音采样+克隆音色。而且做完后基本不会调配音。

我会在生成视频的时候,用提示词说清楚这段台词的情绪是怎么样的。如果中间有气口,会在切分镜的时候把它切开。

口型倒是更大的问题。现在的AI贴口型还是很不稳定,这一点我也很痛苦。为了让口型自然,只能抽大量的素材。

数英:OK最后一个,你知不知道《马上好》里有一个镜头穿帮了。

邵凡:(笑)他开车关车门那一幕。

那个镜头也抽了很多次,就很邪门,无论怎么抽卡,手都直接穿过去,我也没招。

不过它不影响整体叙事,我也就放过了~

1778323590156386.png

本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    暂无评论哦,快来评论一下吧!

    全部评论(0条)