好莱坞剧本读者与机器的斗争

莫里斯·查德莱恩 (Morris Chapdelaine) 的办公桌上总是堆满了令人望而生畏的剧本。作为一名独立制片人,他每周阅读大约三本,并将其余的内容分发给实习生和电影系学生,由他们发回详细的报道报告。但他努力克服所有困难。
在一次电影节上,一些朋友建议他研究人工智能来帮助减轻工作量。 “我对任何与人工智能相关的事情都保持距离,”他说。 “有些让我害怕。”
但查普德莱恩做了一些研究并最终报名参加了 绿灯覆盖范围,它使用大型语言模型来总结剧本,并按 1 到 10 的等级对情节、人物弧线、节奏和对话等元素进行评分。它甚至给出了一个结论:通过、考虑或推荐。
他发现人工智能比人类的反馈(甚至是他自己的反馈)更诚实,同时它使他的阅读速度提高了一倍。
“这真是节省时间,”他说。 “而且它变得越来越好。”
如果说人工智能做得很好的话,那就是总结书面材料。因此,在开发流程中的所有工作中,最容易受到攻击的可能是第一个:脚本读取器。有一天,该行业最初的看门人可能是一个软件程序。
事实上,机器已经在发挥作用。在 WME,代理和助理使用 脚本感知另一个人工智能平台,用于对提交的内容进行排序并跟踪客户的工作。有抱负的编剧们也开始使用 ScreenplayIQ 和 Greenlight 等人工智能工具来为他们的草稿提供反馈(有时过于奉承)。
在主要的工作室里,人类故事分析师仍然像 100 年来所做的那样,在成堆的提交内容中进行挖掘。但随着人工智能渗透到每个人的工作流程中,他们开始担心自己的工作。
派拉蒙 (Paramount) 的故事分析师杰森·哈洛克 (Jason Hallock) 回忆起他第一次使用 ChatGPT 进行的令人不安的实验,该机器人引发了当前的人工智能热潮。 “我多久会被替换?”他想知道。 “是六周?还是六个月?”
与 编辑协会代表大约 100 名故事分析师的工会,他决定找出答案。今年早些时候,他进行了一项实验。他会要求人工智能工具覆盖一些脚本,然后将它们的报告与人类生成的覆盖范围进行叠加。这是对他和他的同事们能否竞争的考验。
自好莱坞诞生以来,故事分析师就一直是好莱坞的打谷机,将麦子从谷壳中分离出来。人工智能的支持者认为,算法可以使这个过程更加高效、更加客观,从而更加公平,让新的声音被听到,而不是依赖那些将自己的主观品味带到工作中的读者。
但也可能会失去一些东西。人类读者首先会感觉到剧本是否有潜力,角色是否有吸引力,故事是否让你着迷并有新的东西要说。人工智能能做到吗?
“我要寻找的最重要的事情是‘我在乎吗?’”华纳兄弟的长期故事分析师 Holly Sklar 说,“法学硕士不会在意。”
然而人工智能似乎无论如何都会到来。因此,有些人并没有忽视它,而是试图理解它。
“没有人想失去工作,”阿莱格里·罗德里克斯 (Alegre Rodriquez) 说道。 编辑协会 参与哈洛克研究的分析师。 “我们不会把头埋在地下假装它不存在,我们也不会畏缩地等待他们给我们开解雇通知书。我认为人们正在掸掉身上的灰尘并说,‘我如何留在这个游戏中?’”
卡蒂克·霍桑纳格 (Kartik Hosanagar) 是沃顿商学院商学院教授和互联网营销企业家。他还是一位电影爱好者,抽屉里有几个剧本——一部关于一家初创公司的剧情片和一部关于被谋杀的印度外交官的惊悚片。作为好莱坞的局外人,他很难推销自己的剧本。这促使他开发了一种算法,通过客观评估人才来创造公平的竞争环境。那次冒险并没有成功,但下一次成功了:Hosanagar 开发了 ScriptSense,现在是最热门的人工智能脚本平台之一。宣传语:“评估 100 倍的剧本。”
“有一大堆未读的书,”霍桑纳格说。 “这是清理堆积物并找出将注意力集中在哪里的好方法。”
今年 3 月,Hosanagar 将他的公司卖给了 Cinelytic,这是一家正在将 ScriptSense 集成到一套管理工具中的服务提供商。 “这是为了节省时间,”该公司首席执行官 Tobias Queisser 说。 “机会被搁置了,因为没有足够的能力来审视所有的东西。无名的作家永远不会有机会,因为他们的剧本不是由顶级机构提交的。”
ScriptSense 提供摘要、角色细分、对比和选角建议。语气比较中性。它不提供赞扬或批评。
“我们的设计理念是我们不会为您做出决定,”霍桑纳格说。 “你永远不会看到一个声明说‘太棒了!’或‘拒绝它。’”
面向编剧的平台有着不同的理念。 Greenlight 创始人 Jack 张相信人工智能能够做出批判性判断。 “人工智能真正擅长的是取事物的平均值,”他说。 “在反馈方面,你试图接触到更广泛的受众。你希望普通人喜欢你的工作。这就是人工智能真正发挥作用的地方。”
ScreenplayIQ 提供定性评估,但不提供数字分数。该节目总结情节并评估人物的“成长”和“深度”,帮助作家从局外人的角度看待自己的作品。 “我们的目标是为那些感到自己正在挣扎并需要支持的作家提供支持,”开发者盖伊·戈德斯坦 (Guy Goldstein) 说道。 “它为你的剧本举起了一面镜子。你带着一个意图写了它;它正在看看这个意图是否实现了。”
为了测试人工智能平台,哈洛克需要脚本。编剧对于将素材输入人工智能模型可能很敏感,因为他们认为这些素材将用于训练。但一位亲密的朋友愿意为此提供一些旧剧本。其中一个是 Syfy 频道未制作的关于杀人昆虫的剧本。另一个被定位为“外太空的‘黑暗之心’”。作者并不介意人工智能是否接受过这方面的训练。
“他说他希望这能让人工智能变得更笨,”哈洛克说。
他收集了其他一些数据并将它们全部交给了人类分析师。然后,他将它们的报道与六个人工智能平台生成的日志概要、概要和注释进行了比较。结果既令人鼓舞又令人不安。
人工智能生成的日志与人类的日志没有什么区别——甚至可能更好一些。人工智能生成的概要开始显现出差异。 “他们的论文质量往往达到 11 年级,”哈洛克说。 “它使用相同类型的结构,例如‘我们的故事开始于……’”
剧本越复杂,人工智能就越有可能出错——将一个角色的行为错误地归因于另一个角色,并产生幻觉的情节点。
当谈到笔记时,人类轻而易举地赢得了胜利,这需要实际的分析而不仅仅是蒸馏。哈洛克说,人工智能项目“几乎全面失败”。
《太空中的黑暗之心》剧本虽然20年前就在好莱坞流传但没有卖出去,却得到了“推荐”。这是一个一致的问题。罗德里克斯说,这些模型并没有提出不加掩饰的批评,而是“偏向作者”。
“他们肯定会告诉你一切积极且有效的事情,”她说。 “但当你必须认真解决问题时,他们不一定能识别出问题。”
在某些情况下,人工智能程序不会进行评估;他们在啦啦队。
“它具有小狗的品质,”哈洛克说。 “它想取悦你。”
一部浪漫喜剧被 AI 称赞为“一个引人入胜、精心制作的成长故事,平衡了幽默、心碎和三十多岁时苦乐参半的现实。强大的人物发展使这部作品脱颖而出。”
与此同时,人类读者则感到平淡无奇:“拉斯维加斯女性朋友的熟悉模板。有潜力成为轻量级流媒体内容,尤其是与西德尼·斯威尼。语言粗俗,但笑话不难理解;缺乏《女孩之旅》或《伴娘》的味道。”
张为 Greenlight 的品味辩护,称提交给该平台的脚本中只有 5% 获得了“推荐”。 “这样的人很少,”他说。 “我不会说存在巨大的通货膨胀。”
Hosanagar 表示 ScriptSense 不提供建议的部分原因是人工智能可能过于阿谀奉承。 “人工智能能否达到真正至关重要的地步?”他问道。 “我认为它可以到达那里。我们还没有到达那里。”
罗德里克斯说,许多分析师对这项研究感到鼓舞。人工智能可能更快,但它无法从一堆东西中挑选出原创和精彩的东西。
“仍然需要有人来查看这些报告并审查材料,”她说。 “它并没有像他们想象的那样节省那么多时间。”
那些过度依赖它的人可能会错过一些伟大的事情。但这项研究并不完全让人放心,得出的结论是,“工作室可能会倾向于放弃质量和准确性,转而追求便宜和快速。”
人工智能模型的制造者表示,这些担忧是多余的。 “这并不是要抢走工作岗位,”奎瑟说。 “我们认为这是对人类的增强。”
Avail 首席执行官 Chris Giliberti 表示,故事分析师已经在使用他的人工智能平台来执行日常任务,这可以腾出时间来开展更具挑战性的分析工作。 “这是不可阻挡的,”他说。 “秘密已经泄露。这让人们的工作和生活变得更加轻松。”
然而,斯克拉尔对事情的发展方向感到担忧。当今的高管重视人力投入。但年轻一代可能会更习惯人工智能摘要。她担心好莱坞的一些人——“那些不了解我们所做的一切的削减成本的人”——会认为她的角色是多余的。
“这就是让我彻夜难眠的原因,”她说。
Responses