世界出版

生成式AI爆热 英美书业密集推动相关政策

编者按 欧洲议会今年6月通过的《人工智能法》(AI Act)提案,要求OpenAI的ChatGPT和谷歌的Bard等大语言模型在欧洲国家运营时应更加透明,以确保用于训练模型的内容尊重版权人的基本权利。

10月,欧洲作家协会(EWC)、欧洲出版商协会(FEP)及欧洲与国际书商联盟(EIBF)再次呼吁欧洲各立法机构抓住该提案契机,确保生成式AI的透明度,为欧洲公民创造更安全的网络环境。欧洲与国际书商联盟指出,生成式AI模型以模糊和不正当的方式开发,导致作者和出版商的上千万种版权内容未经允许被非法使用。这种做法影响了版权所有者利益,为大规模制作错误、有偏见,甚至危险的内容提供了便利。保持透明度对于公平、安全地开发AI系统非常重要。该联盟提出,对用于训练AI的输入数据保持透明是确保输出质量和合法性的唯一办法。各成员国必须借此契机敦促生成式AI开发商结束非法获取数据及对数据清洗和滥用的行为。

英美书业各界近期也积极展开行动,推动出台规范AI应用的各项政策,并共同研讨AI对出版各领域带来的颠覆性变化及未来的各种可能性。

9月底,美国《出版商周刊》举办主题为“AI:大众出版的革命及机遇”的研讨会,围绕AI与出版业以及AI将对编辑、营销和生产带来的影响等问题展开讨论。与会者认为,AI将是出版业的一个转折点,它可以进一步增强和优化行业的触达率,使其更个性化并以读者为中心。明年2月,《出版商周刊》还将举办关于AI实用工具及其解决方案的论坛。届时,围绕AI的讨论将更为务实有效。

“AI规则落地后才会得到广泛应用”

在关于AI与出版业关系的讨论中,出版人兼作者米歇尔·巴斯卡尔(Michael Bhaskar)表示,随着大语言模型首次模仿人类思维推出生成式AI,它给出版业带来了“地震”效应。然而,只有当管理层针对AI应用制定严格的规则后它才会真正与出版业产生交集。

企鹅兰登AI及机器学习助理凯瑟琳·威尔登(Catherine Weldon)表示,AI给人类创意领域带来挑战,也产生了更大影响。大语言模型“炮制”出大量信息,需要对这些内容的准确性进行审核。

约翰·霍普金斯大学出版社执行总监芭芭拉·克兰·蒲伯(Barbara Kline Pope)被AI潜在的可能性所吸引,她表示,现在仍处于AI发展的初期阶段,其团队成员都希望制定AI相关的工作规则。大语言模型会放大社会存在的结构性种族歧视和偏见,需要对AI生成内容是否有偏见进行审核。AI在内容创作、营销、生产、数据分析等方面都有可能改变出版业。AI可以让营销更有创意,也可以通过营销让老书和期刊焕发新颜。AI还可用于内容总结、事实核查、情节描述、人物描写,并在一定程度上协助文字编辑润色。

约翰·霍普金斯大学出版社出版运营总监戴姆·布鲁姆(Diem Bloom) 表示,AI可用于生成索引等辅助性内容,虽然该做法已推行,但还有提升空间。卡斯多夫联合公司(Kasdorf & Associates)负责人比尔·卡斯多夫(Bill Kasdorf)表示,生成式AI的主要缺点是需要润色,还需要由人审核AI生成的内容。与其说AI替代人,倒不如说AI需要更多人来核实内容的一致性。他表示,AI有3个更好的应用场景,分别是规模化、日常工作和在某项任务中抢占领先优势。

在一场关于“AI、作者与出版的法律环境”议题的讨论中,Cowan DeBaets Abrahams & Sheppard公司娱乐兼艺术领域律师斯格特·舒尔德(Scott Sholder) 探讨了AI、创作和出版在法律方面的应用场景。他曾以作者身份起诉Open AI公司,解释了法律条款中对保护版权人权益和侵权行为的定义,指出现有法律难以划分违法的界限。他还讨论了决定合理使用的主要内容,包括使用的目的和特征、版权作品的特点、复印作品的实质性、潜在市场的使用效果或价值。他指出,合理使用最关注创意,有作者担心他们的创意被机器取代,还有作者提出应建立把AI处于可控范围的防护栏。作家兼评论家西恩·迈克尔(Sean Michaels) 表示,如果是在一个作者无须担忧资金的理想世界,那作者无须考虑生存问题,也不用从创意层面考虑AI问题了。

沃顿商学院副教授伊桑·莫里克(Ethan Mollick)认为,AI无处不在却难以被发现,而AI大语言模型更关注预测。每个人要更多地使用AI并遵守其使用原则,并用对待人的方式对待AI。

图书编辑:AI用于简化编辑流程

在图书编辑环节的讨论中,多位人士表示,各种形式的AI工具已在编辑部使用,用于简化编辑流程,如缩短完成某项任务的时间、更有效地组织数据。凯文·安德森联合公司(Kevin Anderson & Associates)执行编辑斯蒂芬.S.鲍威尔(Stephen S. Power)表示,AI的主要缺点是,不擅长撰写文本,它主要为回答用户提问生成一般性文字。编辑助理会使用AI的概括功能创建营销文案或写作小贴士。在使用AI筛选投稿方面,出版社也遇到依据AI算法不符合其规则的、有价值的书稿会被删除的问题,只是因为书稿中没有某些关键词。

综合公司(Syntopical)创始人兼CEO克里夫·古伦(Cliff Guren)认为,AI可以补充、推进工作流程。古伦预测,出版社将基于旗下作者书目开发自己的大语言模型,基于该模型进行营销。“AI在唤醒我们,要更清醒地认识到,我们要做什么,如何做,以及何处可以提供价值。”

图书春天公司(Book Springs)CEO芭芭拉·鲁埃林(Barbara Ruehling)介绍了该公司与作者团队合作,运用AI帮助作者解决重复性工作,让作者把精力用于创作的经验。“如果我们拒绝AI,那么作者仍会使用AI,很可能产生坏的结果。鲁埃林认为,当10多位作者合著一部作品时,会出现内容相互矛盾的情况,这时就需要一个大平台来更新并对开放教育资源进行本土化改造。

图书营销:AI将用于创意、文案等广阔领域

在图书营销环节的讨论中,参会者表示,营销人员迅速学会了如何将AI作为一种资产,而不是视为挑战,也分享了不久的未来AI将对图书营销的影响。

尤利西斯出版社CEO基思·里格特(Keith Riegert)表示,他花了很多年学习如何用Python编码,但是使用ChatGPT之后,节省了大量编码时间。他也指出,要带着警惕之心使用AI,“工具将迅速发生变化,有一种看法说,未来3~12个月内这些工具将有完全不同的功能。现在对搜索生成体验(SGE)的关注越来越多,我们将不得不面对搜索生成体验在AI作用下的‘大地震’。谷歌正在创建一个网站清单,预计在系统检测后,该网站的有机搜索时间将缩短25%~50%。此外,必应网站(bing.com)在使用AI技术增强其SGE功能。亚马逊也在更新其SGE系统。因此,营销人员必须作出调整,用更新的技术替代标准的SEO工具。

FSB联合公司(FSB Associates)总裁兼创始人福齐亚·伯克(Fauzia Burke)表示,她已在图书营销领域工作了20多年,ChatGPT一出现,她就是最早的使用者。目前她在使用AI开发一个使用数据集创建个性化宣传文案的程序。她还介绍,Otter.ai可以将影音文件转录成文本,StudioShot可以将自拍照转为高清图片,这些都可用于营销文案。但她认为,最好不要让负责IT的技术人员管理AI。还要花一段时间才能将一切整合到创意领域,但是AI发展之快留给我们的时间不多了。

科幻作者E.J.温斯特罗姆(E.J.Wenstrom)表示,Jaspar AI和Writer AI工具都需要很多的参与度。他预测将出现这些工具的迭代产品,基于图片、视频和文本进行训练。“未来AI工具可以做从博客创意到提供广告文案等一切事情。”

生产流程:AI实现生产流程自动化

在图书生产流程方面,与会者表示,自动化是图书生产工具包的主要元素。约翰·霍普金斯大学出版社出版运营总监戴姆·布鲁姆(Diem Bloom)表示,现在的挑战与当初出现电子书和互联网时差不多。生产部门在积极评估和测试,尤其是对于可见性做评估和测试。这是对内容进行清洗和标注,“我们与如此多的数据和内容方合作,到了生产环节,无论是创建索引、元数据、关键词还是纯文本,生成式AI只能帮助缓解工作量,尤其是在交付期限前完成任务。AI没有减少人类的岗位,相反,AI会给我们带来更多工作。”

特雷德维尔公司(Treadwell Media Group)总裁肯·布鲁克斯(Ken Brooks)预测,AI将大大缩短图书推向市场的时间,大大增加产能并降低生产成本。AI将被收入工具包并整合到工具中,提高生产效率。生成式AI有助于生成图书元数据、简化流程并提高图书的可见性,因此在改变工作流程、业务模式和产品方面有巨大可能性。

“从机器学习到深度学习,生成式AI正被应用到实践中,以提高效率和规模。”卡斯多夫表示,AI的更多应用有助于简化生产流程,实现规模化、便捷日常工作以及开启一个新任务。他指出,很少有人提到人工介入,这是这个领域经常使用的,也是AI的正确应用方式。“我们要在流程开始和结束时进行人工监控。”文本或Photoshop格式被广泛用于图书制作中,出版商要知道生产供应商正准备将AI融入更大范围的生产流程中。他强调,标准是凌驾于一切之上的,因为标准一直在变化,AI可以帮助理顺这些变化。

链接

特雷德维尔公司总裁肯·布鲁克斯预测AI应用的具体领域:

1.生成式AI可准确识别及提取关键术语,分析客服收到的长文电邮内容。

2.生成式AI可分析经销商合约, 可检查出版合约期限和版权许可类型,提取合约中版权许可及条款内容。识别合同中的专有术语,大大降低合约审阅时间,丰富版权及书目管理等内容。

3.为制作电子书清洗并提取文本、识别竞品图书及书稿中存在的DEI(多样、平等、包容)等潜在问题。

4.生成式AI可以检查从PDF或扫描文件提取的文本中的字符编码、错误换行或缺失等问题,还可进行数据分析。AI模型可以快速完成过去需几周才能完成的大数据分析。

5.AI可与推荐引擎相结合,作竞品分析。即根据一两个词的指令生成潜在竞品书单,发现风格及内容相符的书稿,并将竞品图书收入数据库。

6.AI还可广泛应用于书目开发、销售、营销、运营及财务领域。但必须讨论AI带来的伦理问题及其限制性。