AI在出版业的应用和问题

360影视 2025-01-07 11:02 3

摘要:2025年1月6日,“书业守正拓新径,新质发展向未来”研讨会在京举办。会上,中国出版传媒商报社执行董事(社长)、党委书记、总编辑宋强发表了主题演讲《AI在出版业的应用和问题》。以下为演讲内容。

2025年1月6日,“书业守正拓新径,新质发展向未来”研讨会在京举办。会上,中国出版传媒商报社执行董事(社长)、党委书记、总编辑宋强发表了主题演讲《AI在出版业的应用和问题》。以下为演讲内容。

日前,北京市教育委员会等十七部门发布《关于加强新时代中小学科学教育工作的二十条措施》,其中提到,要着力推进人工智能赋能科学教育,开发面向学生的科学教育智能体,为教师教学提供AI助手,为学生学习提供AI学伴。可以说,AI在中国越来越受到重视。在出版业也是如此。

需要说明的是,本文大部分材料和案例是基于《中国出版传媒商报》《国际出版周报》的报道,同时参考了一些其他材料。

首先,我们先了解一下AI在国外出版业使用情况,再与国内情况作对比。

01 AI在国外出版业使用情况

在国外出版业,大致分为支持和谨慎两个阵营。持谨慎态度的方面,主要是担心版权问题。例如在2024年11月14日,欧盟首部《通用人工智能业务守则》(初稿)发布,详细说明《人工智能法》对通用人工智能模型和具有系统风险的通用人工智能模型提供商的规定,制定AI模型训练内容的透明度原则。Stability AI前高管艾德·纽顿-雷克斯称,从2022年开始,一些公司的大模型开始商业化,以学术研究的名义,通过“文本和数据挖掘”版权例外抓取数据训练。

2024年10月,Fairly Trained平台与包括AAP在内的多家创意权利组织合作,发起大规模的创作者维权声明,抗议AI公司未经授权使用版权内容训练模型,约3.6万名创作者签署了声明。目前美国已有30多起针对AI公司版权侵权的诉讼,在这些案件中,AI公司普遍以“合理使用”为由进行辩护。一些政府迫于大型科技公司的压力,正在考虑通过立法途径对版权法做出宽泛的例外规定,包括“避风港原则”以及“文本和数据挖掘”(TDM)的例外规定,这不仅会侵占作者和出版商宝贵的知识产权,还有可能导致图书、科技期刊和教材的市场被替代。AI公司取得授权需要时间,不能破坏作者和出版商的利益。

有的出版社对AI的使用持排斥态度。例如德国Cross Cult出版社版权经理邱瑞晶称,在他们与其他国家出版社的合作中,大多数出版社暂时没有使用AI创作,也没有列入工作计划。为保护创作者的内容,一些大型出版集团已在合同中加入了禁止完全使用AI为图书绘制封面和插图,以及禁止使用AI录制有声书的条款。

在支持和持开放态度方面,在应用方面,主要是将AI当做工具来使用,有的出版社已经将技术应用到了出版全流程。在学术及教育出版领域,涌现一波AI工具开发热潮。励讯、威科、培生、施普林格·自然、圣智等国际出版企业均已推出AI工具,如励讯集团(RELX)开发的SciAI、Lexis+AI,威科集团(Wolters Kluwer)开发的的UpToDate AI Labs工具,培生开发的AI教师工具,以及施普林格·自然推出的Geppetto和SnappShot 2款AI工具。施普林格·自然授权作者使用GPT(生成式预训练模型),出版了德文书《GPT在财务、合规和审计中的应用》。各企业将生成式AI引入其数字化平台,基于自有的、值得信赖的内容资源,回答用户提问并提供有价值的相关信息,帮助用户加快科研进程并作出更精准、明智的决策。为保障AI使用的安全,这些企业逐步制定了用于内部管理的AI准则,来负责任地推动AI发展,,包括在隐私和安全,透明度和可解释性,治理和责任,以及公平等方面。

在大众出版领域,出版机构也开始推进AI在图书出版流程中的应用。如美国哈珀·柯林斯授权微软公司使用其非虚构类老书用于大模型训练,西蒙与舒斯特收购的荷兰VBK出版社使用AI翻译荷兰语图书。

以色列技术初创公司书脊(Spines)在获得A轮1600万美元融资后,也将在2025年使用AI帮助自出版作者出版8000种图书。以色列Spines利用AI实现了大部分出版流程的自动化,Spines的AI能够处理编辑、校对、排版和封面设计等基本任务。通过Spines的平台,作者们可以在两周内出版作品,成本最多可降低30%。Spines的AI封面生成工具能生成吸引人的作者简介,同时还能为图书的封面和封底进行适当的艺术设计,为作者提供70多个范例以供选择。其次,Spines的AI校对工具会扫描作者稿件中的语法错误、拼写错误和错别字,确保最终版本没有错误。在图书出版以后,Spines还为作者们提供AI营销工具,包括营销功能和版税管理功能等。此外,Spines还为作者们提供了AI驱动的有声书制作工具,作者们能够自行选择配音,然后让AI生成有声书,之后作者还可以随时编辑AI有声书的内容,或选择Spines的校对服务。(来自微信公众号“共同虚拟”,2024年5月14日。)

02 国内出版业AI应用新动态

(一)赋能出版生产流程

众多出版机构早已将AI应用于策划、审校、营销等出版生产流程。目前来看,AI应用已覆盖出版生产全流程,且校对、图书设计等细分流程中又有新突破。

1.选题策划

部分出版机构已经开始尝试引入AI技术进行选题策划,通过AI对大量数据和市场趋势的分析,筛选出一系列潜在的选题方向。海豚出版社使用AI技术帮助编辑来构建图书框架和内容方向、帮助形成选题策划方案,并且辅助生成图书简介、宣传与推广文案等内容。他们在使用AI进行选题策划时,会先选出一些题目,再由工作人员进行比对筛选,大大提升了工作效率。

2.编辑加工自动化

在编辑加工环节,AI技术可以实现自动校对、编辑加工等功能,是出版行业AI技术应用最为广泛的一个层面。如,人民卫生出版社推出的人卫标准临床专科知识库,原先需要两年完成的编写工作,借助人工智能之后用6个月便可完成。中国教育出版传媒集团研发的智能编校平台,可提供用户画像、作者画像、多模态智能审校等技术支持,进一步解放和发展了编辑生产力。

蜜度研发出国内首个专攻智能校对场景的垂直领域大模型——文修智能校对大语言模型

从智能校对平台提供方看,典型案例包括蜜度研发出国内首个专攻智能校对场景的垂直领域大模型——文修智能校对大语言模型。2024年,文修2.0首次达到70亿参数规模,训练数据规模约8000亿词符,并通过构建更完善的数据质量评估模型,保障了内容多样性和数据质量,“90秒校对审核20万字”。

2024年,北京北大方正电子有限公司正式发布方正智能审校V5.0,新增字幕审核和图像质量检测功能,能够针对视频中的滚动字幕进行文字识别和文本审核,能自动去除台标等干扰区域,对视频中的文字内容进行审核。同时,不仅可以实现对word文档、排版文件、图片文件、视频文件、音频文件进行单个文件或多个文件审校,对word稿件进行内容核查;还可以实现对包含多个不同类型、不同格式的文件夹进行快速审校。方正智能审校5.0版本还有方正智能审校全新智能硬件方正AI“小方盒A1”,满足用户多样化的使用需求。

果麦文化研发的人工智能校对工具“果麦AI校对王”在中文校对领域展现出优异性能,针对中文的语言特性进行了多层次的特别优化,引入超过百亿字级别的壁垒级训练数据 “中文出版物校对全流程数据集”进行高精度训练。“果麦AI校对王”目前已经进入公测阶段,在纳入果麦文化书稿质检标准流程的同时,超过20家出版单位投入使用。

海豚出版社在校对环节充分应用AI技术,通过AI与人工校对的协同作业,实现了较高的错误检测率,黑马校对软件在其校对中扮演了核心辅助角色。

3.排版及插画设计智能化

在排版设计方面,AI技术能够根据预设的排版规则和样式,自动完成书籍的排版工作。通过识别文本内容、章节结构等信息,AI能够智能调整字体大小、行距、段落间距等参数,使排版更加美观、易读。此外,AI还能根据文章内容智能推荐或生成配图,使图文结合更加紧密,提升阅读体验等。

福建少儿社《森林画报》全套4册总计400张图片,全部由AI生成

在插画设计方面,绘画作品成为出版机构应用AI的主要场景,各出版机构结合自身实际,伸出了尝试AI绘画的触角。2023年,福建少儿出版社率先于旗下低幼杂志《咪咪画报》上刊载了一篇名为《熊》的全AI绘图科普作品。2024年初,福建少儿社将AI板块业务正式立项,成立了“AI应用与美术编辑室”,并建立了“辅助出版AI项目”。其间使用AI工具为福建少儿社20余种图书创作了包括封面、插画等多种类型的图片。如《森林画报》全套4册,每册6印张(96码),总计400张图片,采用满版设计,全部由AI生成,历时4个月。

2024年,童趣出版公司有多套图书使用AI绘图进行插图绘制及版式设计优化。例如,与“亲近母语”合作出版的分级诵读绘本《小步日诵》,全书384幅插画,均采用AI绘图与人工调整相结合的方式完成。

童趣出版公司《小步日诵》全书384幅插画均采用AI绘图与人工调整相结合的方式完成

北京看山科技有限公司创始人梁翃为多家出版机构提供绘图服务,“AI绘图已将复杂的人工绘图成本降低80%以上”,效率提升最高的插图类型是标准化插画,如词汇类、字典类配图,画面风格统一、插画内容简单不需要复杂的场景、动作、表情,这样的插画类型相对于人工效率提升,可达百倍以上。其设计团队只有10个人,1个月可以画1万张图。相对于原有人工插画师,平均效率提升10~30倍。目前已经与童趣出版公司合作了绘本插图设计,与吉林科技出版社合作了儿童科普图书,与中国少年儿童新闻出版总社合作了期刊内页设计,与吉林出版集团外语公司合作了“快乐读书吧”丛书插图设计。

4.营销推广精准化

在营销推广方面,AI技术能够实现精准营销和个性化推荐。通过对用户行为数据分析,AI能够识别出用户的阅读偏好和购买习惯,并据此推送相关的书籍信息和优惠活动。此外,AI还能通过社交媒体、在线广告等渠道进行智能投放和精准推广,提高营销效果和销售转化率。例如,数传集团已经训练出非常成熟的发行营销AI助理,不仅能在各个新媒体渠道进行营销推广,实现即时营销文案撰写、短视频和直播内容自动生成、平台运营政策快问快查,更能通过算力对大数据进行分析计算,精准描绘用户画像,为读者进行个性化推送。

中华书局“花木兰3D超写实数字人”

随着数字人技术逐渐成熟与落地,越来越多出版机构针对主力图书方向,打造多人设、多形象的数字人营销矩阵。如中华书局继推出“数字人苏东坡”后,又投入开发“花木兰3D超写实数字人”;数传集团AI小助手“书小二智能图书数字人”在百余家出版单位推广应用;东方出版中心的AI数字主播“东东”“芳芳”、河南大学出版社的数字人“AI河南文化研究员”、广西师范大学出版社集团的AI数字人“小珂”、果麦文化的“AI读书数字人”、四川人民出版社的AI数字人“皮艾可”、中信出版的“凯文·凯利数字人”、中图云创智能科技(北京)有限公司的“马可波罗数字人”等应用探索,均是出版人对科技应用与文化创新的一次革新。

中图云创智能科技(北京)有限公司的“马可波罗数字人”

5.全流程内容生产平台智慧化

近年,中信出版集团自主研发了“智能出版平台”,将版权研究、内容生产、视觉生成、营销策划等关键业务环节与AI相结合,大幅提高图书出品质量、生产效率和推广效果。其中,针对出版业务全流程的智能化重构,搭建了万象亿新智慧出版体系,作为数智化的核心产品和业务基座。

高等教育出版社于2023年初,开始建设高教社H0大语言模型,在H0模型基础上通过增量预训练、微调等方式构建H1学科大模型、H1编辑出版大模型,提前布局多模态大模型,同时推动各平台联动,拓展人工智能出版领域场景应用。社内数据中台为大模型技术提供丰富的数据资源,大模型为数据中台提供更加智能、高效的数据分析和处理能力。

目前已有多家出版机构接入百度“文心一言”,尝试将人工智能大模型运用到选题策划、编辑校对、美术设计等出版流程。还有部分出版单位基于自身的业务需求,自主投入建设人工智能大模型。

(二)丰富出版产品形态

1.大众出版领域:交互式数字人成新趋势

应用AI技术的融媒体图书在各大出版机构遍地开花,其中,基于图书内容制作与读者互动交流的数字人已成为不少出版机构的新尝试。华东师大出版社自2022年起开始布局“AI智慧教辅”系列,目前已成功在教育汇APP上线“智慧AI”栏目,为用户提供“AI智慧批作文”服务。

二十一世纪出版社集团与江西省出版传媒集团旗下的朗知传媒公司合作,探索AI绘图运用,与浙江大学及深圳快语科技公司合作开发“智能交互阅读平台”项目,将优质图书进行智能化内容转换,通过自研的“读者服务号”平台为读者提供伴读机器人。

中图云创公司基于《马可波罗行纪》一书的内容“复活”了马可·波罗,其独家数字人形象在2024年7月的“马可·波罗奇迹之旅”展览上首次亮相。马可·波罗数字人可以与观众进行实时对话,并亲自为观众讲述700多年前的东方之旅。

童趣与数传集团合作,为《迪士尼经典动画英文电影故事》一书配备了AI学习助手,读者打开学习助手,不仅能够获得该书配套的各种学习资料,还可以与学习助手聊天、提问,进行互动。

少年儿童出版社与数传集团合作推出的《寻找匹诺曹》,读者只需扫描书中的二维码,能与专门为该书量身定制的AIGC数字人“AI诺贝尔”交流对话。

《我的第一个人工智能好朋友》人工智能机器人“哆啦贝塔”

三环出版社在2024年出版的《我的第一个人工智能好朋友》以图画形式科普人工智能知识,并随书赠送搭载人工智能的小程序应用,用户通过扫描二维码进入微信小程序,可以与3D卡通形象的人工智能机器人“哆啦贝塔”进行语音互动。

海豚出版社联合数传集团,以RAYS平台为应用基础,利用微信小程序为互动渠道,用AI技术打造沉浸式角色互动体验,在元宇宙中,读者可以与书中的AI角色进行互动交流。

2.教育出版领域:赋能教育出版,打造全新产品

北京师范大学出版集团与北京京师讯飞教育科技有限公司,结合智能口语评测技术研发了英语听说测试平台“慧听说”。平台采用科大讯飞的智能语音识别与评测技术,对学生的答题语音从流畅度、完整度、准确度、语速等多个维度进行评测,既能给出篇章的整体得分,也能给出语句、单词的得分,方便学生了解自己的不足之处,有针对性地改进提升。

“京师书法”则是京师讯飞推出的一套简单易用的书法教育信息化系统。“京师书法”采用先进的人工智能评测技术,通过构建数据驱动与书法知识引导相结合的方式,构建书法图像深度配准算法与DeepLabV3深度神经网络相结合的笔画语义分割算法,再利用Mask R-CNN卷积神经网络,精确提取细粒度笔画图像的深度视觉特征模式,高效拆解书写字笔画,并基于书法领域的多元评测策略,构建形式化语义,建立多模态语义特征的书法字测评机制,实现了以多特征联合推理为核心的书法字测评算法,大幅提升了评测的专业性和准确性。

“京师书法”使用场景

凤凰出版集团旗下的学科网等公司利用AI技术提供智慧教学应用、效率提升工具和赋能新品。高等教育出版社将大模型技术运用于在线教育和教材,包括智能备课、智能出题组卷、教学资源推送、个性化学习和智能答疑等。AI技术给专业出版领域带来了许多新的机会。

掌阅积极推进人工智能大模型在数字阅读垂直领域的应用,充分利用在内容版权资源、创作者生态、海量用户资源等领域的优势,将国内领先人工智能大模型和公司内外部业务场景进行深度融合。近日,最新人工智能应用功能“掌阅AI辅助阅读”正式上线,在数字阅读“掌阅”APP现有功能基础上,通过调用国内优秀人工智能大模型的生成能力,赋能用户读前、读中、读后等关键环节,贯穿选书、看书等核心流程,并通过“掌阅书童”智能阅读助手实时答疑解惑,为读者提供更加丰富和高效的阅读交互方式。

世纪金榜AI智教智学系统

一些民营机构也在尝试利用AI技术建设自己的大模型,例如世纪金榜发布了AI智教智学系统2.0版,基于人工智能识别技术、大数据算法,为学校师生提供作业的智能批阅、诊断分析、错题重练及精准组卷等服务。在教辅领域,学而思学习机、科大讯飞AI学习机、小猿学练机彩墨版等产品层出不穷,老品的迭代与新品的诞生,将这个市场不断推向高潮。由此, 智能学习机被很多人称为教培行业的第二增长曲线,也成为教育出版机构寻求融合发展的新空间。

3.学术出版领域:辅助学术创作

国内不少出版机构已探索出AI赋能学术出版的新路径。2023年7月,中华医学会杂志社学术期刊出版服务平台正式上线,成为国内首个将AIGC引入期刊采编评审系统的学术期刊出版单位。编辑可以通过这一AI写作检测工具,对所有投递至社内的论文进行扫描检测,查看AI写作的段落以及可疑度。方正电子自主研发的学术出版信息化平台“方正鸿云学术出版云服务平台”。该平台自2019年上线以来,助力期刊不断完善学术传播生态,与Pubmed、Medline、EI、Scopus等60余家第三方实现对接,并与万方文察、中华医学会杂志社等机构携手合作,推动多维度的诚信问题查验,探索在提升学术质量、提高科研效率方面合作的可能性。

中华医学会杂志社学术期刊出版服务平台

中国知网推出了“腾云AI编辑助手”,包括了选题策划、智能写稿、稿件审校、文献阅读、知识问答、知识溯源等功能。在审校功能里,包含了查重检测、AIGC检测功能,用AI写的论文很容易被识别。

03 出版业AI应用难题

人工智能在赋能出版发展的同时,也带来了多维度难题,包括管理难题、技术难题、版权风险、出版数据安全问题等。

1. 管理:管理模式与AI生产脱节

AI技术广泛应用于出版各流程的同时,必然导致出版流程的重塑、人员岗位的调整、组织结构的再造和运营机制的变革,进而倒逼出版管理模式进行调整。出版机构需要在岗位设置、组织架构、资源配置、管理机制等方面有适配AI应用的管理变革。一些出版机构仍然保持传统出版管理模式,这将无可避免地导致管理与生产方式脱节,甚至阻碍出版机构的发展。

2. 技术:AI“智力”不足

目前,AI使用的过程中,面对的主要问题还是AI工具“智力”不足。一是算力不足,导致效率低下,严重时会出现系统崩溃;二是人工智能“智力”有限,现阶段的人工智能在大模型数据和理解力上还有很大局限,在其熟悉的领域有非常惊艳的表现,但在大模型数据较少的领域容易陷入偏差,有时需要大幅度介入人工力量。

数字主播像一阵风已经不再流行,主要原因是技术还不够成熟,人物表情、动作、语音逼真度还不够,整体上过于“套路化”,没有亲切感。数字主播做直播技术也不成熟,无法与用户互动,情感化程度不够。

3.版权:侵权风险未解除

AI生成内容是否应当受到著作权法的保护是近年来知识产权法学界热议的问题,AI生成内容的侵权问题也广受关注。尽管当前我国著作权法并未对相关主体获取数据库的数据作明确规定,但是相关主体获取并使用数据库内的数据仍要事先取得数据库权利人的许可。部分训练数据属于著作权法意义上的作品,相关主体使用这些数据同样要事先取得作者的许可。生成式AI的开发者在面临这一困境时,往往选择在未获取授权的情况下直接使用作品来进行预训练,极有可能产生侵权。此外,生成式AI的生成内容与原训练材料差别不大,二者之间存在实质性相似,生成式AI向多个用户传播该内容可能会存在侵犯作者信息网络传播权的风险。目前,还没有关注到AI公司向出版机构支付数据使用费用的案例。

出版机构在是否接受AI生成内容方面的态度则不一致,有的出版机构明确不接受AI写作的稿件,如上海果麦强调著作权的合规审核流程,明确禁止使用AI稿件,但多数出版机构并未特别强调禁止AI稿件,一些出版机构则通过AI生成内容来提高内容产出效率、降低内容产出成本。例如,9岁的许萌萌在智谱清言、ChatGPT等人工智能大模型产品的帮助下,通过自己设计故事框架,不断提出问题,创作了一本多个章节、近200页的书——《AI少年——火星生存大挑战》,2024年5月在电子工业出版社出版,开卷监控销量当年共售出2929册。

4.安全:隐私与内容现难题

数据隐私和内容安全问题是AI在出版应用中需要高度关注的问题。在数据隐私方面,随着人工智能系统的广泛应用,大量的个人数据被收集和分析,需要建立健全数据隐私保护机制,确保用户的隐私得到充分保护。同时,防止数据被不当使用和滥用,防范安全风险和数据泄露。在内容安全方面,不同的大语言模型由于算法设计不同,可能存在潜在的偏见。这导致它们对相同的问题可能产生不同的答案,有时甚至会维护部分国家或少数群体的利益,从而引发内容安全方面的隐患。

5.专业:垂直数据库未建成

素材库的建设是当前AI技术在出版应用中面临的重要难点。AI应用平台的数据库数据不足导致难以精准地针对客户开展个性化推荐,且推荐内容亦显单调匮乏。此外,技术在生成图片时依赖于素材库的学习,若素材库中缺乏相关内容,AI生成的图片便会出现问题。对于科普类图书而言,在知识点查证上,AI虽能快速提供海量信息,却常因缺乏准确性判断而受限。

04

建议

面对AI技术的发展和应用,作为出版人,要保持战略定力,不用恐慌,也不要一拥而上。我们要达成行业共识,明确AI使用的范围和存在的边界。对下一步工作,有三点建议。

一是形成出版业AI使用规范。对一些用AI创作的图书,要明确标识;用AI工具创作的漫画、插图也要明确标识,要让读者在阅读之前就先了解图书是否是AI创作的。

二是尊重原创,鼓励原创。在某些出版类别,要明确抵制AI创作,例如文学出版领域,我个人是明确反对阅读AI创作的作品的,文学创作是作家观察体验生活、倾注情感创作完成的,读者在阅读中最宝贵的体验就是与作者发生共鸣。我不相信用AI创作的作品会成为“高级货”,即使用所有世界文学名著作为碎片化语料创作完成的作品,也不会有任何价值。

三是与AI公司密切沟通,充分发挥版权资源优势,确保作者和出版社的合法权益和收益。

在国家政策的支持下,在行业协会的引导下,相信出版业在AI技术应用方面会取得更大成绩。

校 对:马 葵

编 辑:陈 麟

复 审:张维特

终 审:宋 强

© 中国出版传媒商报

来源:中国出版传媒商报

相关推荐