摘要:由上海报业集团作为指导单位、界面新闻主办、梅赛德斯-奔驰作为战略合作伙伴的第七届【界面财经年会】于12月18日在上海世博创意秀场成功举办。达观数据有限公司创始人、董事长、CEO陈运文发表主旨演讲《达观AI Agent办公智能体在垂直专业领域的深入应用》。
由上海报业集团作为指导单位、界面新闻主办、梅赛德斯-奔驰作为战略合作伙伴的第七届【界面财经年会】于12月18日在上海世博创意秀场成功举办。达观数据有限公司创始人、董事长、CEO陈运文发表主旨演讲《达观AI Agent办公智能体在垂直专业领域的深入应用》。
主旨演讲实录DATAGRAND
大家下午好,我是达观数据的陈运文,今天很高兴就来到了咱们界面的现场,给大家分享一下达观数据在人工智能尤其是在办公Agent的领域,我们一些深度的思考和对未来的展望,我自己以及我们创办的达观数据一直在从事办公智能化相关的处理工作,经过几年的发展,我们在行业里面也成功研发出了很多数字化的白领,让这些数字化白领走进千行百业,为他们提高工作效率去赋能。我们做的这些工作,大家看我们最终实现的效果,大家看一下,每一张图所呈现的,原来我们办公室有大量的白领坐在格子间里,朝九晚五八个小时,很辛苦日复一日的从事这些办公室里的工作,现在我们的数字化员工装在这里,通过学习和模仿我们人类的这些工作的规则和专业知识,它可以自动去完成相关的工作,所以这个是我们看到的我们实践过程当中的一个突破。后面的话它其实会用到我们很多的技术,比如说,大家看到我们的这些文档资料处理的相关技术,我们这边做了一个人机协同对比的一个案例,左边是一个白领,右边是我们的AI Agent产品,做同样的一个工作,我们来比数据,大家看到,我们通过自动化去做相关的工作,可以非常好的模仿白领去完成流程的自动化操作。
大家看,如果做一个人机对比的话,看到我们的智能办公系统它的工作效率是我们人类的30倍以上,在同样的时间里面,人工处理完1份文件,智能体可以处理完30份,这是非常直观的一个对比。今天我们提到要实现非常全能的专业的办公操作,我们觉得它有三个核心的技术点,给大家分享一下。第一,我们首先让智能体能够像人的眼睛一样能够去阅读理解文章内容,第二,我们需要让智能体,像人类的大脑一样去理解文档资料的能力。第三,我们需要智能体可以像人类的双手一样,能够去模仿键盘鼠标的这些操作,去完成在电脑前的工作,所以眼睛、大脑、手三位一体,但是最终我们觉得需要的是专业知识。
因为办公领域的这些工作,它强调的是非常深入地了解各行各业各领域的专业知识,所以不管是眼睛到手,我觉得都是要足够专业才行。给大家拆解来看一看。第一,拆解文档,我们让计算机要通过学习各行各业的专业知识,提炼出语言的知识图谱和专业技能,去完成智能化的应用工作。现在我们的做法是我们会把一个单位里面的各种的规章制度文档、专业报告、邮件汇总在我们的一个智能知识管理系统当中,用这个系统去汇集单位底层的大量的数据资料,因为各行业的专业知识就沉淀在这些文档资料里面,有了文档资料以后,我们会有Agent去阅读理解这些文档,进行一个文档的智能处理。
我们今天机器人正在处理这个文档的内容,大家看到我们这边有大量文档的版面理解、表格的一些处理,复杂的一些要素需要进行分析等等,这些工作我觉得需要有一双敏锐的眼睛,让我们的智能体能够真正能看懂里面所有的这些细节,这个地方的话,我们也开发出了很多复杂版面表格的知识理解技术。比如说,如果让我们的数字化员工去自动去填这样一个表格,打开这个表格里面,它的单元都有复杂的嵌套关系,就需要我们的系统能够去拆解两个元素,理解每一个单元都要填什么,然后才能自动化去完成相关的工作。
还有像这些复杂的印章、水印、签名、数字等等这些信息,都需要我们的办公机器人能够识别文档的各类元素,对各种形态的内容进行自动化的一些工作。其次,我们有了一双眼睛以后,还要有聪明的大脑,需要有我们专业化的垂直的大模型,对文档的数字、文字关系的进行理解和分析。我们都知道我们很有可能看懂每一个汉字,但是我们不理解汉字组合在一起所构成的专业知识的含义。比如说在在金融领域,我们有这样的场合,每个字我们都认识,但是它到底是怎么算的,需要有专业的模型才能支撑对这些专业文档资料处理工作,我们自己开发的超级战略模型,强调的是在垂直领域具备专业能力支持,所以我们通过大量的专业知识的预训练,通过垂直的知识的检索增强,以及开发出垂直的应用系统,这些针对垂直专业领域里面的定向的工作,来大幅度提升他们的效果,今天我们曹植大模型也在垂直领域里面得到了非常好的落地应用。比如说在金融领域里面,我们通过训练垂直领域的大量的数据,来提升在金融领域里面特定场景的效果。
这边我们可以看到我们在比如说注册会计师,在证券业务经理,在银行、在信贷等等这些专业领域里面的文档资料处理的效果,通过强化的训练,能够达到一个顶尖行业里面最顶尖的水平。另外,我们在计算机自动处理专业文章的时候,开发出了更强大的一个文档逻辑切片的功能,才能够让计算机在检索增强的时候,找出来对当前的资料问题最关键的要素进行抽取,我们这边对比的是不同的片段里面,计算机通过更合理的切片方法,能够得到一个更好的处理的价值。这个是我们的多路由问答,在很多单位里面属于他们专业的数据报告和数据问答的时候,我们整个的处理流程用到了NL2SQL相关的这些技术来完成这种专业文档资料的一些问答审阅处理的相关工作,并且可以找出原文来做一个更扎实、更有依据参考。背后我们用到了很独特的技术,值得一提的是,我们提出了置信度感知的相关技术。我们也和复旦大学联合成立了实验室,共同来探索前沿的技术发展,最新的一些成果,我们也发表在科学杂志以及一些全球顶尖的学术会议上,我们现在的多路由的数据库问答,很好的帮助企业可以让领导更快的了解单位的各种数据资料、报表的一些问题,它能够进行更精准的解读和更全面的分析。第三,我们让AI来模仿我们的键盘鼠标的操作,我们这边会用到RPA和AI一键进行相结合的技术,因为我们人很多的这些工作,它并不是由一个岗位的员工来做从事的,往往很多复杂的工作是需要一个单位里面的很多员工,通过接力的方式来完成复杂任务的。同样我们今天我们也通过一个多任务管理和调度的一个控制中心来管控复杂的任务流程,我们有很多的Agent可能做的第一步,有的Agent才能做第二步,有的Agent做第三步串联在一起,能够形成一个复杂的专业用的数据步骤。我们今天的成绩在很多专业领域里面写报告、审核材料、分析内容、填报数据等等这些工作都能够非常好的提高工作的效率。
比如说大家看到我们今天计算机Agent在写专业的一个项目报告,我们Agent可能要更精准更快,质量更高。说到质量,我们今天还有短片来对比我们人的工作质量和我们的办公智能体的工作质量。这一块我们一起对比一下,因为我们人经常会开小差,容易疲劳,所以我们人的工作质量它是起伏不定的。但是我们的Agent能够24小时不间断的非常可靠的从事相关工作,所以这样的高质量的工作场景下, Agent的工作效率要远远超过我们人类的效率。所以我们通过Agent,在很多单位已经在修改他们内部的工作流程了,很多单位以前工作流程是一个任务来的,由一个团队一个部门来完成。现在的工作是一个任务来了,先由Agent,我们的数字化员工去工作,工作完以后人工再消化内容做最后的确认工作。我们总结了它的价值,非常明显,它可以提高效率,可以控制风险,可以降低成本。所以在很多企业里面,现在可以看到很多我们开发的Agent,在一个单位的各个工作岗位上面,现在正在24小时不间断的去完成各种的材料填报、内容审核、数据处理的一些相关工作。所以我们看到专业的这种知识服务、专业的知识管理、大模型、RPA等等,这些底层技术,我们要有机的把它融合在一起,开发出非常聪明的智能的数字化应用,把眼睛、大脑和手结合在一起,去创造价值。今天我们的智能办公体正在各行各业开始落地,发挥作用,我们已经在很多行业里面成功开发出来的各种各样的数字化的智能办公系统。这些办公系统能够非常好的解放我们在繁琐重复工作当中的投入的时间和精力,能够把我们人类解放出来,从事更有价值的工作。这个工作我们觉得在未来的2-3年时间,一定会在更多的企业和单位里面去落地生根创造价值。这个是我今天报告的最后一页,这一页大家看到左边放的是毕昇,他是中国宋代国际印刷术的发明者,右边是体现我们智能办公体的这样一个机器人的形态,我们想通过这样一个跨越1000年的队伍,表达今天我们的智能办公体系和1000年以前的活字印刷术是一样的,它通过一种效率更高的方式,来达到我们文字资料处理的效率革命。不管是写还是传播还是审核,都能够成倍的提升效率,所以我们相信未来会有越来越多的智能办公体走上千行百业,去我们单位的各个工作岗位,为我们赋能。在此做个预测,我们相信在10年之内,有50%以上的办公的任务都将由我们的智能办公系统来完成,我们期待那一天早日到来,我们达观数据也将为此而努力。谢谢大家。
来源:知识图谱大发明家