发布时间:2023年04月25日 10:33
信息来源:威海市档案馆
浏览次数:
2018年5月,福建福清核电有限公司(以下简称“福清核电”)承担的“机器人技术在文档智能管理中的应用研究”课题由国家档案局正式立项。2019年12月,课题通过国家档案局验收。2021年11月,项目获得国家档案局优秀科技成果二等奖。该课题为电子文件档案管理与人工智能(AI)、机器人流程自动化(RPA)技术的跨界融合提供了可行的解决方案,通过“AI+RPA”技术打造核电行业文档智能机器人的做法,及在电子文件档案日常管理、综合利用和数据分析的应用成果和标准规范,具有推广价值。
研究背景
作为我国自主三代核电机组“华龙一号”示范工程建设运营单位,福清核电肩负着打造我国自主三代核电的标准体系和品牌的使命。妥善管理其建设期间产生的设计、调试、维修、运行文件档案,为核电厂的技术改进提供可追溯性的原始记录,为核电厂安全稳定运行和中国核电“走出去”战略奠定基础,是福清核电文档人肩负的历史使命。在此背景下,福清核电将“AI+RPA”技术引入文档管理领域,打造“文档管理、综合利用、数据分析”服务型、智慧型机器人,以服务档案业务、数据采集、数据管理、数据分析。
课题研究的主要内容
课题研究以“华龙一号”建设运营阶段文档数据为基础,尝试使用文档智能机器人对核电行业使用最广泛的文种进行智能化管理的探索和研究,实现对纸质文档、电子文件等不同来源的文档数据原料的采集及预处理,将日常文档管理中繁琐、重复性的工作,遵照成熟的技术规范与标准,通过智能机器人的“眼+脑+手”技术达到全部或部分取代的效果(如图所示)。
总体技术框架图
文档数据(原料):指传统的纸质文档、多媒体文件或者通过企业内容管理系统(ECM)、企业资产管理系统(EAM)等方式记载的文档数据。
技术规范与标准:指国家、文档领域及行业颁布的用于规范文档管理工作的标准、规范及管理制度。
信息采集预处理(眼):对文档数据(原料)所承载的信息通过OCR、图像识别等方法进行初步识别,使用自然语言处理的技术手段对文档信息进行粗加工。
数据分析(脑):文档智能机器人根据特定的机器学习算法对文档数据(原料)进行分析处理,通过精加工从海量数据中挖掘出有价值的信息和计算结果。
前端应用(手):是文档智能机器人与用户进行交互的工具,通过前端应用系统、RPA等技术手段,将大脑分析的结果以用户能够接受和理解的方式进行合理的呈现和输出。
结合实际业务场景,课题组梳理出智能文档著录、智能批分与分发、智能文档编研、智能生产文件利用4个研究场景。
智能文档著录
核电厂信函的著录是文档管理的一项重要工作内容,其主要工作是对收到的信函文件进行信息采集,获取其发文编号、来文单位、标题及附件中的内容,通过人工识别的方式,将这些信息著录到ECM系统,这需要耗费大量人工成本。课题组通过如下方式实现信函的智能著录:
文档数据(原料):福清核电日常通过邮件、传真、办公系统、纸质接收的各类信函。
技术规范与标准:遵照《电子文件归档与电子档案管理规范》(GB/T 18894—2016)、《归档文件整理规则》(DA/T 22—2015)及中核集团及各级机构发布的管理制度。
信息采集预处理(眼):对信函进行扫描,形成版式文件。随后利用OCR技术和图像分割技术智能识别信函内容,提取文件名称、文件代码、发文单位、批准数据、文件页数等信息,并提供给文件管理员核对。
前端应用(手):将文档智能机器人识别的信息传递到ECM系统后,根据用户确认的著录信息依次执行RPA流程,将著录信息自动写入ECM;RPA自动化填写ECM流程时,每处理完一份函件,将函件归档至已处理文件夹。
智能批分与分发
信函批分是文档管理的一项重要工作内容,其主要工作是对收到的信函文件根据相关渠道号、发文单位及附件中的内容,判断转发至相关的部门领导,该工作依赖于处理人员的工作经验,经常会因为精力问题导致批分时发生错误。课题组通过如下方式实现信函的智能批分:
文档数据(原料):人工在ECM系统著录的信函或通过信函智能著录方式著录到ECM系统的信函元数据。
技术规范与标准:遵照福清核电发布的《信函管理程序》《组织机构及职能划分管理程序》,规范批分作业流程。
数据分析(脑):文档智能机器人利用智能算法为文件管理员推荐主办部门、传阅部门,并提供修改完善信函内容和主办部门、传阅部门的功能。
前端应用(手):当文件管理员确认信息之后,通过RPA技术实现自动在ECM系统创建收文表单、智能批分和分发的功能。
智能文档编研
福清核电维修规程文件的编研升版、文件编研需要进行多源的数据汇集和组合。工作负责人在文件编研时,需要在多个系统查看大量的历史数据,包括历史工单、文件的历史版本、相关文件。一份文档的升版往往需要15~16个小时的编制工作,其中大部分的时间是在核对、查阅等。能够快速定位有价值的信息,将为业务人员在文档的编研过程带来极大的辅助。课题组通过如下方式实现智能文档编研:
文档数据(原料):工作负责人在升版维修规程时,需要参考ECM系统记录的维修规程历史或相关文件和EAM系统记录的工单历史数据。
技术规范与标准:遵照福清核电发布的《生产文件管理》《维修工作包管理》等管理程序,规范维修规程智能编研作业流程。
信息采集预处理(眼):利于数据接口技术和Word文件内容分析工具分别对来源于EAM系统的工单数据以及历史维修规程的文档数据进行信息提取,包括:风险分析、注意事项、经验反馈、工器具、备件等。
数据分析(脑):使用规程结构化技术,根据“设备/设备类型”关键字进行解析。根据规程中章节内容,需要在已提取关键信息中创建规程与设备的关联关系。创建需参考规程文件清单表,并从规程文件中提取“年度检查”“全面检查”“全面解体检查”“全检”“定期维护”“预防性维修”“定期更改”“预防性检查”等关键信息。
前端应用(手):维修规程智能编研程序运行结果将以网页形式展现给工作负责人,通过将待升版维修规程与历史工单的分析对比结果呈现给工作负责人,由工作负责人自行决定将哪些差异项用于升版文件,经确认的差异项将由机器人程序保存并自动在原版维修规程基础上合成新版本的文件供工作负责人校核。
智能生产文件
工单是核电厂生产活动中最重要、最大工作量的活动,工单编制时需要填写的内容包括:缺陷描述、工作步骤等共100多类信息,同时需要引用设备维修规程文件、图纸文件、临时图纸文件等作为工作依据指导文件。为了提高工单编制的质量和效率,本课题通过智能方式把结果推荐给工单准备人,发挥人工智能在工单编制场景中的卓越效率和成本优势。课题组通过如下方式实现智能生产文件:
文档数据(原料):主要包括ECM系统保存的维修规程文件、图纸文件、临时图纸文件电子文件,这些文件通过设备编号与具体的设备建立关联关系。
技术规范与标准:遵照福清核电发布的《生产文件管理程序》《维修工作包管理程序》,规范维修规程智能编研作业流程。
数据分析(脑):智能文档智能机器人为工作包准备人自动、智能地推荐工作包相关内容,包括引用规程和图纸、备件、维修风险、工器具等内容。
前端应用(手):智能生产文件利用程序推荐的信息由工作负责人进行选择确认后,由RPA程序实现对EAM系统的操作和信息的录入,录入的内容包括规程、图纸、备件等信息。自动化RPA执行完成后,提醒用户已经完成。
研究成果
课题组通过“AI+RPA”技术实现电子文档数据的收集、传递、利用和归档,通过文档智能机器人部分取代人工完成电子文档处理,以人机耦合的方式实现面向文档管理以及文档服务能力的智能化机器人闭环应用,逐步提升智能化应用的准确度和效率。
通过实施该课题,福清核电将文档管理制度和经验固化为人工智能程序,降低了对日常文档事务处理人员的专业技能要求,用机器人技术取代人工处理,将日常文档管理工作中重复、繁琐的人工劳动交给机器人去处理,提高了可靠性,减少了人因失误和文档管理流程中对文档业务处理人员的依赖。改变了文档管理人员的工作职能,从单纯的信息提取与传递,转变为数据标记,从日常的事务处理转变为知识提炼,使文档管理人员在日常工作中不仅可以快速便捷地完成日常工作,同时将文档管理的经验不断转化为人工智能程序,为进一步提升系统的智能化水平提供支持。
[本文系2021年度国家档案局科技项目获奖成果]
作者单位:福建福清核电有限公司
文章来源:《中国档案》2022年第9期