金融行业面临的数据挑战,比我们很多人想象得更加严峻。爆发式增长的数据从四面八方奔涌而来,包括市场行业数据、企业财务数据、金融交易数据等。
以上交所和深交所为例,去年9月,两市上市公司刚刚突破4000家,而今年4月,最新的数字已经是4302家。每次到了财报季,各种报表更是如雪花般飞舞。
对企业的文本和财务报表进行审核和分析,是金融行业非常重要的工作内容之一。面对短期间涌入的数千份季报、半年报和年报,每份都在两三百页上下,里面包含了企业的主营数据、经营数据、公司治理数据等海量信息,信息的背后隐藏的是投资与信贷的风险,也蕴藏着潜在的商机 。低成本、快速、准确读取文档内容,理解语意含义,并形成规范化、可被自动化处理的知识标签显得尤为重要。
在传统的模式下,数据的分析、录入和审核全部采用人工审阅模式,这无疑极大地降低了业务效率,容易造成商机错失,任何人为疏忽导致的错误,可能会给银行带来巨大的风险。
基于此,通过OCR(光学字符识别)技术来实现各种业务场景的智能化,已经成为当前诸多银行的首选。作为一项枯燥繁杂、重复度高、工作量大的业务,财报的数据录入和分析显然是OCR技术大展身手的空间。
最近几年,由于云上模式逐渐成为趋势,原有的OCR已经难以满足行业需求,毕竟我们无法将每一份财报都转化为纸质版,而且在当前数字化飞速发展的应用环境下,也无需这个必要。
我们知道,目前国内常用的财报格式是PDF文档。在工作中直接引入机器智能,通过OCR而不是人类雇员来“阅读”PDF财报,将会为金融机构带来极大的效率提升,也能够有效地缩减金融机构的运营成本。
OCR与人工智能,以及机器人流程自动化等技术的“一相逢”成为了“胜却人间无数”的提升运营效率的法宝;为更多的金融机构业务带来巨大的优化和发展空间。
对于各种金融应用场景而言,智能OCR机器人正在成为一大利器。它能够做到的不仅是高效率的识别,得益于技术底层的嬗变,它甚至可以对相关的条文和具体内容进行“阅读”。
在亚马逊云科技看来,智能OCR一直是充满活力的研究领域,在不断出现的新型行业应用场景中,智能OCR的既有价值显而易见,潜在价值又难以估量。
基于相关的技术与云服务,亚马逊云科技在中国市场近期推出了一系列本地“原生”的、用于金融行业的解决方案,帮助企业盘活数字资产,以AI创新场景,支持金融企业的数字化转型。
亚马逊云科技的智能公告文本知识标签提取机器人方案,便是其中一个面向金融行业的解决方案。该方案利用Amazon SageMaker机器学习服务,Amazon Neptune图数据库服务和金融行业资产盘活机器人解决方案,对上市公司公告、研报等文本进行分析与实体抽取,形成知识标签,提升银行和证券机构识别外部风险与商业机会的效率。
利用这个方案,不仅可以从上市公司公告中提取价值信息,也可以“阅读”法院公告、工商、互联网媒体、路透、征信、网点监控等不同的数据来源。针对上市公司公告、研究报告,通过利用智能公告文本知识标签提取机器人方案,银行就不必在季末抽取大量人工投入分析文本、提取内容,而可以将这些专业资源用于其他高价值工作。
与传统OCR不同的是,该方案对财报的分析绝不仅仅是提取其中的数据,还包括了高管变动等关键信息。其中,AI 模型可以对文档进行自动分析与文字抽取,将识别出的数据、文字等信息,进行实体识别与关系抽取,形成知识标签,通过图数据库进行保存,便于前端进行查询和展示。
该方案以Amazon S3为基础,联接了Amazon Neptune、Amazon AppSync、Amazon DynamoDB等不同的服务,通过数据预处理、数据抽取和数据后处理,进行智能文本处理服务,基于数据的生命周期,最终帮助客户构建起智能业务平台和专业服务队伍。
通过亚马逊云科技的智能公告文本知识标签提取机器人方案,金融机构可以高效率地进行如财报等文本的处理和分析,从更多的数据来源提取价值信息,从而及时发现商机、规避风险。
“对于金融行业来说,这是一种很典型的资产激活。”亚马逊云科技中国地区的金融解决方案相关负责人表示。
需要说明的是,亚马逊云科技由中国本土团队提供的金融行业解决方案依托开源框架,支持多种框架和模型, 用户对架构和模型自主可控。
其次,用户的数据仍处于自己手中,而不是第三方的服务平台上,他们可以利用这些自有数据,进行OCR 模型的增强训练和精度提升,实现业务的更多可能性。
再次,借助机器学习平台Amazon SageMaker和图数据库Amazon Neptune,亚马逊云科技的方案可以在OCR识别出文字的基础上,进一步进行智能的实体识别与关系抽取,形成知识标签,支持风控、营销、推荐等业务产品的开发,并可引入图神经网络算法模型,走进更多的业务场景当中。
最后,我们还必须提及亚马逊云科技金融行业解决方案的云端优势:弹性伸缩、资源按实际用量付费,用户可以随时根据自己的需求开启服务,节省不必要的花费。
通过以上方案,亚马逊云科技可以帮助金融机构解决长期以来针对文本数据提取利用的“痛点”,实现智能OCR和机器人技术在创新业务场景中的应用突破,助力金融机构在新时代的高质量发展。
亚马逊云科技中国峰会线上峰会将于2021年9月9日至9月12日与大家线上见面!届时,在金融分论坛,您将了解到有关亚马逊云科技金融行业解决方案及成功应用实践,欢迎观看!