DarwinML TRNET一站式全自动票据识别技术服务, 发挥AutoML技术快速自动建模的优势

2020-12-22 14:21:18来源:财讯网  

新冠肺炎疫情发生以来,远程办公,在线教育、云服务,IoT,5G等为代表的新应用展示了数字经济时代数据技术的优势及巨大潜力,一个智能化社会的形态初步呈现在世人面前。大量企业在数字化、智能化方面不断加码,提速转型,也让“企业数字基建”成为焦点。近日,全球领先的AI技术和解决方案提供者探智立方,发布了DarwinML TRNET的功能升级,以AutoML技术加持智能票据与文档识别,帮助企业实现账务自动化处理,为企业降低大量的运营成本。

现代企业的运作与票据和文档处理是分不开的,合同管理、报销管理、各类发票、机票、火车票、银行票据与证明材料等的人工录入,占据了财务审核人员大部分的精力;于此同时,大多数企业针对票据的电子化仅仅做到了扫描或图片记录,而对于票据中内容的不能加以识别和处理,这就造成了数据利用不充分,人工成本高昂的运营现状。

DarwinML TRNET智能票据与文档识别平台将彻底改变票据与文档识别依赖于人工的现状,通过人工智能计算机视觉技术与NLP技术相结合,并充分发挥AutoML技术快速自动建模的优势,为企业用户打造适应自身需求的智能票据与文档识别平台。

同时,DarwinML TRNET采用自主研发的综合信息评分算法模型,可以适应在票据格式不同的情况下,正确提取识别字段的内容,根据某些字段的特点,对识别结果进行校正和纠错,从而提高识别的准确度,目前,增值税专用发票、增值税普通发票、增值税电子普通发票、火车票、定额发票、航空运输电子客票行程单、出租车票、客运票、机打发票等票据,DarwinML TRNET都能进行自动分类,结构化识别,并按用户需求格式输出识别结果。帮助企业实现高精度的票据及文档自动化处理,免去人工录入的劳动并降低错差率,从而为企业降低大量的运营成本。

探索企业票据智能化管理新场景

DarwinML TRNET上市以来,已经得到了国内大型商业银行、股份制保险公司、大型企业、专业财务公司等多家企业的青睐与使用,并与中国创新科技企业票易通达成战略合作,通过结合人工智能深度学习技术,打造全方位共赢的智能税务行业发展的数字化新时代。票易通首席构架师陈凯这样评价:“AutoML技术的发展已经可以为财务行业的多个应用点提供很好的效率提升,探智立方的DarwinML TRNET系统具有诸多优势,是企业智能财务票据管理的好帮手。”

探智立方是全球领先的AI技术和解决方案提供者,基于自主研发的DarwinML平台为AI在各行业的应⽤赋能,为企业客户提供一站式、全自动的模型⽣成和部署能力。作为企业AI赋能平台,DarwinML以先进的演化算法及强大技术作为支撑,从根本上协助企业将人工智能⾼效构建到业务应用和决策中,并不断探索基于公司核心技术DarwinML自动建模平台在行业应用领域的不同场景,DarwinML TRNET即是在票据与文本识别领域的成功应用之一。未来,探智立方还将继续探索把DarwinML核心技术应用到证券行业的量化投资分析,制造业的产品质量检测等多个应用领域。

基于进化算法的 AutoML 路线

在 AI 自动建模上,AutoML 的实现路径其实包括四大方向:强化学习、进化算法, 迁移学习方法及元学习(Meta Learning 是未来有潜力的方向之一),各家公司的实现路径不同,不过大多数采用的是迁移学习。与众不同的是,探智立方一直坚持探索进化算法方向。

「强化学习模型收敛较难,对失败次数要求比较高,需要的计算量也不小,」宋煜表示。「目前业界应用最多的 AutoML 方法基于迁移学习(transfer learning),百度、华为、谷歌等公司推出的 AutoML 产品大多基于这种方法。」

不过后者也有缺点:需要背靠足够大的数据科学家团队,以及特定领域中丰富的模型种类。我们可以看到今天 AutoML 产品在图像领域里效果最优,这是因为图像领域中可以获取的资源是最多的(不仅是模型,甚至模型权重都有开源)。

但在大量其他领域,如果希望对时序、结构化数据进行处理和分析,没有一定之规,也没有现成权重,迁移的方法或许就无法适用了。

另一方面,基于序列模型的方法和元学习方法则会面临搜索空间过大后导致运算量需求指数级上升等不同挑战。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

相关阅读

相关词

推荐阅读