2020年5月7日,来也科技成功发布了全新的rpa ai平台产品uibot mage。犹如其中文名“魔法师”一样,来也科技希望通过ai赋能,将ocr(光学字符识别)、nlp(自然语言处理)、人机对话等ai能力快速应用到自动化流程中。
uibot 是来也科技旗下的rpa机器人流程自动化平台,在uibot mage发布之前,由uibot creator(创造者)、uibot commander(指挥官)、uibot worker(劳动者)三部分组成。uibot mage的到来,令来也科技的三驾马车,一跃升级成为四缸引擎。uibot mage的发布,意味着来也科技rpa ai生态真正走向产品落地,并且贯穿于rpa机器人流程自动化的方方面面。如果说2019年是rpa的元年,那么今天uibot mage的目标则是让rpa机器人更智能。
rpa(robotic process automation,机器人流程自动化)是一种流程自动化软件工具,能够代替或者协助人类在计算机等数字化设备中完成大量、重复、繁琐的日常业务流程。ai(artificial intelligence,人工智能)是由人制造出来的机器所表现出来的智能,指的是通过普通计算机程序来呈现人类智能的技术。
这是一张rpa从业者烂熟于胸的示意图,这张图的经典之处在于,它非常明晰地揭示了rpa和ai之间的关系:rpa模拟人的双手,例如点鼠标、敲键盘,将数据从一个系统录入另一个系统的机械重复工作,解决流程自动化;
ai模拟人的大脑,例如语音识别、物体识别、图像识别、ocr等,使用机器学习技术从非结构化对象中提取数据,解决认知自动化。一种当下流行的观点是,rpa只适用于如下工作场景:高度重复的、跨系统的、规则固定的流程。前两条特性是显而易见的,最大的争议来自“规则固定”这条特性,“规则固定”是rpa的特点之一,但rpa反对者认为,“规则固定”束缚了rpa的更大发展。从客户的角度来看,“规则固定”意味着rpa无法处理需要主观判断的业务流程。也就是说,rpa无法“完整地”处理整个业务流程的自动化,而只能处理部分流程,或者在流程执行的过程中需要人工的介入。尤其是在人工智能已被科幻电影神化的今天,用户对智能化技术寄予了过多不切实际的期待,用户的高期待与技术的成熟度之间的落差,是许多流程自动化项目难以落地的重要原因。从市场的角度来看,“规则固定”通常意味着流程的附加值较低,整个rpa项目的价值也随之降低,这也是目前rpa项目客单价普遍较低的重要原因。 如果将项目按照“复杂度”和“收益”两个维度分为四种,其中,低复杂度高收益的项目,大家都抢着做;高复杂度低收益的项目,大家都不做。真正拉开各家rpa企业收入差距的,是另外两种项目类型。通常来说,谁家的产品越是能处理各种变化各异的规则,就越能获得高收益。低复杂度低收益、高复杂度高收益,能者多劳,多劳多得,合情合理。从提升rpa行业价值的角度来看,几乎所有的行业预言家都预测,rpa将会在ai的帮助下,核心能力不断增强,自动化过程不断增加。未来,我们将看到由机器人流程自动化(rpa),衍生为复杂流程自动化(cpa),最终达到智能自动化(ia)或智能流程自动化(ipa),也就是我们所说的rpa ai。因此,作为来也科技“rpa ai”的重要组成部分,uibot mage的推出可谓水到渠成。在“laiye lead 2020”大会上,来也科技cto胡一川介绍,uibot mage将为rpa机器人提供三类ai能力,即文字识别、文本理解和人机对话,从而为用户带来更大程度的自动化。uibot mage 为rpa提供的三大ai能力
2018年11月,国际数据组织idc发布了数据行业的十大预测,其中之一是关于非结构化数据。idc预测,到2025年,全球产生的数据量将达到175zb,而超过80%的数据是处理难度较大的非结构化数据。所谓非结构化数据,主要是指那些无法用固定结构来逻辑表达实现,无法被计算机直接处理的数据,从形态上,非结构化数据主要包含这三大块:
结构化数据和非结构化数据
在2018年,这一预测还并未引起rpa行业的关注。不过,随着2019年,中国rpa行业迎来多轮融资,rpa一跃成为tob市场最为炙热的词,关于idc的这一预测逐渐成为大家讨论的热门话题。在rpa行业具有划时代意义的uibot mage,正是以文档理解中的非结构化数据为突破点,让企业现有的文档、图形、图像、音频、视频等信息从非结构数据,转变成为结构化数据,尽可能的让企业的各种行为纳入到自动化行列中。
uibot mage 技术示意图
从uibot mage技术示意图中可以看出,uibot mage的ocr模块,通过通用文字识别、通用表格识别、票据识别、卡证识别等技术,可以将特定的图片转换成非结构化或者半结构化的文本。加上通过语音识别、视频识别将视频、语音转换成的文本,几乎所有的非结构化数据,都可以统一转换成文本类数据。而nlp模块可以实现常见的文本理解和抽取。这里的文本,可以是财务报表、合同、招股说明书、报告等;这里的抽取,指的是将一个句子中的实体都抽取出来。假设某句话为:“下周一北京到上海的机票是一千两百块钱”,通过uibot mage的实体抽取命令,上述句子中的 “下周一”、“上海”、“北京”、“一千两百块钱”等实体都可以被正确抽取。通过ocr和nlp技术,uibot mage可将非结构化数据转化为结构化数据。其次,我们再谈论下构建文档理解的和记娱乐怡情博娱的解决方案。所谓文档理解,指的是利用uibot mage提供的ai能力,将现实生活中常见的非结构化文档,例如发票、行程单、身份证、合同、邮件等,进行解析和理解,并将该过程集成到完整的业务流程中,助力rpa ai行业和记娱乐怡情博娱的解决方案。
文档理解方案示意图
以合同识别场景为例来说明文档理解方案。为给财务提供成本管理依据,需要将合同扫描成电子文档,并自动识别合同内容,提取出总金额、账期、供应商、合同号等关键信息,最后将合同关键信息录入财务管理系统。合同识别场景是一个典型的文档理解助力rpa ai行业和记娱乐怡情博娱的解决方案的实例。其中,合同电子化利用扫描仪和高拍仪进行;pdf转换成图片由rpa引擎模块完成;ocr通用文字识别模块完成合同图片到文字的转换;nlp文本信息抽取模块将合同关键信息抽取出来;最后,利用rpa的ui自动化技术将合同信息录入财务管理系统。这样,rpa与ocr、nlp等ai能力配合,共同完成无ai能力的rpa产品无法做到的场景。流程搭建时间只需要1天,处理效率可达人工的20倍以上。最后,我们看看uibot mage提供的人机对话能力。人机对话能力到底有多重要?随着企业中rpa机器人数量的增加,uibot mage提供的人机对话能力支持双向交互、多轮对话以及多种模态,为人与rpa机器人的交互提供了无限的可能。具体而言,一种是人主动向机器人发出指令,以完成某个业务流程;另一种是机器人在执行某个业务流程中,遇到需要人去干预的问题,可以主动和人交互。特别在一些复杂场景下,需要多轮对话才能完成交互的流程,人机对话的能力就显得尤为重要。走向未来:超级自动化
forrester曾针对企业做过一项调研,2019年末,rpa技术在所有企业自动化系统部署中排名最低;而到2020年,rpa技术的排名则上升到了第一位。
forrester分析师卢冠男在“laiye lead 2020”大会上也表示,市场对于rpa的预期越来越高,不具备 ai 能力的rpa 工具将会被替代。其中,rpa充当了肌肉的角色,ai提供了认知和判断力,两项能力结合组成的智能自动化,才是整个企业实现自动化流程的关键。无独有偶,另外一家信息技术研究和顾问公司gartner,曾对2020年十大战略性技术趋势做出了预测,其中以rpa机器人流程自动化为代表的“超自动化”作为企业数字转型的重要工具,受到各行业的一致好评夺得榜首。所谓超级自动化,是指运用包括ai和机器学习在内的先进技术,以便日益使流程实现自动化,并增强人类。超级自动化不仅涵盖可以实现自动化的一系列工具,还涉及自动化的精密复杂性(即发现、分析、设计、自动化、测量、监控和重新评估)。由于没有任何一种工具可以代替人类,如今超级自动化涉及多种工具,包括机器人流程自动化(rpa)、智能业务管理软件(ibpms)和ai,旨在日益借助ai来制定决策。来也科技一直坚持rpa ai,在超级自动化的道路上从未停歇脚步:从依托第三方到自研ai技术,从nlp到ocr,从对话机器人到uibot mage,从单个ai技术到搭建人工智能平台,一步一个脚印,坚定而执着。从诞生,到走向市场,uibot mage迈过了关键性的一步。现在,不妨让我们一起感受uibot mage带来的神奇变化。