她不是没有想过琢磨出一些办法,来减少自己的事情量,比如她找了很多图片识别的软件。她自己把那些发票单据全部拍照然后用软件识别,但是效果并不理想。她的履历是——有的软件天生的文档乱七八糟格式缺点;其余在识别有污渍、折痕、断针的发票时,软件会把折痕当成发票的内容一并保留下来,所天生的文档内容涌现缺点,这些情形使得核查的韶光比手工录入的还要长……总而言之各种问题层出不穷。
ICR智能票据识别平台化解票据录入时的尴尬
带有折痕的发票
实在,倩倩碰着的问题在很多公司也是件让人头疼的事,比如保险公司的医疗发票识别,金融公司、银行的身份证复印件识别,旅行社的火车票识别,阛阓超市的吊卡识别,任何行业只要对付某类票据须要大量数据录入的,都存在票据多得让录入职员窒息的情形,由于没有一款软件能够真正的做到高效精准识别然后天生完全文档。这种票据的识别与其它纸质文件如名片平分歧,哀求精准度高、安全性好、速率快,可谓在名片识别的根本上难上加难。
而北大创业孵化营四期营项目上海使爱智能科技有限公司(简称E-AI)的ICR智能票据识别平台,就针对上面的票据识别问题给予了最佳办理方案。由E-AI自主研发的ICR 智能票据图像识别系统,让机器自动认知发票并形成数据天生文本文档。在打算机科学中,智能字符识别(ICR)是一种前辈的光学字符识别(OCR)或有人称之为手写识别系统,便是人工智能(AI)加上印刷字符识别(OCR)。E-AI的ICR智能票据识别平台被做成一款嵌入式软件,方便企业员工利用。
识别后发票的文本
自主研发“自然语义系统”超90%精准识别 节省录入本钱80%
针对倩倩曾碰着过的票据有折痕、污渍等情形,ICR智能票据识别大数据平台的创始人张成栋说,他们自主研发的“自然语义系统”可以做到90%以上的精准识别,缘故原由在于有数据做根本,比如票面上的信息是关于心肌窒息的药单,系统就将自动遐想平台上的与心肌窒息干系的药品数据,纵然票面有折痕,票面上的信息也能被完全录入。
同时,ICR 系统具有自主学习的神经网络,便是可以支持自动更新模板,并形成识别数据库,客户同时可以自定义须要的数据字段。比如北京的医疗发票与上海的医疗发票格式不同,传统的OCR 必须识别固定格式与内容,如果模板换了,就无法识别;而ICR具有智能识别的功能,当模板不同时,系统将会提示并进入学习阶段,当累计数据达到一定量时,它将识别出新的模板。
创始人张成栋
就目前中国票据市场票据种类繁多、字体分歧一、只能依赖图片形式留存等现状,ICR不仅办理了票据数据识别和留请安题,还将录入本钱大大节省。以安然养老保险为例,每张3.6元的录入本钱,一年仅录入用度就须要花费1亿元,而采取ICR录入则会节省本钱80%。ICR人工智能的市场十分广阔,可在医学康健、硬件配套、物流、安防、个人消费类、交通等发展迅速的热点领域发挥浸染,同时支持本地支配,能够确保数据的安全性、保密性。
相较文通科技、汉王、翔云和合合科技均采取OCR时涌现的工具限定于标准体票据(激光打印)发票识别, ICR智能票据识别大数据平台专门针对繁芜票据识别,支持针式打印、非连续字体。它采取AI特色抽取、机器识别、机器纠正及反馈改变OCR传统识别流程,对付繁芜票据如保险单据,客需字段准确率90%以上。传统AI企业如FACE++、灵云、小i机器人等,其紧张以图像识别、人脸识别、指纹识别、语义识别为主,在票据识别业务的专业性上欠缺。总之,ICR智能票据识别大数据平台的性能指标,如拒识率、误识率 、识别速率、用户界面友好度、产品稳定性、易用性及可行性等方面,均显著优于其他从事票据识别业务的企业。
2017年暂定一个小目标:发卖额超1500万
平台目前已完整天使轮融资,未来以2B模式为主,目标指向本地的大型客户,以产品及数据做事客户。2016年平台已与中国安然、苏州银行达成互助,发卖额达200万元;2017年将有望与太平洋保险、众安保险、太平人寿保险签约,发卖额或超1500万元。其余,海量的发票及非构造化数据经由ICR 变成构造化数据之后,将变成各行各业非常有代价的大数据剖析参考资料。
往后像倩倩这样的录入员事情时,想必不会再挠墙。