实在这是机器学习最善于的事情。为什么呢?由于手写的字迹有一定的模式,而通过大量的样本创造模式便是AI善于的领域。研究职员创建了一个来自这些国家的100人的数据集,让他们用英语书写,统共写了500行。对付这些手写字,一种名为Cloud of Line Distribution(简称COLD)的工具可以对一个个的字母进行剖析,估量字迹的直线度或波折度。
为何要测直线度或波折度呢?是由于人们受到母语书写的影响非常大,在写其他措辞的时候也会不自觉地用母语的书写办法去模拟。举个例子,当来自中国的书写者利用罗马字母时,他们会用更直的线条来书写字母,由于汉字常日是用直的笔画组合而成的。另一方面,来自印度和孟加拉国的书写者所写的字母则相对波折,由于他们国家的字体大多数都曲直折的,形状比较圆。
在之前关于字迹的研究中,曾有人试图从中检测出作者的感情、性别乃至年事。但是,并没有一个关于年事如何决定字迹因果关系的研究成果。但是确定国籍时,这个技能变得实用许多,来自印度,中国和马来西亚的研究职员提出这种技能对犯罪调查很有用。警方越来越多地转向生物识别技能来办理犯罪问题,从手写中提取识别信息可以作为人脸识别软件等其他技能的补充。
一项技能的成熟必定要办理该技能带来的危害。例如在刑事调查中,与犯罪嫌疑人字迹相似的人会无辜地牵扯到案件中,同时也摧残浪费蹂躏了警方调查的韶光,案件导向了缺点的方向。或是当这项技能商业化时,公司会根据字迹来提前分辨出客户的国籍,大概会造成差异对待等不公正事宜。
中国人常说“字如其人”,这一点在字迹的研究上充分得到了证明。据《民事诉讼法》规定,字迹的鉴定结论也属于证据的一种。清华大学和公安部曾经推出一款能自动鉴别字迹的“打算机字迹识别系统”,其能将全体考验、比拟和判断的过程自动化,对字迹识别精准度的提升有很大的浸染。
对普通人来说,隐私保护彷佛是一个更主要的话题。人们在学校、事情单位等场合随意马虎留下很多字迹,当它是一种授信的象征时,要当心被不法分子利用的风险。当一些医疗机构或是个人流传宣传通过字迹检测出患者的生理障碍时,人们也要多长个心眼,由于这统统都勾留在论文阶段。
更多精彩内容,关注望潮科技微旗子暗记(ID:tech_beat)