事实上,违规内容的处理难度远比人们想象繁芜得多,违规内容的形态千变万化,包括但也不限于黄赌毒、低俗辱骂、恶意注水、暴力胆怯、反动辞吐等,对各种平台的内容风险防控提出极大的寻衅。

一样平常来讲,违规主体大致可分为非恶意违规用户、恶意违规用户和恶意违规团伙等几类。

非恶意违规的用户相对来说会更好处理,恶意违规的用户或恶意违规的团伙则相对棘手很多,由于其目的不纯粹,且还利用了大量的前辈技能。
以是常日会存在各种对抗的过程,除了从单元素(纯挚文本/图片/语音等)展现上的变形外,乃至会有明显的迁移过程,从图文到音频视频等,乃至还有多元素的结合发送违规内容。

这里说的用户和团伙的观点都是指逻辑上的团伙,比如现实物理上的人借助上中游的黑产工具实现的批量对抗办法,在实际业务中每每也是表示出团伙的属性。
特殊地,"色情流"家当链、"赌钱流"家当链、外挂引流、境外势力等操控的实际个人或者团伙,在进行内容发布时都会有显性或者隐性的团伙特色涌现。

同盾AI技能护航收集内容安然 助力净化收集生态

基于此,海内第三方智能风控与剖析决策做事供应商,同盾科技打造了内容安全智能平台,内容安全智能平台是同盾反敲诈做事的核心产品之一,个中紧张包括图像内容安全做事和文本内容安全做事。

同盾内容安全智能平台

同盾内容安全智能平台基于自然措辞处理、措辞识别、语义理解、图像分类、目标检测、深度学习等核心技能,面向银行、互金、保险、证券、互联网等客户群体,供应包括文本、图像、音频、视频等泛内容安全识别,全面提升企业智能化、批量化UGC等内容综合处理能力、为企业构建牢不可破的安全防御体系。

文本内容安全

文本安全防控体系是内容安全智能平台主要的组成部分,结合深度学习算法、政策威信指令等,能全面办理诸如跳词检测、误匹配纠正、火星文识别、组合词识别、同音词识别、形近字识别等问题。

并精准识别垃圾源头,及时主动推送风险,帮助客户戒备涉政、涉黄、涉暴、垃圾广告等违规风险,供应安全保障,其上风紧张表示在以下几个方面:

算法上风:针对海量的文本语料,对AI算法进行系统的演习学习,使得同盾内容安全文本的对广告、涉黄、辱骂、违禁等文本准确率和覆盖率,达到当前的业界的前辈的水平。

利用机器学习和深度学习算法,进行关键词的挖掘。
确保关键词及其变异体覆盖面广泛。

关键词:同盾多行业积累下的海量关键词库,这是防控体系下最主要、也是最高效的一环。
由于数据量巨大,文本防控对实时相应又有极高哀求,以是在基于DAT双数组构造的根本上,结合了其他算法作了定制化构建。
另一方面,词库通过威信政策指令下发、新词挖掘算法等各种路子,可不断进化扩容。

利用cnn、lstm、基于把稳力的attention、bert等前沿深度学习算法,对神经网络的相对调整。
每一个分类都有自己对应独立的神经网络算法。
从而确保每个业务和场景分类,都能知足需求。

此外,同盾文本安全防控体系还有以下特点:

1.配置灵巧:基于定制化分词、感知词法剖析、命名实体识别、自动择要、关键短语提取、依存句法剖析、语义间隔剖断、浅层情绪剖析等一系列自然措辞处理技能,针对不同行业不同场景实现松紧合适、灵巧配置的策略体系。

2.性能卓越:可承受单日千万级数据的处理,支持数据高峰时段弹性扩容,检测结果毫秒级返回;

图像内容安全

图像作为范例的富文本承载形式,在防控上较文本也会更具寻衅性。

1、图像预处理系统,包括常规格式支持及分外格式的解码转换,如基于谷歌V8引擎的WEBP格式、标签图像TIFF格式、动态GIF格式等的支持,同时也具有图像降燥、数据增强、归一化等处理。

2、图像黑白相似样本库,通过矩阵算法天生图像sim指纹,构建高效前置索引,形成海量范例样本库,实现批量范围内特色图像及时高效防控。

3、基于tensorflow、caffe等深度技能所构建的图像深度学习平台,孵化出涵盖涉黄、暴恐、涉政治、笔墨广告四大类模型识别做事。
个中包括大小尺度性感、儿童、成人等10余种涉黄场景;武器、血腥、游行、军装、符号等几十种细分暴恐场景;覆盖上百位主要政治人物及政治事宜;通过OCR技能,精准识别包括广告、二维码在内的各种内嵌笔墨信息。

同盾科技的图像内容安全做事采取深度学习技能,利用了前辈的GAN算法和无监督的决策边界拟合,基于强大的学习能力能有效帮助网站识别色情图片以及转化为图片的笔墨广告信息,防治垃圾信息传播以及潜在的诱骗风险,以减少网站内容风险和人工审核本钱。
同时结合同盾文本内容安全以及帐号安全保护产品,让垃圾信息无处藏身。

同盾科技内容安全做事的根本是图像识别及文本识别的人工智能技能,此技能能为图像和文本反敲诈及其他场景供应强大的深度学习算法和算力担保。
经由多年的努力,同盾已完备自主具备了强大的技能能力,拥有图像识别、文本识别及语音交互的人工智能技能,沉淀了包括机器学习平台、决策引擎、流式打算平台等一系列的根本平台。

同盾科技内容安全产品通过了由中国信息通信研究院牵头组织的内容安全办理方案标准资质认证,成为首批通过认证的三家企业。

同盾内容安全智能平台目前已做事各行业大量客户,与央视网、21财经等都建立了互助关系,并得到工信部首批资质认证。
同盾乐意与更多企业携手,为打造一个更加安全、康健的网络环境而努力。