3月9日,阿里妈妈公布其2015年屏蔽了4600万条恶意推广。 对恶意推广的定义,阿里妈妈表示,主要是依据新广告法以及国家工商行政管理总局的各项监督管理办法:对于违禁品、色情信息、封建迷信、假冒伪劣、减肥丰胸壮阳缩阴、夸大虚假等违规类型进行不同程度的处罚和管理。其中,对于消费者关系最为密切的假冒伪劣单项违规类型,阿里妈妈作为重点审查对象,实行专人管理。
与传统广告不同,互联网广告一般采用程序化投放(RTB),数量庞大,发布周期短,发布频次高,且推广内容通常是客户自行操作。这也意味着,单纯依靠人工进行广告质量的审核已经很难,通常都需要营销服务平台具备强大的技术实力对推广内容进行识别、过滤和处理。以阿里妈妈平台为例,平均每天有超过3亿件商品的推广展现,每天超过50亿的推广流量。数据量之大,可想而知。那么,阿里妈妈是如何发现恶意广告的呢?
“核心是大数据和机器学习,”阿里妈妈表示,实际业务诉求中,阿里妈妈的风险控制团队会根据产品类型、时间周期、风险类型通过大数据进行多维度的风险评估。结合机器的算法逻辑,通过系统抽样的方式,客观的量化风险,判断风险现状,预测并挖掘高危风险和潜在风险。通过这套完整的风险评估体系,系统将自动把恶意素材扼杀在推广上线之前。同时,配合人工排查的方式,捕捉漏网之鱼,予以处理。
“一旦发现违规违禁或者假货侵权信息出现在推广图片上,系统就会通过图像算法模型,以事先在样本库中录入图片或logo样本的方式,通过样本自动抓取线上投放且被样本命中的推广信息。”阿里妈妈表示,通过数据的不断积累和机器学习,这套模型会越来越智能和成熟,目前这套图像算法的召回准确率已达85%以上,处于国际领先的地位。
据悉,除了通过自身系统排查外,阿里妈妈去年开始还积极拓展社会化的资源,众包了人工审核团队,辅助处理一些机器暂时难以覆盖的风险面,每小时可完成约10万条审核数据。