专栏观察

从「风控」到「封控」,数字内容差个「守门员」

 

作者 | 曾响铃

文 | 响铃说

草莽纷争之后,数字内容平台如何走远?

很可能像被「十二道金牌」追回的岳飞,扼腕长叹的那样——十年之力,废于一旦。

岳飞的十年胜利,毁于奸臣之手,可恨可叹,无可避免。

但在互联网合规化大潮下,互联网内容平台的「十年胜利」,如果毁于「内容风控不力」,不仅可惜,更是可悲。因为,这本可以避免。

8月3日,国家计算机病毒应急处理中心(以下简称「应急中心」)新通报一批违规移动APP名单,包括《新浪金融》《觅上》《海豚家》等在内的17款APP「榜上有名」。

据了解,这离应急中心通报上一批违规APP尚不足月,而这已经是2022年以来的第12次通报。

在互联网内容合规化大潮下,守护网络内容安全的这「十二道金牌」,告诉我们,在当下数字内容风控的重要性和紧迫性,毋庸多言。

流水的数字内容

数字内容如「流水」,有几大特征。

首先,数字内容如流水般,没有常形,很难捉摸,导致数字内容风控难度随之变大。

从最开始的图文,到后面的语音、视频内容,可以看到数字内容这种「因器变而形变、因物异而适其异」的特性。

而随着技术发展,黑灰产数字内容,从生产到伪造的手段也越来越高——从零几年的发帖机,到现在的智能语音生成、智能图像伪造,甚至视频换脸等,增加了内容风控难度和成本。

其次,相较传统印刷内容,数字内容生产规模大、增速快,且能够在互联网快速流动、扩散和渗透,控制不当,「流水」就会变成「洪水」。这也就意味着,数字内容风控从人力密集型(人工审核)进入到计算密集型。

数据显示,人类进入互联网前的5000年,文字记载内容总共为5艾(1艾字节=1,152,921,504,606,846,976字节)。但仅2006年,全球全年产生的数字内容,就超过280艾。

近年来,在「高清、三维、视频化、用户创造内容(UGC)」的驱动下,数字内容进一步爆发,宛如「洪水」。2018年到2020年,中国数字内容产业年复合增长率高达9.33%,超过同期中国生产总值。数字内容审核,已非单凭人力就能胜任的时代。

最后,技术与产业发展,助推数字内容空前丰富,让数字内容成为数字经济的「富矿」,同时也成为黑灰产眼中的「肥肉」,数字内容风控呈现出24小时不间断的「长期强对抗」态势。

数字内容的时代洪流,冲刷出一条条大江、大河,催生出诸如抖音、快手等互联网巨头企业。同时,也在不断冲刷网络内容安全的河堤,且平台势能越强,带来的内容安全隐患也就越大。数字内容平台,如果成了被利用的「间接作恶工具」,将给企业正常运营带来麻烦和损失。

今年4月-7月,在为期三个月的「清朗·整治网络直播、短视频领域乱象」中,106个直播短视频平台下架关停,快手、哔哩哔哩、虎牙等被约谈、罚款,抖音、淘宝、微信视频号等16家重点直播、短视频平台上,56.3万个违规直播间被处置,235.1万条违规短视频被清理,12万个违规用户账号被关闭......

来自新一代数字内容风控服务商网易易盾的数据显示,成立六年来,网易易盾终端覆盖量超25亿,累计检测数据量超2万亿,处理移动安全风险超1400亿,抵御外挂超威胁700亿......

可见,数字内容风控依然任重道远。而随着内容平台对数字内容风控逐渐重视,相关需求正在不断上升。数字内容平台发展,如何做到内容「不失控」,已事关企业生死存亡。

铁打的内容风控

不管是将一匙酒倒进一桶污水,还是把一匙污水倒进一桶酒里,得到的最终都是一桶污水,这就是管理学上著名的「酒与污水定律」。

可见,污水和酒的比例不决定这桶东西的性质,起作用的是那一勺污水,有它在,再多的酒都会成为污水。

这跟内容风控一样。对数字内容平台来说,即使它有一万条优质内容,但只要有违规内容,它就可能面临处罚、下架乃至关停的风险。

国家应急中心2022年1-7月的12次通报已经敲钟——内容风控将会越来越重要,内容平台因数字内容获益,理应承担更多的内容治理责任,背后逻辑很好理解。

一方面,就企业来说,企业存在的最大价值,是解决社会问题,而非制造社会问题。数字内容平台,过去几年的发展解决了很多社会问题,这为其带来了商家。

不过,一些平台也存在大量「色、丑、怪、假、俗、赌」等违规内容,则给其带来危机。这些内容不但对平台发展无益,会造成用户体验下降、用户流失、平台声誉受损,同时也会严重威胁平台用户的切身利益,甚至引发社会问题,影响企业发展。

另一方面,对各大行业来说,随着数字化转型深化,数字经济如火如荼,数字内容和数字内容风控未来将成为企业标配——数字内容如潮,一波接一波,但不管后续形式、平台如何发展与进化,内容风控将是企业远航的「压舱石」,也是内容平台「铁打的营盘」。

但数字内容风控,并非一蹴而就,而是一场实时强对抗、长链条立体式的长期战,需要大量的人力和技术投入,任何一环掉链子都可能导致前功尽弃。

简单来讲,数字内容风控涵盖用户使用全生命周期,包括使用前的用户账户注册(避免垃圾注册)、使用中内容智能识别与安全检测(避免使用中体验和用户权益受影响),比如社交反欺诈、游戏反外挂以及营销反作弊等,以及抵挡无时无刻可能存在,来自网络各个角度对应用的攻击等,这从第三方安全风控公司网易易盾提供的数字内容安全解决方案中,也能感受到数字内容风控需要「面面俱到」。

 

(△网易易盾数字内容安全解决方案)

这就意味着,不管从成本还是技术上来看,仅靠单一内容平台很难内部消化。因此第三方安全厂商、安全风控公司正在成为企业保驾护航的新刚需。这从网易易盾服务的「朋友圈」越来越大也能得到佐证。目前,网易易盾已服务数千家行业头部企业,其中不乏人民网、外交部、中信证券、小米、vivo、爱奇艺、知乎、B 站、TapTap、中手游等知名企事业单位,服务间接覆盖99%以上网民。

数字内容风控,也早在2018年就成为市场空间超百亿的行业。安全行业体系标准建设也在持续推进,安全策略运营更是成为新职业——由网易易盾参与起草的《网络与信息安全管理员国家职业技能标准》已于2020年正式发布,这也为行业培养安全策略运营人员提供了支撑。

内容平台如何「风控」免「封控」?

显而易见,互联网内容平台正在进入「少犯错即成功」的时代,内容平台如何风控避免封控,需要认识到数字内容风控的几大特点。

第一,门槛看似低,其实非常高。技术需要持续迭代,场景非标性强,需要大数据支撑。

基于上述特征,数字内容风控也有较强的规模效应,未来主流发展趋势,只能是大平台化作战,而非企业独自为战。即数字风控服务商需要「见多识广」。

就像飞书诞生于抖音集团(原字节跳动)内部OKR应用;钉钉诞生于阿里内部协作;网易易盾的诞生,也离不开网易多元互联网业务的「喂养」。

网易从提供博客、邮件类产品开始即重视内容风控,且其业务所涉的游戏、电商、社交、娱乐等都需要内容风控。这些内部需求和实践,让网易拥有20多年数据积累,也让网易易盾在内容风控上「见多识广」。

这些,又为网易易盾算法团队沉淀出一系列高效率的场景化数据精炼流程和算法训练方案。构建了数百种细分类识别的模型,最高99.99%的分类模型精准度,持续获得包括浙江省科学技术进步奖一等奖在内的各类官方权威认可。

第二,要么不出事,要么出大事,试错成本高,稳定性高于一切。

数字内容风控事故只有0和1的区别,企业不能存在侥幸心理,也不能充当「小白鼠」,因为一次事故,可能就会打断企业发展的势头,甚至将多年积累毁于一旦。

2019年7月底,处于快速增长期的小红书突然「被下架」,整改后时隔70多天方才重新上架,元气大伤——2019年下架前的6月,小红书月活约为9300万,到9月底月活用户降为7288万。这样的例子很多,此外还有像抖音集团(原字节跳动)旗下因内容被关停的「内涵段子」们也不少。

因此,选择一个被验证过的内容风控服务商很重要。被网易内部从邮件、博客到社交娱乐、游戏、购物验证过的网易易盾,被上千行业头部企业「拿去就用」也就不奇怪了,这跟钉钉和飞书被别的企业「拿去用」是一样的道理。

第三,数字内容风控是一场持久战,贯穿企业全生命周期,需要全方位、持续改善,包括人工审核、机器识别和安全策略三方面,一个环节都不能少。

目前第三方内容风控服务商标配是「机器识别+人工审核」。其中「机器识别」承担「将识别能力标准化」的部分,即基于深度学习及大规模样本训练,对内容进行分析,分辨其中可能存在的色情、低俗、广告、涉政、暴恐、谩骂、灌水等可能性的内容,进行标红和分类预处理,最后交由「人工审核」来负责定性的部分。

还有少数服务商提供的是「机器识别+人工审核+安全策略」服务,业内较早做的是网易易盾。其提供的「安全策略」可以类比为「机器识别」与「人工审核」之间的桥梁,既帮人工团队将其处理的特征和知识,抽象出来反哺给机器,让机器识别更"聪明";又根据通用问题,开发一些策略工具持续筛选机器识别后的数据,使其结果输出更精准。

由于做得比较早(2012年内部开发,2016年开始对外服务,在2019年网易易盾该方案已成为行业通用解决方案),相比其它企业,网易易盾是少数拥有「策略运营团队」的内容风控服务商,相比市场上普遍的「机器+人工」模式,网易易盾补足了「运营」这个重要环节,成为能提供一站式全生命周期的专业数字内容风控服务的「少数派」。

总而言之,数字内容风控,就像内容平台参与的一场特殊的足球赛,你可以自己不得分,但你不能失守,被对方破门。否则不管是1:0还是100:0,结局都是输!而平台从内容风控到「被封控」,很大程度上取决于一个「守门员」。

*本文图片均来源于网络