谈到互联网你会想到什么?也许你最直接想到的就是开放与平等。
在互联网上每一个人都可以自由创作,每一份信息都能够得到传播。无论你在现实生活中位置是高还是低,在互联网上你都会被一串IP地址所代表,你的发声都会转变为字节码所传播。就像那句经典的话一样:在互联网上,你永远不知道屏幕背后坐的是一个人,还是一条狗。
然而,理想丰满,现实骨感。完全的自治型网络很难实现规模化,网络流量逐步被聚拢在了少数大平台之上。在经历过新闻门户、博客(微博)、微信公众号、推荐分发类应用等诸多信息分发平台后,我们发现信息的传播并未如最初设想的那样开放与平等,而是在传播过程中掺杂了巨大的噪声与偏差:话语权掌握在强势文化或少数大V的手中。
正是这种偏差,让我们在这个信息高度繁荣的时代,开始重新审视信息的生产、流通与沉淀全周期:什么样的发布者、什么样的内容获得了更大规模的传播(空间维度);什么样的发布者、什么样的内容值得沉淀下来、得到更长久地传播(时间维度)。信息传播的时间和空间维度,分别适用于不同的应用场景:被动浏览型消费,更关注于信息的空间传播范围;主动检索型消费,则更关注信息的时间生命周期。
空间维度,什么样的信息值得被传播?
在信息是否值得传播的空间维度上,让我们解构一下不同类型平台的信息传播拓扑结构。平台为信息的发布者和消费者提供了场所和链接通路,用户发表的信息大抵都会遵循平台的规则流动。具象来说,我们可以把信息想象成水流,平台定义了各种规则的流通管道,它可以通过调整规则管道去影响信息水流的流向。
- 对于传统的门户而言,信息主要受到平台的编辑控制。只有受到编辑的青睐,信息才能够得到更大的曝光量。在这样的平台上,信息流动的话语权是被专家(编辑)所把持的。我们通常倾向于认为这些筛选后的内容质量更高,但缺点也显而易见,更广泛用户的信息消费权实际上被少数专家所垄断了。
- 对于贴吧、论坛而言,信息则在专家加权(版主置顶与加权)之外,多了一层用户的投票。那些阅读量更高、回复更多的内容,往往会持续显示在首版之上,得到更大的曝光量。可以说,专家加权和用户投票共同影响了信息的流动。在这一结构中,用户的反馈得到了更高的权重(大多数用户认可的内容),但仍然是一种少数被多数代表的结构,小众发布者的声音很容易被掩盖。
- 进一步,在博客和微博时代中,用户通过订阅的方式与内容发布者建立联系,以期获得其后续更新。二者基于关注关联关系分发内容。此时,用户个体的自主选择权得到了体现,每个人都可以选择订阅自己喜欢的发布者。但这样的信息流动规则依然存在显著漏洞:粉丝更多的发布者、发布频率更频繁的发布者往往更容易形成马太效应,影响了更多用户的信息消费。这也是为什么,如Facebook、微博等平台后续不再使用单一订阅规则的原因。
- 接下来,进入了算法分发时代。平台以算法代替编辑规则或关注关系的分发,并将用户的反馈拆解得更加细致:用户看到的,不再是全局热门而是与己相关的区域热门。此时,信息的传递权不再把握在发布者手中,而是在消费者手中,只有消费者自己爱看的内容,才会得到曝光和分发。无论你是坐拥百万粉丝的大V还是初出茅庐的普通发布者,你创作的内容都会在算法分发下得到公平的对待。
回溯信息分发的不同阶段,我们可以看到,信息的传播平等在算法时代才得到了部分实现:信息传播的空间范围有了统一的衡量尺度(用户反馈),只要符合这一尺度标准,无论创作者贵贱,都能够得到广泛的传播。再小的声音,也有了被听到的机会。
时间维度,什么样的信息值得被沉淀?
在信息是否值得沉淀的时间维度,我们更关注已有平台是如何解决信息有效性和时效性问题,并挖掘出那些弱时效性的内容供用户更好的检索消费。
在垂直论坛上,版主会筛选出一些“长销”的内容标注为精华,从而将其沉淀在精华区。更有用心者,会构建出多级目录来使得内容的结构性更好。论坛新手可以借由精华区的阅读更好地了解垂直类论坛的风格。透过一个论坛精华区的结构和厚度,我们大体可以揣测出该论坛的积淀。
在综合平台上,这样的内容更多表现为百科或知识图谱的形式,综合者诸如维基百科、百度百科等、垂直者如豆瓣的图书库、汽车之家的车型库等等,这些通过PGC或UGC协同产生的百科条目能够给平台提供了更加结构化的信息数据,使之更好满足用户的主动搜索需求,从而提升服务的品质。
但无论是垂直论坛还是综合平台,内容的沉淀往往依赖于人的干预(加精华或编纂)。这决定了信息的被沉淀往往是大众向且相对滞后的:更低频、更小众的内容因为缺乏足够的专业编纂者而难以被发现;更繁杂的格式和更严格的审核需求导致有效性信息并不能第一时间成为沉淀内容。
这就是为什么很多问题不容易在百科中找到答案:要搜寻时效性的信息,我们更倾向于微博;而更小众的信息则只能通过搜索引擎,去那些少人问津的博客中挖掘。此外,现有百科类内容多为文字载体的现状,也限制了如声音、视频等富媒体内容沉淀下来的可能。
让时空汇聚,重新思考信息的有效传播与沉淀
既然算法能以统一的标准筛选出畅销内容,无论音视频内容都可以经由推荐算法分发,部分解决了信息传播的空间问题。那么,我们是否有可能通过算法去筛选出长销的知识型内容?
从这个假设出发,给业界带来了新的思考切入点:
通过算法的方式,我们可以首先分析内容的时效性、剥离出那些长时效性的内容,再通过语义分析,识别出其中更有信息量的部分,得到候选的可长期消费的内容集合。机器算法的介入,使得内容有价值与否的识别权从少数专家手中解放出来,更能够广开言路、不拘一格选用内容。在载体上,算法的介入进一步放开了文本载体的限制,可以同时容纳音、视频内容,从而构建出一个更具包容性的“多媒体百科”。
更让人兴奋的是,当时间因素和空间因素汇聚在一起,信息的流动也具有莫大的可能性。一些平台将算法分发内容与算法识别知识融合在一起,让信息的流动变得更有价值。以「Ta在」为例:
- 在长销型内容识别上,「Ta在」引入了演化群体智能算法(ECI),通过对信息点的抽取和组合,机器化的生成知识信息,使得沉淀内容的生产门槛变得更低、载体更丰富、响应也会更加迅速。想象一下,你用手机拍摄的少数民族山歌也会被系统沉淀为一段资料,这会是一件多么美妙的事情。
- 而将价值导向的长销型内容与消费导向的算法分发融合,又有效解决了算法分发一直为人诟病的信息茧房、内容趋于低质的问题。因为系统已经获悉了内容的价值,所以可以更好的平衡用户信息流的消费性和价值性,不再片面的追求点击率指标而产生媚俗的现象;在多样性探索上,系统也可以将那些更长销的内容推送给用户,从而帮助用户发现一个个新的窄众知识领域,提升消费体验的价值。
更好的消费体验必然给平台带来更大的消费规模,而更大的消费规模使得平台有能力更好的迈向心中的那个理想国:更平等、更开放的信息创作与传播。
无论发布者背景贵贱都可以创作内容,可以是一段文字、也可以是一段音频或视频,创作门槛被降到最低。只要内容被发布,就能够得到系统一视同仁的知识性抽取和探索性分发。有消费性的内容就会得到短期广泛的曝光,有沉淀性的内容则会以结构化的形式存储、得到长期而精准的分发。
「Ta在」的工作人员道:“这种全新的内容理解和内容分发方式不仅仅是对于内容价值的尊重,更是对创作者的尊重——让每一次发声都变得更有力量,让每一个创作都找到属于自己的位置。”