Growthroute Ventures公司创始人Greg Boutin最近撰写了三篇系列文章。这些文章试图把基于结构化数据的三大趋势结合到一起:1) 羽翼渐丰的 "Web 3.0" , 2) 结构化网络中的黑马关联数据(Linked Data),3) 以及由来已久的传奇:语义网(Semantic Web)。 以下对其进行简单介绍:
Web 3.0: Web 2.0之后轮到谁?
Boutin的第一篇文章认为Web 3.0无法解决信息超载问题。至少现在还不行,因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据,需要很长的时间才能将这些数据结构化。
去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱,让所有人随时随地地联系在一起,让整个网络更加智能。”
至少我认为,如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络,那么Web 3.0则意味着开放和结构化数据,让网络更加“聪明”。
关联数据(Linked Data): 结构化数据,但不一定是语义数据
Greg Boutin第二篇文章谈到了关联数据。他认为关联数据提供了关联结构化数据的新媒介,可以让机器更好地读取这些数据。但是,关联数据本身不会给信息增加任何语义含义,而是更好地携带语义数据,供用户访问。所以,关联数据虽然本身并不具备语义特征,但它可以在数据层面建立关联,为真正的语义网铺平道路。
关联数据这个概念来自W3C,该组织有一个关联开放数据(LOD)项目。以下图表列出了参与该项目的数据集。其中包括著名的Thomson Reuters的Open Calais项目 , Freebase, 和DBpedia。这些数据集是在现有本体论(ontologies)基础之上建立的,如WordNet,FOAF, 和SKOS,然后在它们之间建立关联。
Greg Boutin在其第三篇文章中写道,关联数据格式不会创建智能数据,仅仅是支持。他建议人们集中精力开发把非结构化数据进行结构化的技术。他还建议创业者应该考虑把关联数据和其它技术进行混搭。
语义网:Google唱主角
但是 RDFa(允许发布者把RDF嵌入到HTML)带来了一线希望。 Google本周宣布将在其“富媒体代码”中支持RDFa,而雅虎早在去年就大胆地推出了搜索猴子(Search Monkey ),达到了同样的目的。
Google将在语义网主流化过程中扮演重要角色。Google目前正在从半结构化和非结构化数据中解析语义结构数据。有人称Google算法远非统计方法论那么简单,它早就在研发语义技术了。
Google也并非没有竞争对手。除了雅虎,微软去年夏天收购 Powerset也是瞄准了这个市场。
结论
Web 3.0是一个没有统一定义的词语,或者根本不应该这么称呼。但是很显然,结构化数据时代已经到来。我们从当前的关联数据热潮中就可以看到它的影子,并且得到了Google和雅虎等大公司的支持。谁知道呢,或许语义网也就在隔壁不远处。
编译:pestwave