网络新时代：Web3.0、关联数据和语义网

　　Growthroute Ventures公司创始人Greg Boutin最近撰写了三篇系列文章。这些文章试图把基于结构化数据的三大趋势结合到一起：1) 羽翼渐丰的 "Web 3.0" ， 2) 结构化网络中的黑马关联数据(Linked Data)，3) 以及由来已久的传奇：语义网(Semantic Web)。以下对其进行简单介绍：

　　Web 3.0: Web 2.0之后轮到谁?

　　Boutin的第一篇文章认为Web 3.0无法解决信息超载问题。至少现在还不行，因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据，需要很长的时间才能将这些数据结构化。

　　去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱，让所有人随时随地地联系在一起，让整个网络更加智能。”

　　至少我认为，如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络，那么Web 3.0则意味着开放和结构化数据，让网络更加“聪明”。

　　关联数据(Linked Data): 结构化数据，但不一定是语义数据

　　Greg Boutin第二篇文章谈到了关联数据。他认为关联数据提供了关联结构化数据的新媒介，可以让机器更好地读取这些数据。但是，关联数据本身不会给信息增加任何语义含义，而是更好地携带语义数据，供用户访问。所以，关联数据虽然本身并不具备语义特征，但它可以在数据层面建立关联，为真正的语义网铺平道路。

　　关联数据这个概念来自W3C,该组织有一个关联开放数据(LOD)项目。以下图表列出了参与该项目的数据集。其中包括著名的Thomson Reuters的Open Calais项目 , Freebase, 和DBpedia。这些数据集是在现有本体论(ontologies)基础之上建立的，如WordNet,FOAF, 和SKOS，然后在它们之间建立关联。

　　Greg Boutin在其第三篇文章中写道，关联数据格式不会创建智能数据，仅仅是支持。他建议人们集中精力开发把非结构化数据进行结构化的技术。他还建议创业者应该考虑把关联数据和其它技术进行混搭。

　　语义网：Google唱主角

那些以上这些趋势会如何影响语义网呢?Tim Berners-Lee 认为语义网可以用于商业目的，但现实却是，目前使用资源描述框架(RDF)的实际应用寥寥无几。

　　但是 RDFa(允许发布者把RDF嵌入到HTML)带来了一线希望。 Google本周宣布将在其“富媒体代码”中支持RDFa，而雅虎早在去年就大胆地推出了搜索猴子(Search Monkey )，达到了同样的目的。

　　Google将在语义网主流化过程中扮演重要角色。Google目前正在从半结构化和非结构化数据中解析语义结构数据。有人称Google算法远非统计方法论那么简单，它早就在研发语义技术了。

　　Google也并非没有竞争对手。除了雅虎，微软去年夏天收购 Powerset也是瞄准了这个市场。

　　结论

　　Web 3.0是一个没有统一定义的词语，或者根本不应该这么称呼。但是很显然，结构化数据时代已经到来。我们从当前的关联数据热潮中就可以看到它的影子，并且得到了Google和雅虎等大公司的支持。谁知道呢，或许语义网也就在隔壁不远处。

　　编译：pestwave

网络新时代：Web3.0、关联数据和语义网

techsir