-
花一样的关联数据 - [web2.0]
2009-05-26
原以为关联数据(Linked Data)的短板是没有大公司应用。其实自己是孤陋寡闻了。最近一则消息是Google搜索的“Rich Snippets”项目,涉及了微格式(microformats)和RDFa应用于数据标注,并且很快会有市场应用。Google对于结构化数据的关注终于超过了对于文件的关注。Google会不会在已有的20多亿个RDF外面去爬呢?无论如何,以后Google检索结果页面就会出现以下熟悉的代码:
<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person">
<p><span property="v:name"><strong>TYQB</strong></span></p>
<p><span property="v:title">Senior Editor</span> at <span property="v:org">Digital Library Forum</span></span></p>.....
对于结构化数据的关注就是Linked Dada的基础,更为重要的是,这些结构化数据的自我描述可以实现以各个数据“花盆(silos)”标准的同一性和开放。李爵士心目中的关联数据应该是通过HTTP获取的,用URI作数据对象标识,以开放标准连接并可催生出更多的丰富多彩的、像花一样的数据的数据。

记得去年有个关联数据项目很瞩目,雷诺汽车的Servant关于企业内部运用Linking Enterprise Dta的研究实例,连Paul Miller也很推崇。一年之后,关联数据的企业级应用已经适用于万维网了。真快。
关联数据有两个比较有趣的应用。一是开源的Drupal7,其数据库可以直接暴露在万维网上(转帖:Drupal, the semantic web and search)。Drupal7采用RDFa,支持Virtuoso的ODBC,支持OpenLink Data Spaces (ODS),其字段可以带有FOAF、VCRAD之类的微格式标注。二是Hans Rosling的Motion Cart(又是一个被Google收购的Gadget),记得远洋师、雨师早已做过演示。有兴趣可以自己DIY一下。数据关联的可视化很有趣。
至于关联数据(在图书馆人眼里就是元数据)在图书馆的应用,应该不会像Web2.0那样需要理念的培养,它毕竟属于纯技术的范畴。图书馆的书目数据和OPAC完全可以是关联数据的受益者。L.Morgan有个很不错的、关于作品“瓦尔登湖”的Demo可以看看。当然,有一个含金量较高的关联数据FAQ可以参见KEVEN的博文。
有两个疑问:关联数据是不是毫无语义?RDFa如何适用于非结构化数据和干预后的原始数据(如地方政府的GDP)?看来需要自己更多地结构化地学习了。








评论