距离年初维基百科向全球募集资金一事已过去一段时间,维基百科再一次从人们视野的中心消失。一段沉寂过后,维基基金会披露了维基百科的下一个大动作,实施“维基数据”(Wikidata)项目,打造一个机器可读、用户可编辑的超大知识数据。
如果稍加留心,就会发现今年2月在柏林举行的语义
技术与商业峰会上,维基基金会就向外界展示了维基数据项目的存在。现在,维基基金会公布了更多细节。维基数据项目的目的是建立一个机器可读、用户可编辑的,基于语义的超大知识
数据库。当然,维基数据仍然会以免费知识共享(Creative Commons)的授权形式发布,数据可供任何外部应用调用。
维基数据的一个早期设计理念
维基数据将会收录全球不同本地化版本维基百科中那些具有共同认识的条目。共同条目的收录,在英文、德文、法文和荷兰文版本的维基百科中比较容易实现,它们的条目内容差异不大,只是表达运用的语言不同。其他语言的维基百科因条目存在巨大差异性,整合过程将比前4个版本维基百科要慢。维基数据还将收录用户提出的各类型的问题,自动编制成问题列表。反观现在的维基百科,用户提出的各类型的问题,都需要人工创建问题列表进行汇集,问题的答案也有赖于人工添加。
现在,这项庞大的项目已经开始动工,负责实施这项重大任务的是维基百科德国分部。维基百科德国分部完成相应的工作后,将把维基数据运营和维护的主管权力移交给维基基金会。整个工程计划分3阶段进行,涉及为每条维基百科条目创建一个维基数据页面,统一格式化数据的来源,创建问题列表等诸多繁杂的工作,预计在明年3月完工,届时维基数据将移交给维基基金会。
目前,维基数据已经收到了130万欧元的赞助,其中半数来自
微软联合创始人保罗艾伦于2010年创立的人工智能研究机构,还有四分之一的赞助来自Gordon Betty Moore基金会 ,另外四分之一的赞助则由
google提供。