-
2009-01-08
智能系统 - [billjeff:Research]
版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://billjeff.blogbus.com/logs/33563491.html
最近准备一些论文,把语义网络在个人PC桌面管理方面的最新研究进展调研了一下。正式一点的名字是叫语义桌面。自己对这个方向也很感兴趣,有一些相关的论文,但是不是很多。总的来说,就是对个人电脑里面的内容进行语义描述,然后在获得的这堆数据上做处理,提供服务。这么看来,做这个东西,系统设计思路算是比较直观,获取数据,设计核心处理代码(元数据查询、推理),最后就是设计交互式界面。这里的问题是:如何获取语义数据,系统的推理能力究竟有多强。这两个问题其实也是比较相关联的,推理建立数据之上。在设计推理能力上,我目前还没做过实验和测试,在考虑这个问题的时候,需要考虑目前语义网开发的基础设施(工具),要是自己提出的需求超出目前所能获取的这些工具的范畴,那岂不是需要自己去开发一套新的工具,甚至重新定义一套标准,这个工作量就比较大了。还需要考虑性能问题,数据量大的时候(我没测试过,但是性能问题是很显然的),复杂的推理功能势必会和性能搭上关系。当然,还有一个更大的问题,那就是元数据的获取。这个问题,对于语义网开发来说,是一个通用的问题,如何从非结构化的数据当中获取元数据。一个方式是人来做,我一直认为这种方法是可行的,而且我也愿意去做,可是世界上有形形色色的人,有些人就不愿意,何况目前有大量的非结构化数据,因此研究自动获取元数据的方法势在必行,目前在做的,比如从良好的数据源进行入手,像把wikipedia当作数据源,powerset就是拿它做数据源。当然,wikipedia里面更多的是文本,这时候就需要借助NLP、Machine Learning等技术,总之,这是一块比较大的问题。要是能够比较好的解决元数据获取问题,我们用的各种系统会比现在聪明许多:)
当然,事情可以更进一步。正如把各台孤立的电脑连成网络能产生如今的互联网,把孤立的数据放到一块儿也能干很多有意思的事情。系统产生的元数据本身从设计初衷来看,就是为了方便集成、共享。元数据加上各种技术使得系统更加聪明易用,再在所有人的数据当中进行挖掘分析,又能够获取更多有意思的东西,比如做一些推荐了。商品购物网站,例如淘宝,能够利用Data Mining等技术进行商品推荐,那是在计算机不知道数据语义信息基础之上做的事情,要是系统明白数据的意思,试想会有怎样的效果。
无论是什么技术,一个共同点是我们的系统越来越聪明。这种发展趋势是非常明显的,也是很显然的。计算机能完成过去由人来做的事情,从而人从琐碎的事情当中解放出来,可以去关注更加High Level的东西,大家都愿意这样。过去把读书笔记写在纸上,要用到了需要想想究竟记在那个地方了,到现在记在电脑里,要看的时候通过搜索等功能,电脑帮我们完成了很多的事情,提高了效率。而以后,应该是电脑能够明白一些简单的做事流程,理解数据的含义,去完成过去我们需要自己去做的事情。Google的搜索根据个人的喜好定制自己的搜索结果,而不是我用了N回,每次都是一样的结果,即使我对某些结果不会去点击一次。
今晚看Read Write Web,老外在这方面还是做了不少产品的,而且这些产品不少被大的公司使用。在这方面,应该有很大的市场,但是对技术创新也要求比较高。不过没事,有心思了不妨去摸索一把,至少没什么坏处吧:)
return ;
随机文章:
Oooops, 有人站出来挑战W3C喽。。 2008-04-15更新了我的豆瓣 2007-12-21OntoGame 2007-12-17Dec 2009 2009-12-0311月闲言闲语 2009-11-10
收藏到:Del.icio.us







