那个Nepomuk和Strigi是鸡肋吗
时间:2010-02-28
来源:互联网
总结一下:
1. 索引大量数据(如kernel源码)严重拖慢机器,
2. 索引效率也不高,数据库很大
3. 搜索能力弱(在kernel源码中找个函数也没搜到,当然也可能还没索引到,太庞大了)
这玩意难道只是看上去很美?
作者: allisfree 发布时间: 2010-02-28
不过我从来不用
作者: ashunter 发布时间: 2010-03-01
稍微“智能”一点的语义搜索,往往都采用统计数据。外国人做得也勉强倒还能接受了,但照搬过来换到中文环境,光切词(parsing)就费尽脑筋。
反正目前不要指望这个东西能很实用。
作者: sfbi 发布时间: 2010-03-01
作者: nolava 发布时间: 2010-03-01
至于语义搜索,个人感觉有全文搜索就够了,前不久看到一篇关于谷歌搜索算法的文章,感觉这就很好啊,虽然不大可能用在google desktop中
作者: allisfree 发布时间: 2010-03-01
作者: sfbi
关于语义检索,就连理论上都未能有大的结论(比如内涵逻辑的研究),类似地,目前所谓的“语义网”之类的东东纯属噱头。
稍微“智能”一点的语义搜索,往往都采用统计数据。外国人做得也勉强倒还能接受了,但照搬过来换到中文环境,光切词(parsing)就费尽脑筋。 反正目前不要指望这个东西能很实用。 |
总之,我只是开了nepomuk。另外那个Strigi太消耗系统性能了。
作者: dickeny 发布时间: 2010-03-01
作者: allisfree
谢谢大家,看了官网的讨论和诸位的意见,看来strigi的确没什么用,nepomuk可以使用元数据(tag),方便整理文档,就像图书馆的目录,还有点用,只是不知道这些元数据可以手工建立吗?
至于语义搜索,个人感觉有全文搜索就够了,前不久看到一篇关于谷歌搜索算法的文章,感觉这就很好啊,虽然不大可能用在google desktop中 |
参考:http://kde-video-tutorial.googlecode...deocapdemo.avi
作者: hurricanek 发布时间: 2010-03-01
简单的说,若在 kdesc 桌面实现组合关键字查询,strigi、soprano和nepomuk都是不可或缺的,而功能实现的基础和网络搜索引擎需要维护庞大的索引数据库一样,监控设定的文件数目越多,数据索引量越大,相应的索引系统资源消耗也是越来越大,很直观的表象就是拖慢了系统的运行速度,这也是目前”语义学搜索“功能让很多人诟病的主要原因。
但不可否认的是,这种状况在一点点的改变,在效率上如virtuoso存储后端的使用,加快了数据存储的速度;越来越多的系统状态监控,分散了数据检索给系统资源造成的负担;数据检索功能的扩展(例如搜索移动存储介质,局域网文件、与akonadi的结合)增加了它的实用性;不断增多的功能定制,更是把选择权留给了用户。
另外strigi的功能除了数据检索之外,文件属性的一些信息也是由它来提供的
作者: dbhrscom 发布时间: 2010-03-01
strigi,指定目录让它索引或关掉好了.索引kernel源码这样的大头.不是活受罪么.
strigi索引和akonadi我都是关掉的...akonadi好像只是kdepim组件用到它.
作者: zhong 发布时间: 2010-03-02
作者: hurricanek 发布时间: 2010-03-02
作者: dbhrscom
从桌面语义学搜索的功能定义来看,它类似一个桌面版的“搜索引擎”,strigi在其中扮演网络蜘蛛角色,用于探测各种文件类型和进行深度搜索,而搜索结果存取由soprano负责,nepomuk的一些模块提供文件系统监测、搜索种类维护(例如tag,rate)、搜索调用接口等功能。
简单的说,若在 kdesc 桌面实现组合关键字查询,strigi、soprano和nepomuk都是不可或缺的,而功能实现的基础和网络搜索引擎需要维护庞大的索引数据库一样,监控设定的文件数目越多,数据索引量越大,相应的索引系统资源消耗也是越来越大,很直观的表象就是拖慢了系统的运行速度,这也是目前”语义学搜索“功能让很多人诟病的主要原因。 但不可否认的是,这种状况在一点点的改变,在效率上如virtuoso存储后端的使用,加快了数据存储的速度;越来越多的系统状态监控,分散了数据检索给系统资源造成的负担;数据检索功能的扩展(例如搜索移动存储介质,局域网文件、与akonadi的结合)增加了它的实用性;不断增多的功能定制,更是把选择权留给了用户。 另外strigi的功能除了数据检索之外,文件属性的一些信息也是由它来提供的 |
所以目前现实的做法全是采用统计数据的(至少统计数据占有重要作用),于是也需要索引数据,加以分析。可即使做到再好,也只能无限接近,而永远无法实现真正智能(比如达到普通人的水准)的语义检索。
作者: sfbi 发布时间: 2010-03-02
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28