+ -
当前位置:首页 → 问答吧 → 分词对优化的详解

分词对优化的详解

时间:2010-12-31

来源:互联网

对于刚开始做优化的新手来说,在写文章时,标题上家上关键词是非常重要的,比如说你做的关键词是”上海seo”,如果把这样的关键词加入到标题中,可能会影响到你文章标题的可阅读性,毕竟不是简单的把你关键词罗列出来,而且这样做的话,很容易被百度判定为关键词堆砌.所以这就需要用到分词技术.毕竟不能为了优化而优化.
    当你去百度查询时,提交一个关键词给搜索引擎,而搜索引擎对你提供的词做一系列的匹配处理,如果关键词不超过三个的话.就直接去数据库查找,如果超过三个的话就将用户提交的关键词分割成若干个词来查询.或者按照中文习惯来分割,更或者说关键词的权重.
    比如说你在百度中查询”上海网站优化”,你会发现百度先按你关键词的权重去匹配上海网站优化,当和这个关键词匹配完毕后,接下来就去把你的关键词分割成为:”上海”,”网站”,”优化”.通过这样的匹配增加搜索引擎搜索出来的结果数量.还有一点就是查看这个词有没有重复,有的话就去删除掉,通过这样的上海seo研究.我们可以总结几点出来.
    分词技术可以分为三大类:
    第一个是利用字符串的匹配
    第二个是基于理解
    第三个是基于统计
    那么我们分别来介绍下:
    第一种,字符串匹配:
    搜索引擎按照一般的阅读习惯从左到右的顺序来分割你的查询内容.另一种就是把前面说的方法烦过来.最后一种方法就是就是尽量少的分割出关键词.一般搜索引擎通过上面的三种方法的结合,这样做才能减少分词中的出错率,提供给用户匹配度最高的信息.
    第二种,基于对你提供的搜索信息的理解.
    虽然说搜索引擎只不过是一个软件而已,但是对于一些语言还是能理解的.通过中文中的语法,语义,词义,描述能来理解用户的需求.但是这门技术还不是很完善.所以可以暂时不去用.
    第三种,统计,其实说白了.就是你搜索的关键词在搜索引擎的数据库中有多少次,如果出现的次数多的话,就是权重比较高的词.但是这样的方法出现的错误率比较的高.在中文中如:”的”,”我”等..

作者: knnliang   发布时间: 2010-12-31

分词.....好细致啊......

作者: 凝凝飞儿   发布时间: 2010-12-31