SEO的外链建设相关性详细分析
时间:2011-01-02
来源:互联网
记住,“蜘蛛”是个抓取“程序”,不是“人工智能”。他是模拟人类的判断逻辑来判断相关性,用一些“逻辑程序”,毕竟蜘蛛程序并不复杂(对比来说)。
明白了上述情况,我来说说我自己对“相关性”的看法和建设心得。
——你的网页和你网页中的内容相关性,在蜘蛛程序中的判断:——
假设你的网页是新的网页,刚做了不到 2 天,刚提交,蜘蛛根据"抓取索
引",过来抓取(或通过其他形式的链接)。
首先,蜘蛛通过各种连接来到了你的网页,对于他来说,新的网页特征就是
从网页代码中的<head>部分中的<title>标签里的元素来判断的。
假设蜘蛛来到的你这个网页,抓取了网页中的<title>文字:我的宠物论坛 -新宠物 - 宠物新主张!
蜘蛛首先会以抓取<title>中的文字做为“关键词”为参考,然后去从网页代码中去寻找相关的“关键词”。
你可以放心,蜘蛛可以判断一些 JS 代码和页面中的标签,他会比较重视正文和 div 块中的标题部分的“关键词”,也就是<h1>-<h4>一系列的。这也可以验证大家说的,为什么<h1>-<h4>中的内容,会比其他<body>中的文本内容权重高的原因。然后蜘蛛会把<tilte>中在正文<body>部分重复次数最多的词,定为“参考关键词”(当然了,有个重复限度,搜索引擎会设定并嵌入蜘蛛程序里)。
然后蜘蛛自己也会根据“参考关键词”判断“关键词扩展”(根据搜索引
擎的相关类的常用数据关键词和 title 中关键词分析对比),综合以上,确定大体
的 “关键词”,做为下一步页面抓取的参考。
下一步,蜘蛛会计算(这个简单的数据计算功能还是有的)所有关键词在网
页代码中出现的数量,作为基数。然后计算<body>标签中“关键词”的数量,
作为分子(汗,想不出什么词了,通俗第一)。然后一除,就得出了你这个页面
的关键词密度。
密度出来了以后,搜索引擎自己会有个标准判断(人为设计的参数),有个
等级,?-?是最合理的,?—?是一般的,?—?是最差的,这个标准时刻在
变,总之是根据一段时期的数据进行调整的(就是让你隔段时间闹一回心)。
好了,密度的判断出来后,进行本页的关键词差别对比。
以<tilte>中的关键词为基础,综合了“扩展关键词”的参考,对比在
<body>部分中抓取的“关键词”,对比他们每个文字上的差别。(比如搜索引擎
定下的关键词为“动漫”,而<body>文本中有:宠物论坛,新宠物-等等),差别
也分个等级,差别不大的,成为了长尾关键词,差别大的,就被舍弃做为这个页
面的搜索关键词,这个和“关键词密度”判断方法相同。 这样,页面长尾词和
搜索关键词就确定了下来~
当密度和页面关键词差别这 2 项得到了 2 个结果后,会有个权数加的计算公
式(引擎自己定的,也定期根据数据调整),得出一个对“相关性”的得分(类似 baidu 指数的算法),从而判断页面的关键词,确定页面内容和关键词的相关
性联系程度。
页面的关键词和页面内容的相关性就这么得出来的。
那么,外部链接的相关性怎么判断?好,下面谈谈,进入第 2 部分
--外部连接和网页相关性的判断:--
单向链接:
他网页链接到你的网页的链接。
在他的网页上,你网站的链接锚文字描述必须是和他链接到你的这个页面的
关键词相关,或相近,蜘蛛的判断方法和第一部分一样,只不过起始的“关键词”
参考,变成了在他网页上,你的网页的链接錨文字。
话说回来,这个网页的相关性和你的网站有多高,这个蜘蛛怎么判断?
这个链接锚文字就成了桥梁和参考。
关系可以理解为这样:
你的网页的关键词 VS(相关度判断,设为 A)→ 锚文字(为链向你的网页
上的锚文字)←(相关度判断,设为 B)他的网页的关键词
PS:判断 A 和 B 的方法,参考第一部分:你的网页和你网页中的内容相
关性,在蜘蛛程序中的判断。
A 和 B 得出之后,进行对比,差值在一定范围内,蜘蛛会有个等级标准(人
为设定)。比如 A 和 B 差 10%以内,为相关度最高,2 个网页权重增加,增加为
一个权数的算式结果(可能只是对网页的质量有影响,排名的影响不太清楚,待
观察);10%-15%........等等,我就不写了。
友情链接:
涉及到 2 个页面上的锚文字,方法大同小异。
你的网页的关键词 VS(相关度判断,设为 A)→ 锚文字(其中一个网页上的
锚文字)←(相关度判断,设为 B)他的网页的关键词
你的网页的关键词 VS(相关度判断,设为 C)→ 锚文字(另一个网页上的锚
文字)←(相关度判断,设为 D)他的网页的关键词
A 和 B 对比得出一个权数算式结果:E ;
C 和 D 对比得出一个权数算式结果:F
E 和 F 最后进行对比,得出最后的权数算式结果。
从而判断 2 个网页在交换链接中,2 个网页的相关性判断。
以上情况适合于单向的链接相关性判断,和友情链接相关性判断。
附言:不要把自己当成SEO 或者是网站建设者的角度去考虑,把自己当成是baidu
的搜索算法的工程师角度去思考。在一切未知的情况下,如果我是 baidu 的算法工程师,我会怎么去开发这个算法。
比如:
众多的网页中,怎么让蜘蛛去判断网站的关键词?
怎么判断你的网页中关键词密度?
怎么判断链接的相关性?
怎样判断权重?
然后根据自己的想法去实践,慢慢的就会验证你的想法和改进你的想法,总有一
天会接近搜索引擎的算法的,那个时候就不用很累了~~
搜索本身就是模糊算法和权数法则的运用,我们不需要知道具体运行计算的数据,只要知道他的流程就好了~~
思路永远比方法重要,SEO 更是如此,如果一味的追求具体的算法,我想应该是开发者的事情,而不是我们这些 SEO 该研究的东西。
作者: wuruipo 发布时间: 2011-01-02
作者: jd800 发布时间: 2011-01-02
作者: wangruolun 发布时间: 2011-01-02

作者: ksxl0054709 发布时间: 2011-01-02
作者: 沙和尚 发布时间: 2011-01-02
作者: tianshizhiyi99 发布时间: 2011-01-02
作者: 广东SEO-深圳SEO 发布时间: 2011-01-02
作者: a732317375 发布时间: 2011-01-02
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28