百度快照现象分析及解决方法

首先,思创SEO必须体现各位明确快照的作用:从快照时间读出蜘蛛抓取频率;网站快照更新的时间及频率,和搜索引擎抓取网站内容的频率有关系,如果网站的快照更新频率很快,至少可以说明搜索引擎的蜘蛛会经常光临网站。

 
  其次:快照与权重:快照更新频繁与否,除了反映读出的蜘蛛抓取频率之外,还反映的着一种趋势。

        这个趋势说明的就是:按照搜索引擎现行的规则,网站已经得到了蜘蛛的认可,如果在规则不变的情况下,网站还是按照这种趋势来发展,网站的权重会慢慢提高,排名也就会上去了。

 

       快照不更新的原因有几种总结:

      1.  网站做过改动,比如修改网站的标题、关键词、模板等

      2.更新的内容重复性太高,质量不佳,不符合主题,或者长期的不更新网站内容

      3.使用黑帽技术,作弊行为

      4.低质量友链

 

 
  关于快照日期回滚的原因:

        通常情况下,快照的日期是向着正方向行进的。当然也会有停滞不前或者更新缓慢的,这是由于网站建设或者操作手法上出现了的问题。

 
  但是网站遭遇快照日期回滚就属于比较严重的问题了,这意味这网站本身出现了问题。或许是大量重复内容、或许是网站被挂马之类影响用户体验的情况。这时候咱们必须引起警觉!

          网站怎么做seo,应该懂得每一项基本的SEO技能。

         快照充其量占据排名的权重应该是30%的,一个网站多少的小修改是有的,没人能保证自己的站是一百年不变;友链换的是交情,换的是对手的实力:一个网站的内容,除非是大品牌运营的站,没人确保是完全保质保量的。

         最后:如果你的友链对象什么都不懂,还问你怎么检查,怎么交换,有什么标准,请慎重合作。

         如果你的友链对象是黑帽高手,如狼雨番,精通怎么骗你链接,那你也掂量掂量自己的实力。

 
         快照不更新,高手有办法。因为当你认真观察很多所谓的百度首页词排名时,你没认真的去研究结果。百度“耳麦”,有几个快照是新的,当然,如果你是高级的SEOER,你去分析的就不仅仅是搜索结果,分析什么,这里铺个后路,后面再叙。

        如果你硬是要纠结一阵,请让对方告诉你,你的关键词排名是不是在百度首页,首页才是传递权重的王道,排的到首页,其他的操作手法,你不用替对方想了。

        如果你特别纠结换友链快照,请纠结,怎么改进自己的快照,赠送一段话:高质量的网站主主宰百度排名,而不主宰快照。

 

什么是百度蜘蛛,蜘蛛IP是多少?如何查看蜘蛛是否光临

SEO推测:百度蜘蛛的ip段是根据网站权重不同分别派发

baidu派来你站的蜘蛛ip段是:202.181.7.*
还是:123.125.66.*

据说202.181.7.* 段的是高权重。

什么是baiduspider?

baiduspider是百度搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页。

baiduspider对一个网站服务器造成的访问压力如何?

baiduspider会自动根据服务器的负载能力调节访问密度。在连续访问一段时间后,baiduspider会暂停一会,以防止增大服务器的访问压力。所以在一般情况下,baiduspider对您网站的服务器不会造成过大压力。

为什么baiduspider不停的抓取我的网站?

对于您网站上新产生的或者持续更新的页面,baiduspider会持续抓取。此外,您也可以检查网站访问日志中baiduspider的访问是否正常,以防止有人恶意冒充baiduspider来频繁抓取您的网站。如果您发现baiduspider非正常抓取您的网站,请反馈,并请尽量给出baiduspider对贵站的访问日志,以便于我们跟踪处理。

我不想我的网站被baiduspider访问,我该怎么做?

baiduspider遵守互联网robots协议。您可以利用robots.txt文件完全禁止baiduspider访问您的网站,或者禁止baiduspider访问您网站上的部分文件。注意:禁止baiduspider访问您的网站,将使您的网站上的网页,在百度搜索引擎以及所有百度提供搜索引擎服务的搜索引擎中无法被搜索到。

关于robots.txt的写作方法,请参看我们的介绍:robots.txt写作方法

为什么我的网站已经加了robots.txt,还能在百度搜索出来?

因为搜索引擎索引数据库的更新需要时间。虽然baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要二至四周才会清除。另外也请检查您的robots配置是否正确。

百度蜘蛛在robots.txt中的名字是什么?

“baiduspider”全部为小写字母。

baiduspider多长时间之后会重新抓取我的网页?

百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间,baiduspider会重新访问和更新一个网页。

知道了什么是百度蜘蛛,那么怎么才能知道蜘蛛是否来过你的站?这个可以从你服务器或者虚拟主机的日志中看出来,比如我用的虚拟主机的完整使用日志中有这样的记录:

220.181.38.198 – - [11/Nov/2007:04:28:29 +0800] “GET / HTTP/1.1″ 200 61083 “-” “Baiduspider”这就说明百度蜘蛛来过我的站了,如果你还想知道有没有其它搜索引擎的蜘蛛来过你的站,你可以在日志文件中搜索“spider”这个词,或者搜索蜘蛛的IP,我的就查到sogou也来过我的站,IIS日志与Apache的日志是一样的,都可以查到。

各类蜘蛛IP收集,不一定完全准确。

序号 IP 注释

1 202.106.186.* 163蜘蛛

2 202.108.36.* 163蜘蛛

3 202.108.44.* 163蜘蛛

4 202.108.45.* 163蜘蛛

5 202.108.5.* 163蜘蛛

6 202.108.9.* 163蜘蛛

7 220.181.12.* 163蜘蛛

8 220.181.13.* 163蜘蛛

9 220.181.14.* 163蜘蛛

10 220.181.15.* 163蜘蛛

11 220.181.28.* 163蜘蛛

12 220.181.31.* 163蜘蛛

13 222.185.245.* 163蜘蛛

14 202.165.100.* 3721蜘蛛

15 220.181.19.* 百度蜘蛛

16 159.226.50.* 百度蜘蛛

17 202.108.11.* 百度蜘蛛

18 202.108.22.* 百度蜘蛛

19 202.108.23.* 百度蜘蛛

20 202.108.249.* 百度蜘蛛

21 202.108.250.* 百度蜘蛛

22 61.135.145.* 百度蜘蛛

23 61.135.146.* 百度蜘蛛

24 64.124.85.* become.com

25 61.151.243.* china蜘蛛

26 202.165.96.* gais.cs.ccu.edu.tw

27 216.239.33.* google蜘蛛

28 216.239.35.* google蜘蛛

29 216.239.37.* google蜘蛛

30 216.239.39.* google蜘蛛

31 216.239.51.* google蜘蛛

32 216.239.53.* google蜘蛛

33 216.239.55.* google蜘蛛

34 216.239.57.* google蜘蛛

35 216.239.59.* google蜘蛛

36 64.233.161.* google蜘蛛

37 64.233.189.* google蜘蛛

38 66.102.11.* google蜘蛛

39 66.102.7.* google蜘蛛

40 66.102.9.* google蜘蛛

41 66.249.64.* google蜘蛛

42 66.249.65.* google蜘蛛

43 66.249.66.* google蜘蛛

44 66.249.71.* google蜘蛛

45 66.249.72.* google蜘蛛

46 72.14.207.* google蜘蛛

47 61.135.152.* iask蜘蛛

48 65.54.188.* msn蜘蛛

49 65.54.225.* msn蜘蛛

50 65.54.226.* msn蜘蛛

51 65.54.228.* msn蜘蛛

52 65.54.229.* msn蜘蛛

53 207.46.98.* msn蜘蛛

54 207.68.157.* msn蜘蛛

55 194.224.199.* noxtrumbot

56 220.181.8.* Outfox

57 221.239.209.* Outfox

58 217.212.224.* psbot

59 219.133.40.* QQ蜘蛛

60 202.96.170.* QQ蜘蛛

61 202.104.129.* QQ蜘蛛

62 61.135.157.* QQ蜘蛛

63 219.142.118.* sina蜘蛛

64 219.142.78.* sina蜘蛛

65 61.135.132.* sohu蜘蛛

66 220.181.26.* sohu蜘蛛

220.181.19.*

67 61.135.158.* tom蜘蛛

68 66.196.90.* yahoo蜘蛛

69 66.196.91.* yahoo蜘蛛

70 68.142.249.* yahoo蜘蛛

71 68.142.250.* yahoo蜘蛛

72 68.142.251.* yahoo蜘蛛

73 202.165.102.* yahoo中国蜘蛛

74 202.160.178.* yahoo中国蜘蛛

75 202.160.179.* yahoo中国蜘蛛

76 202.160.180.* yahoo中国蜘蛛

77 202.160.181.* yahoo中国蜘蛛

78 202.160.183.* yahoo中国蜘蛛

79 72.30.101.* yahoo蜘蛛

80 72.30.102.* yahoo蜘蛛

81 72.30.103.* yahoo蜘蛛

82 72.30.104.* yahoo蜘蛛

83 72.30.107.* yahoo蜘蛛

84 72.30.110.* yahoo蜘蛛

85 72.30.111.* yahoo蜘蛛

86 72.30.128.* yahoo蜘蛛

87 72.30.129.* yahoo蜘蛛

88 72.30.131.* yahoo蜘蛛

89 72.30.133.* yahoo蜘蛛

90 72.30.134.* yahoo蜘蛛

91 72.30.135.* yahoo蜘蛛

92 72.30.216.* yahoo蜘蛛

93 72.30.226.* yahoo蜘蛛

94 72.30.252.* yahoo蜘蛛

95 72.30.97.* yahoo蜘蛛

96 72.30.98.* yahoo蜘蛛

97 72.30.99.* yahoo蜘蛛

98 74.6.74.* yahoo蜘蛛

99 202.108.4.* 中搜蜘蛛

100 202.108.4.* 中搜蜘蛛

101 202.108.33.* 中搜蜘蛛

102 202.96.51.* 中搜蜘蛛

103 219.142.53.* 中搜蜘蛛

[/td][/tr][/table]

欣欣520 2008-1-3 17:38

序号 IP 注释

1 202.106.186 163

2 202.108.36 163

3 202.108.44 163

4 202.108.45 163

5 202.108.5 163

6 202.108.9 163

7 220.181.12 163

8 220.181.13 163

9 220.181.14 163

10 220.181.15 163

11 220.181.28 163

12 220.181.31 163

13 222.185.245 163

14 202.165.100 3721

15 220.181.19 baidu

16 159.226.50 baidu

17 202.108.11 baidu

18 202.108.22 baidu

19 202.108.23 baidu

20 202.108.249 baidu

21 202.108.250 baidu

22 61.135.145 baidu

23 61.135.146 baidu

24 64.124.85 become.com

25 61.151.243 china

26 202.165.96 gais.cs.ccu.edu.tw

27 216.239.33 google

28 216.239.35 google

29 216.239.37 google

30 216.239.39 google

31 216.239.51 google

32 216.239.53 google

33 216.239.55 google

34 216.239.57 google

35 216.239.59 google

36 64.233.161 google

37 64.233.189 google

38 66.102.11 google

39 66.102.7 google

40 66.102.9 google

41 66.249.64 google

42 66.249.65 google

43 66.249.66 google

44 66.249.71 google

45 66.249.72 google

46 72.14.207 google

47 61.135.152 iask

48 65.54.188 msn

49 65.54.225 msn

50 65.54.226 msn

51 65.54.228 msn

52 65.54.229 msn

53 207.46.98 msn

54 207.68.157 msn

55 194.224.199 noxtrumbot

56 220.181.8 Outfox

57 221.239.209 Outfox

58 217.212.224 psbot

59 219.133.40 QQ

60 202.96.170 QQ

61 202.104.129 QQ

62 61.135.157 QQ

63 219.142.118 sina

64 219.142.78 sina

65 61.135.132 sohu

66 220.181.26 sohu

67 61.135.158 tom

68 66.196.90 yahoo

69 66.196.91 yahoo

70 68.142.249 yahoo

71 68.142.250 yahoo

72 68.142.251 yahoo

73 202.165.102 yahoo

74 202.160.178 yahoo

75 202.160.179 yahoo

76 202.160.180 yahoo

77 202.160.181 yahoo

78 202.160.183 yahoo

79 72.30.101 yahoo

80 72.30.102 yahoo

81 72.30.103 yahoo

82 72.30.104 yahoo

83 72.30.107 yahoo

84 72.30.110 yahoo

85 72.30.111 yahoo

86 72.30.128 yahoo

87 72.30.129 yahoo

88 72.30.131 yahoo

89 72.30.133 yahoo

90 72.30.134 yahoo

91 72.30.135 Yahoo

92 72.30.216 yahoo

93 72.30.226 yahoo

94 72.30.252 yahoo

95 72.30.97 yahoo

96 72.30.98 yahoo

97 72.30.99 yahoo

98 74.6.74 yahoo

99 202.108.4 zhongsou

100 202.108.33 zhongsou

101 202.96.51 zhongsou

102 219.142.53 zhongsou

-------------百度-------------

31.135.145.*

61.135.145.*

61.135.146.*

159.226.50.*

202.108.11.*

202.108.22.*

202.108.23.*

202.108.249.*

202.108.250.*

220.181.19.*

-------------雅虎中国-------------

66.196.90.*

66.196.91.*

68.142.249.*

68.142.250.*

68.142.251.*

72.30.101.*

72.30.102.*

72.30.103.*

72.30.104.*

72.30.107.*

72.30.110.*

72.30.111.*

72.30.128.*

72.30.129.*

72.30.131.*

72.30.133.*

72.30.134.*

72.30.135.*

72.30.216.*

72.30.226.*

72.30.252.*

72.30.97.*

72.30.98.*

72.30.99.*

74.6.74.*

202.165.102.*

202.160.178.*

202.160.179.*

202.160.180.*

202.160.181.*

202.160.183.*

-------------Google-------------

64.233.161.*

64.233.189.*

66.102.11.*

66.102.7.*

66.102.9.*

66.249.64.*

66.249.65.*

66.249.66.*

66.249.71.*

66.249.72.*

72.14.207.*

216.239.33.*

216.239.35.*

216.239.37.*

216.239.39.*

216.239.51.*

216.239.53.*

216.239.55.*

216.239.57.*

216.239.59.*

------------- MSN -------------

65.54.188.*

65.54.225.*

65.54.226.*

65.54.228.*

65.54.229.*

207.46.98.*

207.68.157.*

------------- 中搜 -------------

202.108.1.*

202.108.2.*

202.108.3.*

202.108.4.*

202.108.33.*

202.96.51.*

219.142.53.*

------------- QQ -------------

219.133.40.*

202.96.170.*

202.104.129.*

61.135.157.*

------------- 163 -------------

202.106.186.*

202.108.36.*

202.108.44.*

202.108.45.*

202.108.5.*

202.108.9.*

220.181.12.*

220.181.13.*

220.181.14.*

220.181.15.*

220.181.28.*

220.181.31.*

222.185.245.*

------------- 其他 -------------

64.124.85.* become.com

61.151.243.* china

202.165.96.* gais.cs.ccu.edu.tw

61.135.152.* iask

194.224.199.* noxtrumbot

220.181.8.* Outfox

221.239.209.* Outfox

217.212.224.* psbot

219.142.118.* sina

219.142.78.* sina

61.135.132.* sohu

220.181.26.* sohu

61.135.158.* tom

,

[帮朋友转]SEO自由:收徒弟1-2名

  网名:自由,代表作:网站排名的三把利器:架构/内容/外链,曾被SEOWHY论坛首页推荐过,知名论坛都有推荐过,热爱SEO,偏向于电子商务,向电子商务进军,有木有童鞋感兴趣的
  接触SEO这一行一年多的时间,做了半年多的企业站,自我感觉不满足向更高的水平发展,于是进入另一家公司,对小企业站有一定的个人见解
  负责旗下的B2B垂直门户,二个月的时间荣升为SEO主管一职,在此期间不断的磨炼自己,向更高的目标发展,感觉对SEO有一定的认识,化妆品品牌1500+的指数一度在首页领跑,一般都是在前三的位置,辉煌的时候在第一的位置停留了一段时间,化妆品则在第二页慢慢上升,对B2B类站有个人一定的经验及个人独特见解
  个人对团队的管理有着自己一套小方法,也经常培训团队,都有不错的效果,与团队成员气氛很好。
  特在些收徒1-2名,有意的看条件。
  收徒的条件:  
  1、要耐的住寂寞,有一点基础,虚心学习,要有狠强的执行力,问下自己你有木有,如果你木有却告诉我有,我伤不起啊
  2、有一定的上网时间,有一定的经济来源,自己吃住能解决,因为我是免费收徒,双方均无任何费用产生
  3、对电子商务感兴趣,头脑灵活一点,SEO要学会与时俱进,这个跟着我的思路走,肯定会让你与时俱进
  4、学会低调做人,高调做事,要有自己的规划,不满足于现状
  5、人必须在广州,懂程序的优先,因为本人不太懂。  
  以上条件的达到3条(第5条必须要在广州的)即可,全部达到优先  
  徒弟的待遇:  
  1、根据其优点有合适职位优先推荐,其规划、目标俺会帮你一起挖掘并给予一点的建议
  2、有意发展成为后期我的电子商务团队的核心成员
  3、百分百实践传授我所知道的技术,向电子商务靠拢
  4、工作的选择及环境,俺会给予最佳的建议
  有木有,有木有
  这么好的机会,还要俺主动来发招聘,伤不起啊伤不起啊

  徒弟考核半个月到一个月不等,大师们的请绕道,耐不住的寂寞请绕道,自傲的也请绕道。
  详细情况加Q详谈,QQ:501893250

SEOwhy发布地址:http://www.seowhy.com/bbs/thread-399705-1-1.html

, ,

搜索引擎SE的基本工作原理及搜索引擎名词解释

        第一步搜索引擎每天会释放很多网络蜘蛛spider,当然网络知识分很多种类,我们姑且统称为蜘蛛吧,spider先检查各种开放目录和已收录网站的外部链接来检索网站,根据网站的更新频率、网站内容和权重级别,来设置spider的爬行频率,根据网站的权重来计算和规定对该网站的检索深度,蜘蛛检索完成后就提供较大初级数据库,中间进行一系列复杂的运算和比对,来确定页面最终的收录和索引情况。那么这一系列的复杂运算也就是我们seoer梦寐以求的搜索引擎算法。

        第二步搜索引擎的蜘蛛spider抓取页面都初级数据库后,按照搜索引擎的算法规则,来调度爬虫crawler。爬虫是一个高级的搜索引擎蜘蛛,是我们页面和文件排名分析的主要算法之一。

        第三步,搜索引擎根据爬虫和一系列规则的计算,然后确定释放爬虫所抓取的页面。

       第四步,这个是更高级的搜索引擎算法了,是se针对收录的页面和文件根据分词技术进行关键词的索引,安全一系列搜索引擎的算法来计算页面的权重,并对索引结果进行排名。

更多有关搜索引擎原理本文只介绍一些简单的思路,具体的可以直接百度一下:搜索引擎原理:http://wenku.baidu.com/view/cc0954270722192e4536f61b.html 在线文档学习。

 搜索引擎名词解释:
A、 spider:是se用来访问互联网上的页面和文件的自动程序。
B、 开放目录:开放目录,开放分类目录,是网址分类的一种,最有名的就是dmoz.
C、 网址登录:提交网址到搜索引擎的一种行为
D、 外部链接:是指页面和自身以外的网站或者文件的链接
E、 搜索频率:搜索引擎对网站的访问频率
F、 Sandbox 沙盒效应,是搜索引擎对新站或者违规占一种观察处理过程
G、 内部链接:网站内部页面之间的链接
H、 PR值:Google pagerank 技术对网站整个存在互联网的链接结构的分析,并确定网站页面的权重高低,将其结果以数值的方式展示。
I、 搜索深度:简单说,是搜索引擎对网站连接层次访问的深度,
J、 访问层次:例如访问首页导出链接是第一层、受体页面导出链接是第二层,以此类推。
K、 爬虫:搜索引擎的一种程序,是去收录蜘蛛收回来的页面链接数据库的程序。