百度快照现象分析及解决方法
首先,思创SEO必须体现各位明确快照的作用:从快照时间读出蜘蛛抓取频率;网站快照更新的时间及频率,和搜索引擎抓取网站内容的频率有关系,如果网站的快照更新频率很快,至少可以说明搜索引擎的蜘蛛会经常光临网站。
其次:快照与权重:快照更新频繁与否,除了反映读出的蜘蛛抓取频率之外,还反映的着一种趋势。
这个趋势说明的就是:按照搜索引擎现行的规则,网站已经得到了蜘蛛的认可,如果在规则不变的情况下,网站还是按照这种趋势来发展,网站的权重会慢慢提高,排名也就会上去了。
快照不更新的原因有几种总结:
1. 网站做过改动,比如修改网站的标题、关键词、模板等
2.更新的内容重复性太高,质量不佳,不符合主题,或者长期的不更新网站内容
3.使用黑帽技术,作弊行为
4.低质量友链
关于快照日期回滚的原因:
通常情况下,快照的日期是向着正方向行进的。当然也会有停滞不前或者更新缓慢的,这是由于网站建设或者操作手法上出现了的问题。
但是网站遭遇快照日期回滚就属于比较严重的问题了,这意味这网站本身出现了问题。或许是大量重复内容、或许是网站被挂马之类影响用户体验的情况。这时候咱们必须引起警觉!
网站怎么做seo,应该懂得每一项基本的SEO技能。
快照充其量占据排名的权重应该是30%的,一个网站多少的小修改是有的,没人能保证自己的站是一百年不变;友链换的是交情,换的是对手的实力:一个网站的内容,除非是大品牌运营的站,没人确保是完全保质保量的。
最后:如果你的友链对象什么都不懂,还问你怎么检查,怎么交换,有什么标准,请慎重合作。
如果你的友链对象是黑帽高手,如狼雨番,精通怎么骗你链接,那你也掂量掂量自己的实力。
快照不更新,高手有办法。因为当你认真观察很多所谓的百度首页词排名时,你没认真的去研究结果。百度“耳麦”,有几个快照是新的,当然,如果你是高级的SEOER,你去分析的就不仅仅是搜索结果,分析什么,这里铺个后路,后面再叙。
如果你硬是要纠结一阵,请让对方告诉你,你的关键词排名是不是在百度首页,首页才是传递权重的王道,排的到首页,其他的操作手法,你不用替对方想了。
如果你特别纠结换友链快照,请纠结,怎么改进自己的快照,赠送一段话:高质量的网站主主宰百度排名,而不主宰快照。
什么是百度蜘蛛,蜘蛛IP是多少?如何查看蜘蛛是否光临
SEO推测:百度蜘蛛的ip段是根据网站权重不同分别派发
baidu派来你站的蜘蛛ip段是:202.181.7.*
还是:123.125.66.*
据说202.181.7.* 段的是高权重。
什么是baiduspider?
baiduspider是百度搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页。
baiduspider对一个网站服务器造成的访问压力如何?
baiduspider会自动根据服务器的负载能力调节访问密度。在连续访问一段时间后,baiduspider会暂停一会,以防止增大服务器的访问压力。所以在一般情况下,baiduspider对您网站的服务器不会造成过大压力。
为什么baiduspider不停的抓取我的网站?
对于您网站上新产生的或者持续更新的页面,baiduspider会持续抓取。此外,您也可以检查网站访问日志中baiduspider的访问是否正常,以防止有人恶意冒充baiduspider来频繁抓取您的网站。如果您发现baiduspider非正常抓取您的网站,请反馈,并请尽量给出baiduspider对贵站的访问日志,以便于我们跟踪处理。
我不想我的网站被baiduspider访问,我该怎么做?
baiduspider遵守互联网robots协议。您可以利用robots.txt文件完全禁止baiduspider访问您的网站,或者禁止baiduspider访问您网站上的部分文件。注意:禁止baiduspider访问您的网站,将使您的网站上的网页,在百度搜索引擎以及所有百度提供搜索引擎服务的搜索引擎中无法被搜索到。
关于robots.txt的写作方法,请参看我们的介绍:robots.txt写作方法
为什么我的网站已经加了robots.txt,还能在百度搜索出来?
因为搜索引擎索引数据库的更新需要时间。虽然baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要二至四周才会清除。另外也请检查您的robots配置是否正确。
百度蜘蛛在robots.txt中的名字是什么?
“baiduspider”全部为小写字母。
baiduspider多长时间之后会重新抓取我的网页?
百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间,baiduspider会重新访问和更新一个网页。
知道了什么是百度蜘蛛,那么怎么才能知道蜘蛛是否来过你的站?这个可以从你服务器或者虚拟主机的日志中看出来,比如我用的虚拟主机的完整使用日志中有这样的记录:
220.181.38.198 – - [11/Nov/2007:04:28:29 +0800] “GET / HTTP/1.1″ 200 61083 “-” “Baiduspider”这就说明百度蜘蛛来过我的站了,如果你还想知道有没有其它搜索引擎的蜘蛛来过你的站,你可以在日志文件中搜索“spider”这个词,或者搜索蜘蛛的IP,我的就查到sogou也来过我的站,IIS日志与Apache的日志是一样的,都可以查到。
各类蜘蛛IP收集,不一定完全准确。
序号 IP 注释
1 202.106.186.* 163蜘蛛
2 202.108.36.* 163蜘蛛
3 202.108.44.* 163蜘蛛
4 202.108.45.* 163蜘蛛
5 202.108.5.* 163蜘蛛
6 202.108.9.* 163蜘蛛
7 220.181.12.* 163蜘蛛
8 220.181.13.* 163蜘蛛
9 220.181.14.* 163蜘蛛
10 220.181.15.* 163蜘蛛
11 220.181.28.* 163蜘蛛
12 220.181.31.* 163蜘蛛
13 222.185.245.* 163蜘蛛
14 202.165.100.* 3721蜘蛛
15 220.181.19.* 百度蜘蛛
16 159.226.50.* 百度蜘蛛
17 202.108.11.* 百度蜘蛛
18 202.108.22.* 百度蜘蛛
19 202.108.23.* 百度蜘蛛
20 202.108.249.* 百度蜘蛛
21 202.108.250.* 百度蜘蛛
22 61.135.145.* 百度蜘蛛
23 61.135.146.* 百度蜘蛛
24 64.124.85.* become.com
25 61.151.243.* china蜘蛛
26 202.165.96.* gais.cs.ccu.edu.tw
27 216.239.33.* google蜘蛛
28 216.239.35.* google蜘蛛
29 216.239.37.* google蜘蛛
30 216.239.39.* google蜘蛛
31 216.239.51.* google蜘蛛
32 216.239.53.* google蜘蛛
33 216.239.55.* google蜘蛛
34 216.239.57.* google蜘蛛
35 216.239.59.* google蜘蛛
36 64.233.161.* google蜘蛛
37 64.233.189.* google蜘蛛
38 66.102.11.* google蜘蛛
39 66.102.7.* google蜘蛛
40 66.102.9.* google蜘蛛
41 66.249.64.* google蜘蛛
42 66.249.65.* google蜘蛛
43 66.249.66.* google蜘蛛
44 66.249.71.* google蜘蛛
45 66.249.72.* google蜘蛛
46 72.14.207.* google蜘蛛
47 61.135.152.* iask蜘蛛
48 65.54.188.* msn蜘蛛
49 65.54.225.* msn蜘蛛
50 65.54.226.* msn蜘蛛
51 65.54.228.* msn蜘蛛
52 65.54.229.* msn蜘蛛
53 207.46.98.* msn蜘蛛
54 207.68.157.* msn蜘蛛
55 194.224.199.* noxtrumbot
56 220.181.8.* Outfox
57 221.239.209.* Outfox
58 217.212.224.* psbot
59 219.133.40.* QQ蜘蛛
60 202.96.170.* QQ蜘蛛
61 202.104.129.* QQ蜘蛛
62 61.135.157.* QQ蜘蛛
63 219.142.118.* sina蜘蛛
64 219.142.78.* sina蜘蛛
65 61.135.132.* sohu蜘蛛
66 220.181.26.* sohu蜘蛛
220.181.19.*
67 61.135.158.* tom蜘蛛
68 66.196.90.* yahoo蜘蛛
69 66.196.91.* yahoo蜘蛛
70 68.142.249.* yahoo蜘蛛
71 68.142.250.* yahoo蜘蛛
72 68.142.251.* yahoo蜘蛛
73 202.165.102.* yahoo中国蜘蛛
74 202.160.178.* yahoo中国蜘蛛
75 202.160.179.* yahoo中国蜘蛛
76 202.160.180.* yahoo中国蜘蛛
77 202.160.181.* yahoo中国蜘蛛
78 202.160.183.* yahoo中国蜘蛛
79 72.30.101.* yahoo蜘蛛
80 72.30.102.* yahoo蜘蛛
81 72.30.103.* yahoo蜘蛛
82 72.30.104.* yahoo蜘蛛
83 72.30.107.* yahoo蜘蛛
84 72.30.110.* yahoo蜘蛛
85 72.30.111.* yahoo蜘蛛
86 72.30.128.* yahoo蜘蛛
87 72.30.129.* yahoo蜘蛛
88 72.30.131.* yahoo蜘蛛
89 72.30.133.* yahoo蜘蛛
90 72.30.134.* yahoo蜘蛛
91 72.30.135.* yahoo蜘蛛
92 72.30.216.* yahoo蜘蛛
93 72.30.226.* yahoo蜘蛛
94 72.30.252.* yahoo蜘蛛
95 72.30.97.* yahoo蜘蛛
96 72.30.98.* yahoo蜘蛛
97 72.30.99.* yahoo蜘蛛
98 74.6.74.* yahoo蜘蛛
99 202.108.4.* 中搜蜘蛛
100 202.108.4.* 中搜蜘蛛
101 202.108.33.* 中搜蜘蛛
102 202.96.51.* 中搜蜘蛛
103 219.142.53.* 中搜蜘蛛
[/td][/tr][/table]
欣欣520 2008-1-3 17:38
序号 IP 注释
1 202.106.186 163
2 202.108.36 163
3 202.108.44 163
4 202.108.45 163
5 202.108.5 163
6 202.108.9 163
7 220.181.12 163
8 220.181.13 163
9 220.181.14 163
10 220.181.15 163
11 220.181.28 163
12 220.181.31 163
13 222.185.245 163
14 202.165.100 3721
15 220.181.19 baidu
16 159.226.50 baidu
17 202.108.11 baidu
18 202.108.22 baidu
19 202.108.23 baidu
20 202.108.249 baidu
21 202.108.250 baidu
22 61.135.145 baidu
23 61.135.146 baidu
24 64.124.85 become.com
25 61.151.243 china
26 202.165.96 gais.cs.ccu.edu.tw
27 216.239.33 google
28 216.239.35 google
29 216.239.37 google
30 216.239.39 google
31 216.239.51 google
32 216.239.53 google
33 216.239.55 google
34 216.239.57 google
35 216.239.59 google
36 64.233.161 google
37 64.233.189 google
38 66.102.11 google
39 66.102.7 google
40 66.102.9 google
41 66.249.64 google
42 66.249.65 google
43 66.249.66 google
44 66.249.71 google
45 66.249.72 google
46 72.14.207 google
47 61.135.152 iask
48 65.54.188 msn
49 65.54.225 msn
50 65.54.226 msn
51 65.54.228 msn
52 65.54.229 msn
53 207.46.98 msn
54 207.68.157 msn
55 194.224.199 noxtrumbot
56 220.181.8 Outfox
57 221.239.209 Outfox
58 217.212.224 psbot
59 219.133.40 QQ
60 202.96.170 QQ
61 202.104.129 QQ
62 61.135.157 QQ
63 219.142.118 sina
64 219.142.78 sina
65 61.135.132 sohu
66 220.181.26 sohu
67 61.135.158 tom
68 66.196.90 yahoo
69 66.196.91 yahoo
70 68.142.249 yahoo
71 68.142.250 yahoo
72 68.142.251 yahoo
73 202.165.102 yahoo
74 202.160.178 yahoo
75 202.160.179 yahoo
76 202.160.180 yahoo
77 202.160.181 yahoo
78 202.160.183 yahoo
79 72.30.101 yahoo
80 72.30.102 yahoo
81 72.30.103 yahoo
82 72.30.104 yahoo
83 72.30.107 yahoo
84 72.30.110 yahoo
85 72.30.111 yahoo
86 72.30.128 yahoo
87 72.30.129 yahoo
88 72.30.131 yahoo
89 72.30.133 yahoo
90 72.30.134 yahoo
91 72.30.135 Yahoo
92 72.30.216 yahoo
93 72.30.226 yahoo
94 72.30.252 yahoo
95 72.30.97 yahoo
96 72.30.98 yahoo
97 72.30.99 yahoo
98 74.6.74 yahoo
99 202.108.4 zhongsou
100 202.108.33 zhongsou
101 202.96.51 zhongsou
102 219.142.53 zhongsou
-------------百度-------------
31.135.145.*
61.135.145.*
61.135.146.*
159.226.50.*
202.108.11.*
202.108.22.*
202.108.23.*
202.108.249.*
202.108.250.*
220.181.19.*
-------------雅虎中国-------------
66.196.90.*
66.196.91.*
68.142.249.*
68.142.250.*
68.142.251.*
72.30.101.*
72.30.102.*
72.30.103.*
72.30.104.*
72.30.107.*
72.30.110.*
72.30.111.*
72.30.128.*
72.30.129.*
72.30.131.*
72.30.133.*
72.30.134.*
72.30.135.*
72.30.216.*
72.30.226.*
72.30.252.*
72.30.97.*
72.30.98.*
72.30.99.*
74.6.74.*
202.165.102.*
202.160.178.*
202.160.179.*
202.160.180.*
202.160.181.*
202.160.183.*
-------------Google-------------
64.233.161.*
64.233.189.*
66.102.11.*
66.102.7.*
66.102.9.*
66.249.64.*
66.249.65.*
66.249.66.*
66.249.71.*
66.249.72.*
72.14.207.*
216.239.33.*
216.239.35.*
216.239.37.*
216.239.39.*
216.239.51.*
216.239.53.*
216.239.55.*
216.239.57.*
216.239.59.*
------------- MSN -------------
65.54.188.*
65.54.225.*
65.54.226.*
65.54.228.*
65.54.229.*
207.46.98.*
207.68.157.*
------------- 中搜 -------------
202.108.1.*
202.108.2.*
202.108.3.*
202.108.4.*
202.108.33.*
202.96.51.*
219.142.53.*
------------- QQ -------------
219.133.40.*
202.96.170.*
202.104.129.*
61.135.157.*
------------- 163 -------------
202.106.186.*
202.108.36.*
202.108.44.*
202.108.45.*
202.108.5.*
202.108.9.*
220.181.12.*
220.181.13.*
220.181.14.*
220.181.15.*
220.181.28.*
220.181.31.*
222.185.245.*
------------- 其他 -------------
64.124.85.* become.com
61.151.243.* china
202.165.96.* gais.cs.ccu.edu.tw
61.135.152.* iask
194.224.199.* noxtrumbot
220.181.8.* Outfox
221.239.209.* Outfox
217.212.224.* psbot
219.142.118.* sina
219.142.78.* sina
61.135.132.* sohu
220.181.26.* sohu
61.135.158.* tom
[帮朋友转]SEO自由:收徒弟1-2名
| 网名:自由,代表作:网站排名的三把利器:架构/内容/外链,曾被SEOWHY论坛首页推荐过,知名论坛都有推荐过,热爱SEO,偏向于电子商务,向电子商务进军,有木有童鞋感兴趣的 接触SEO这一行一年多的时间,做了半年多的企业站,自我感觉不满足向更高的水平发展,于是进入另一家公司,对小企业站有一定的个人见解 负责旗下的B2B垂直门户,二个月的时间荣升为SEO主管一职,在此期间不断的磨炼自己,向更高的目标发展,感觉对SEO有一定的认识,化妆品品牌1500+的指数一度在首页领跑,一般都是在前三的位置,辉煌的时候在第一的位置停留了一段时间,化妆品则在第二页慢慢上升,对B2B类站有个人一定的经验及个人独特见解 个人对团队的管理有着自己一套小方法,也经常培训团队,都有不错的效果,与团队成员气氛很好。 特在些收徒1-2名,有意的看条件。 收徒的条件: 1、要耐的住寂寞,有一点基础,虚心学习,要有狠强的执行力,问下自己你有木有,如果你木有却告诉我有,我伤不起啊 2、有一定的上网时间,有一定的经济来源,自己吃住能解决,因为我是免费收徒,双方均无任何费用产生 3、对电子商务感兴趣,头脑灵活一点,SEO要学会与时俱进,这个跟着我的思路走,肯定会让你与时俱进 4、学会低调做人,高调做事,要有自己的规划,不满足于现状 5、人必须在广州,懂程序的优先,因为本人不太懂。 以上条件的达到3条(第5条必须要在广州的)即可,全部达到优先 徒弟的待遇: 1、根据其优点有合适职位优先推荐,其规划、目标俺会帮你一起挖掘并给予一点的建议 2、有意发展成为后期我的电子商务团队的核心成员 3、百分百实践传授我所知道的技术,向电子商务靠拢 4、工作的选择及环境,俺会给予最佳的建议 有木有,有木有 这么好的机会,还要俺主动来发招聘,伤不起啊伤不起啊 徒弟考核半个月到一个月不等,大师们的请绕道,耐不住的寂寞请绕道,自傲的也请绕道。 |
搜索引擎SE的基本工作原理及搜索引擎名词解释
第一步搜索引擎每天会释放很多网络蜘蛛spider,当然网络知识分很多种类,我们姑且统称为蜘蛛吧,spider先检查各种开放目录和已收录网站的外部链接来检索网站,根据网站的更新频率、网站内容和权重级别,来设置spider的爬行频率,根据网站的权重来计算和规定对该网站的检索深度,蜘蛛检索完成后就提供较大初级数据库,中间进行一系列复杂的运算和比对,来确定页面最终的收录和索引情况。那么这一系列的复杂运算也就是我们seoer梦寐以求的搜索引擎算法。
第二步搜索引擎的蜘蛛spider抓取页面都初级数据库后,按照搜索引擎的算法规则,来调度爬虫crawler。爬虫是一个高级的搜索引擎蜘蛛,是我们页面和文件排名分析的主要算法之一。
第三步,搜索引擎根据爬虫和一系列规则的计算,然后确定释放爬虫所抓取的页面。
第四步,这个是更高级的搜索引擎算法了,是se针对收录的页面和文件根据分词技术进行关键词的索引,安全一系列搜索引擎的算法来计算页面的权重,并对索引结果进行排名。
更多有关搜索引擎原理本文只介绍一些简单的思路,具体的可以直接百度一下:搜索引擎原理:http://wenku.baidu.com/view/cc0954270722192e4536f61b.html 在线文档学习。
搜索引擎名词解释:
A、 spider:是se用来访问互联网上的页面和文件的自动程序。
B、 开放目录:开放目录,开放分类目录,是网址分类的一种,最有名的就是dmoz.
C、 网址登录:提交网址到搜索引擎的一种行为
D、 外部链接:是指页面和自身以外的网站或者文件的链接
E、 搜索频率:搜索引擎对网站的访问频率
F、 Sandbox 沙盒效应,是搜索引擎对新站或者违规占一种观察处理过程
G、 内部链接:网站内部页面之间的链接
H、 PR值:Google pagerank 技术对网站整个存在互联网的链接结构的分析,并确定网站页面的权重高低,将其结果以数值的方式展示。
I、 搜索深度:简单说,是搜索引擎对网站连接层次访问的深度,
J、 访问层次:例如访问首页导出链接是第一层、受体页面导出链接是第二层,以此类推。
K、 爬虫:搜索引擎的一种程序,是去收录蜘蛛收回来的页面链接数据库的程序。