Aug 11

前2天发现一个朋友的网站。

收录页面上万。但是突然被拔毛了。

检查了一下没有发现死链接。也没有发现作弊或者是优化过度现象。

一直想不大明白。后来无意看了一下域名发现 .net.ru域名在百度 完全没有收录了。查询地址:
http://www.baidu.com/s?ie=gb2312&bs=site%3A+.net.cn&sr=&z=&cl=3&f=8&tn=baidu&wd=site%3A+.net.ru&ct=0

好像.net.ru是免费域名来的。因此造成了不少垃圾站点?百度才决定处理掉这种域名下的所有网站数据???

——————
时隔多日。
重新查看这个搜索结果 突然发现。

.net.ru的域名网站 数据重新 可以查询
找到相关网页约4,180,000篇

这证明。百度在我写上面这篇日志的时候曾经对这种域名的数据进行过特殊处理。
应该是处理掉了一部分的数据。保留了一部分的数据。

搜索引擎会对自己数据中心的数据,从多个角度进行调整和优化这是必然的。

但是百度的调整的力度看来还是很大的。

Tags: ,
Jun 07

实验时间为期2个星期
1网站是 快递查询
一个月前被百度 收录 1千多页。
2 然后 用DEDECMS做了一个网站框架 标题关键字 劲舞团舞步
并加上了404错误页面
收录锐减到 几十页。

但是原来网站流量比较大的页面虽然页面已经不存在,收录依然长时间存在。
3 改成了一个小论坛。
同时加上了404错误页面自定义的。

现在 小论坛首页还没有收录

快递站的网页和 劲舞团的网页并存。

还需要观察一段时间看看,什么时候 原来网站的收录页面会被清除。

总结一点:就是 SE对 原来网站的权重比较高的页面会长时间保留,给一定时间的观察时间,应该是等到多次爬行以后发现这个页面确实不存在了,然后再清除。

但是对于普通页面 如果 不能访问 很快就会被删除。

百度尤其明显,据说百度有个 特别的服务器,如果网站原收录页面不能访问,那么这些原来索引的页面就会被放到特别服务器上,如果多次 爬行仍然找到 就会删除。

有的朋友的站点 经常是 有的时候 收录里能找到一些页面 有的时候又没了,有的时候又有了。

应该是 SE爬行的时候赶上了 服务器死机。

但是对于 流量比较高,权重比较高的页面,SE还是会保留现对较长时间的索引的。

Tags: , , ,
May 23

Google Search,把很多重复内容放到了搜索的补充结果里。
Google Search,把部分内容从搜索索引里去除。

而且 还会降低 网站ADSENSE的 单价 好像

别人的一个网站。完全采集的某个论坛。最近一些天的收录情况是这样的:
看样子采集网站的 收录还真是步履艰难。 Continue reading »

Tags: , ,
Apr 16

1 合适的时候发邮件。

避免高峰期。不要重复发很多次。找对负责人的邮件。

2 如果跟自己的网站相关,一定要用自己域名的后缀的邮箱发邮件。不然人家不能确定你到底是不是这个站长。

Tags: ,
友情链接: 计算机毕业论文网计算机毕业论文