近来升级到Wordpress3.0的同学,你们在你们的Google网站管理员工具的后台看到什么异常了么?对,重定向错误,无穷无尽的重定向错误。你继续观察还能发现重定向错误都发生在TAG页面,然后会神奇的发现是中文TAG页面。Wordpress3.0再一次犯了Wordpress家族惯有的错误,对中文乃至中日韩文用户的一贯漠视,从以前的中文TAG页面404错误,到后来的文章摘要截断错误,到这次的中文TAG收录不能。由于我从事的是专职SEOer所以抓住这个机会好好分析一下这次集体301问题会带来的后果以及形成的原因,种种说词仅仅是我的推断和观察,如果是我胡说八道或者扯淡了还请海涵。
那么是这些重定向错误是怎么来的呢?原因据我观察+猜测是Wordpress3.0把中文TAG的链接里面的转码统统转换为小写的了,且原来大写的转码都做了301重定向到小写。(勘误见UpDate)比如说你有一个TAG叫“上海”,那么原来版本WP中转码后它的固定链接就是“tag/%E4%B8%8A%E6%B5%B7/”,其中“%E4%B8%8A%E6%B5%B7”其实就是“上海”这两个汉字的转码,但是Wordpress3.0会把此固定链接转码为“tag/%e4%b8%8a%e6%b5%b7/”并且把“tag/%E4%B8%8A%E6%B5%B7/”重定向到“tag/%e4%b8%8a%e6%b5%b7/”,这样看上去没什么不妥。但是Google的爬虫不干了,爬虫们罢工了,爬虫不等301就会马上离开并且报这个页面是“重定向错误”……这个推论的理由就是你的服务器日志文件,你会发现Google爬虫如果抓到“上海”这个TAG,会先访问“tag/%E4%B8%8A%E6%B5%B7/”,然后得到一个301重定向,但是其实Google爬虫并没有去重定向指向的“tag/%e4%b8%8a%e6%b5%b7/”页面,而是留下了“上海”这个TAG页面是“重定向”错误。至于为什么Google爬虫不去抓取301目标页面,我猜测可能因为爬虫认为“tag/%E4%B8%8A%E6%B5%B7/”和“tag/%e4%b8%8a%e6%b5%b7/”是一个页面,而你的网站在用小花招玩弄Google的爬虫,这样的结果会给一个网站带来灭顶之灾。轻则收录数明显减少,重则给你的域名降权,或者什么影响都没有Google今天心情好……
说了那么多,解决办法是啥呢?要么滚回到2.9.2,要么就硬挺着,Google终会有一天更新了你TAG的url变成小写的转码,或许这将是一个漫长的过程,或者这将让你的网站在Google表现的不是很好,但是希望大家坚持。
以上这些话都是我从Google管理员工具和服务器日志文件慢慢观察和分析得到的结论,有很大的局限性。大家参考。也在此很无力的呼唤希望Wordpress官方开发团队能给东方用户多一份关注,少一份漠视。不是要求Wordpress开发团队如何如何必须这么做,而是一个有着合格的职业素质的工程师都会这么做。
2010.07.15UpDate:
这几天继续观察思考了下这个问题,如果你持续观察你的服务器日志文件,其实只有Google爬虫和百度爬虫会去爬你的大写转码链接,然后吃一肚子301。其他 蜘蛛都是爬小写的。如果有百度管理员工具,那么肯定也会使铺天盖地的301……但是百度和Google的抓取错误足以毁掉任何一个中文站.
这或许说明了其实可能不是Wordpress的原因,因为如果是Wordpress原因,所有爬虫应该都遇到这个问题。
但是反过来说,如果不是Wordpress的原因,为什么2.92没有这个问题……我问了几个Wordpress2.71和Wordpress2.92的用户,他们的中文TAG都没有这抓取问题。
目前已经反映给Google和Wordpress团队这个问题,具体连接见(或许需要注册可见)
UpDate:
WordPress官方团队承认是Wordpress3.0的问题,原因是“一个分类重定向逻辑被加入了Wordpress3.0,但是没有测试人员测试它与非ASCII码的兼容性”。并且Wordpress团队计划在Wordpress3.01中修复它(仅仅是计划)。
我只想说,很好。诺大的一个开发团队居然没有人测非ASCII码,中文,韩文,日文,阿拉伯文集体操蛋。作为一个开源的,有着众多开发者,有着遍布全球广泛使用者的程序,能做到这样真不容易。免费不是你不用心的借口,正因为免费你才要想到你的使用者会来自全球各个地方,你不是微软,如果Windows不卖到很多第三世界国家你可以不照顾Windows对当地语言的兼容性。但你是Wordpress。
2010.07.16UpDate:
官方补丁测试中,如果有效可以减少301测试的话,会考虑公开补丁。
2010.07.18UpDate:
测试补丁OK,修改代码后,大写、大小写混排的转码URL不再自身重定向自己。这样Google网站管理员工具就不会报“重定向”错误了,正在请示是否可公开补丁,可以的话会第一时间给出下载,其实就是替换一个文件就可以。
转载请注明:No.77 疯人院 - 游戏业界新闻 - 主机游戏资料攻略 » 【官方修改包测试中】WordPress3.0对中文Tag糟糕的改动致使Google收录不能,提示“重定向”错误