本文发布后,经博友大魏指点,百度收录量截至2023.10.15增加到44条,详细折腾过程见评论区置顶。
最近SEO站长圈哀嚎一片,起因百度大规模封杀采集站。对于百度此举,我是举双手双脚赞成的,因为对采集站从生理上就感觉不适。一个站点如果一味迎合搜索引擎喜好,大批量生成文不对题、东拼西凑、不知所云的内容,是对互联网搜索资源的浪费,挤占了更多拥有优质内容的站点被搜索发现的机会,造成劣币驱逐良币的恶果。
然而,我终究也是想多了。即便如东评西就这样纯人肉敲出来的独立博客,共计336篇文章,时间跨度从我的高中时代、大学、工作、结婚生子,直至现在22年的时光,目前百度收录页面也仅有3条,而且还在以肉眼可见的速度减少,鬼知道哪天会从百度彻底消失。
这不得不提搭建这个独立博客踩过的坑。
大约在去年3、4月份,天涯博客停止维护,内容被系统设置为仅博主,我嗅出来天涯博客要黄的味道(但我没想到的是,一年后天涯社区整站关闭了),连夜用爬虫工具备份了300+篇文章和近万条评论,开始寻找合适的平台复刻这些文字。
人人博客的时代已经过去,很多博客如博客中国、博客巴士等平台早已关闭,在我的认知里,也只有自主搭建独立博客这一条路子。
从WordPress、Hexo、Hugo、Typecho等博客程序里对比了一番,最后选择了Docker自主搭建Farbox博客,原因是开源,却没想到Farbox的开源其实作者弃坑而去,留下一个烂摊子。
选择Farbox的原因很简单,看中了一款「菩提树下」的极简主题,又能简单粗暴地导入天涯博客的评论信息,WordPress都没它方便。
正好赶上阿里云针对新手的空前优惠,没几天就把所有文章和评论复刻到了Farbox博客,几乎没做SEO优化百度很快就收录了大量页面。看似顺风顺水,却是噩梦的开始。
由于Farbox作者开源后也停止了更新了,其实程序有很多bug,再加上对技术也不熟悉,没几天博客就让我给搞崩了,一直404状态。
于是寻摸着更换新的博客程序,多方权衡最终选择了Hexo程序。其实在Hexo和Hugo之间也纠结了很久,我也知道在某些方面Hugo要比Hexo优秀许多,但理想很丰满,显示很骨感,最终确定Hexo只是因为首先测试成功了Hexo。
我就是这么一个急性子,典型白羊座风格,没有长远规划,先让博客跑起来再说。
文章发布、图床搭建轻车熟路。最难的部分也是一个博客称之为博客的灵魂之处——评论,耗费了我好几个月的时间,询问Twikoo开发者+ChatGPT,总算写出一个评论迁移脚本。看着曾经青涩文字下面熟悉的ID又在另外一个空间重新浮现,耽于回忆的我一度陷入深深的恍惚之中,仿佛那些文字里发生的事情就在昨天。
自从搭建了Hexo博客后,博客主题一直没有更换过,各种独立博客的标配如朋友圈、说说广场,也在各路大佬如 杜老师 、 koobai 、 木木老师 、 张时贰 等博友的帮助下一一实现。
一番折腾后,我总结出一条经验,一个博客主题的好坏,最终还是要看博客的内容的丰富与否。偶尔有人在评论区称赞这个博客魔改的主题美观,我觉得,更多的是对博客内容的认同。尤其是历史文章下面的评论,都是岁月的痕迹。
导致百度收录页面骤减的原因,很重要的一条是来自于今年年初的域名更换。
dongjunke.cn这个域名其实在2007年我就持有过,后来因为微信公众号的诞生,就放弃了这个域名。直到疫情期间偶然联系到了这个域名的现在持有人,当然也是个域名贩子。起初对方要价1000元,称域名是人名域名,比较稀缺。我告诉他,我曾经持有过这个域名,这么多年过去了,也没人来买这个域名,也只有我稀罕它,我的心理价是200块钱,如果成交不了,那你就继续烂在手里吧。或许是疫情期间大家生计普遍比较窘迫的原因,对方很爽快成交了。
更换域名后,我就把之前的域名停止解析了,也没有在百度站长平台做网站改版之类的设置。旧域名很快收录消失,新域名很长时间停留在15条左右,直到最近降到了3条。
反观必应、谷歌的收录数量,比较接近实际文章数量。尤其是必应,几乎可以在当天收录。
百度的收录逻辑令我百思不得其解。曾经邮件向站方反馈过,对方给我的回应也是语焉不详、模棱两可。
我依然每次后向百度搜索提交API,也不再纠结收录具体有多少。如我这样用爱发电的独立博客,或许原本并不是百度搜索的目标用户,毫无任何商业价值。
从今天起,做个纯粹的独立博主,不关心流量,只关心内容有没有人评论,守护AI时代有可能是世界上最后一个由人类撰写的独立博客。