樂思蜀的博客,包括但不限于SEO&SEM研究、应用中的心得体会,互联网、搜索引擎观察与思考。

SPAM又一怪招:偷梁换柱

2008年11月09日 by 樂思蜀

近日老乐在网络中闲逛,发现SPAM又出一招,使用新闻稿或技术文章,中间插入N多链接,竟然忽悠住搜索引擎,获得不错的效果。

与搜索引擎厂商搜索质量人员聊天中说起,其实SE们已经注意到了,只是暂时没有最适合的规则来处理,此次更新下来,这类网站将遇灭顶之灾。

Replace the Beams with Rotten Timbers

此招其实很简单,但比较巧。取别人的文章,中间夹带无数链接(以所谓的SEO为最,加入手中客户所有相关的链接,同时再带上自己的‘SEO优化’、‘Google左侧排名’之类)。链接数量众多,且人为的整理为近似段落形式,在全文中与原内容融合起来,搜索引擎极易识别为原创内容,从而给予其很好的权重。

但对访问者来说,这样的内容没有任何价值,倒有不少被愚弄的感觉。

此谓典型的强X搜索引擎,蔑视SE工程师们的智商。此法还未流传开来,相关人员已经留意到了,看来他们的触角和眼线还很发达,也离不开举报渠道的功劳。

悲哀ing...如此下去,SEO之路将越走越黑,与SE之间的距离将越搞越远,永远不可能与SE成为朋友关系,甚至形成敌对状态。到那时,SEO就没的玩了,五指山压下来,全体覆没。

有良知的SEO们,珍惜自己的环境吧,自己给自己多留余地……

reCAPTCHA:防SPAM的同时作出贡献

2008年11月05日 by 樂思蜀

reCAPTCHA

这种名叫reCAPTCHA的既防SPAM又作出贡献的验证码,想必大家一定在某些网站见过。验证码主要用来防SPAM,它作出贡献从何说起呢?且听老乐为你解说。

这是卡内基梅隆大学发明的,技术含量并无多少,但其创意绝佳。

目前的“电子书库”、“电子图书馆”等,其中很大一部分书籍是先使用扫描仪扫描下来,而后使用OCR软件识别。但OCR的识别能力有限,需要人力来校对,这是一个浩大的工程。

说这个reCAPTCHA创意绝佳,在于reCAPTCHA项目把这个浩大的工程让全世界使用reCAPTCHA输入验证码的人来完成。

reCAPTCHA验证码中有2个单词,一个是已经正确识别出的,另一个是未确定需要校对的单词。

当用户输入验证码时,已经识别那个单词需要输入正确才能通过验证;而另一个不确定的单词,用户输入会反馈到recaptcha.net,当返回一定数量的用户中绝大部分输入一致,就确认了此单词的正确写法。

即用户在输入验证码时,不但可以起到防SPAM的作用,还为reCAPTCHA项目校对工作作出贡献,创意可谓绝佳吧?

如果你对这个项目感兴趣,请点这里了解更多相关信息。

如何在你的网站上使用reCAPTCHA?

下面樂思蜀简单的介绍一下如何在你的网站上使用这个reCAPTCHA。

第一步:注册用户

点这里注册一个用户名。

第二步:使用域名获取  API Key

注册用户成功后,点击 Add a New Site,输入 domain(只需输入网站域名,二级域名、子目录都可以使用)获取 Public Key 和 Private Key。

第三步:在你的网站中使用

reCAPTCHA可以用于各种主流编程语言(如PHPASP.NetPerl等),及常见程序(如WordPressphpBBJoomlaMediaWiki等)。

WordPress.org 中有个 WP-reCAPTCHA 插件,看截图貌似使用非常简单,打算尝试一下的话可以安装这个插件用于评论中,扫描字体可能对防SPAM效果不错。

最后,大家可以点这里,试试我下载PHP代码后填入Key即完成的一个演示。

老乐只是觉得巧妙,试用了一下并分享出来,大家使用中有问题不用问我啦,问了我也不知道 :P

SEO大赛未定 SPAMer先行

2008年04月18日 by 樂思蜀

点石互动刚放出一些第二届中文SEO大赛的消息,SPAMer们就开始行动起来了。今天在审核点石博客和我的博客评论时,已经发现大量SPAM信息。

本次SEO大赛比赛关键词将在“tibet、xizang、西藏”范围内确定,具体细节并未敲定,很多SPAMer已经以“tibetisxizang、xizang、西藏”等词四处发垃圾留言。

樂思蜀提醒大家,本次SEO大赛,并不以搜索引擎排名为唯一评定依据,参考的因素还有很多,也许其他因素更优于排名;而且,本次反SPAM的方法、标准会较上次SEO大赛严格,规则会更严谨。

大赛还未正式启动,具体细节还没有出台,最好不要先行,以免被判出局,前功尽弃。现在比赛关键词范围已经确定,先抢注自己喜欢的域名,倒是个不错主意。

利用WordPress留言制造链接,要慎重!

2008年04月05日 by 樂思蜀

博客原创性强,加上WordPress的SEF(Search Engine Friendly,搜索引擎友好度)特性,使用WordPress搭建的博客,搜索引擎权重、更新频率等等相对较高。因为这一点,吸引了大量SEO,评论、Trackback一起上,甚至开发出各种各样的工具,试图制造大量‘高质量’的链接。

但是,樂思蜀建议这样制造链接的朋友,在WordPress中发表评论、Trackback需要慎重!

WordPress的两道“墙”

很多朋友问,为什么我发的评论不显示,下面我们来看原因:

Akismet

Akismet为WordPress自带的一个插件,使用最广泛的防垃圾评论工具。

工作原理:当一条评论发表后,Akismet会给服务器发送一个Ping,服务器将评论中包含的网址、姓名、邮箱等信息在“黑名单”中进行对比,把结果返回给Akismet。如果信息未包含在黑名单中,评论或Trackback直接显示或进入待审核队列;如果信息包含在黑名单中,Akismet直接将评论放到垃圾队列。

Akismet服务器中的黑名单,并不是既定的,而是借助所有Akismet使用者随时更新的。简单的说,如果一条评论信息发布在樂思蜀的博客,审核时被标记为垃圾评论,同样的信息出现在点石互动SEO博客,也被标注为垃圾评论……当??个Akismet使用者均将信息标记为垃评论后(具体算法未知,感谢想酷就要勤提醒),这条信息所包含的网址、邮箱等信息,将进入Akismet黑名单。

有幸进入黑名单的评论或Trackback,在全球所有使用了Akismet插件的博客中,将自动被Akismet放到垃圾队列。

由此看来,如果不慎重发表评论、Trackback,一旦进入黑名单,将是以此途径获得链接的终结,是网站的一大损失。

Spam Karma

这个WordPress插件同样是一款相当优秀的反SPAM工具,使用者很多。

Spam Karma 与 Akismet 的工作原理不同,它会通过一定算法,得出评论信息的 Karma ['ka:ma] 值,从而判断是否为垃圾评论(这篇文章中有较详细的说明)。

以此看来,在使用 Spam Karma 的WordPress博客中发表评论、Trackback,被标识为垃圾评论,所做的只是无用功。

再说说关于nofollow的个人观点

WordPress博客绝大部分评论链接代码中,都使用了“rel”标签对链接进行“nofollow”处理。

1、蓝斯登原则

搜索引擎在抓取博客内容时,会忽略nofollow标识的URL。

但是……并不代表搜索引擎就不会将nofollow标识的URL抓取到数据库中。

nofollow了的链接从外链的角度不会为目标网站带来权重,但如果在搜索引擎数据库中,一个网站nofollow形式的链接远远大于正常链接时,搜索引擎完全有可能认为这个网站有SPAM之嫌,个人观点。

2、防患于未然

目前,XX搜索引擎等并不认识nofollow。

但是……并不代表他们以后也不会认nofollow。一旦这些搜索引擎算法、机制改变,网站的有效外部链接数量将会急剧下降,SEO都知道,外链的暴涨暴跌对网站的危害性。

一句话总结:WordPress不是制造外链的首选目标。