樂思蜀的博客,包括但不限于SEO&SEM研究、应用中的心得体会,互联网、搜索引擎观察与思考。

高质量的页面摘要(Snippet)赏析

2008年04月12日 by 樂思蜀

上一篇中简要的说了排名较好的站为什么不用Keywords和Description,本想用一篇文章专门分享一下如何用Description来打造高质量的页面摘要Snippet),但一直没想好从哪几个方面着手。下面樂思蜀精选几个高质量的页面摘要,并作适当点评,希望朋友们能够看懂,并有所帮助。

顺便说下,两大主流中文搜索引擎,页面摘要的有效字符数为:

  • 百度:有效字符数为220个(相当于110个汉字)左右,含标点符号;
  • Google:有效字符数为240个(相当于120个汉字)左右,含标点符号。

高质量的页面摘要(Snippet)赏析

Google(一)、这是在Google中搜索“张国荣纪念珍藏版”,卓越网的页面摘要:

点评:“未见其人,先闻其声”,不需要进入页面,基本信息一目了然。产品情况,市场价格,再辅以心动的折扣价信息……第一步就吸引住了购买者的注意力。

Google(二)、这是在Google中搜索“电视剧相思树”,新浪娱乐的页面摘要:

Google中新浪娱乐的网页摘要

点评:简明扼要的信息,在最小的文字范围内,对搜索目标进行描述,给搜索者一个目标的轮廓。

Google(三)、这是在Google中搜索“国内酒店预订”,携程旅行网的页面摘要:

点评:直接了当,我们是业界领先的,凭什么呢,用数据说话;顺便罗列出一系列服务。

百度(1)、这是在百度中搜索“长江七号”,网易娱乐的页面摘要:

百度中网易娱乐的页面摘要

点评:信息泛滥时,冠以“官方”二字,给人最起码的信任感;但是搜索者的“信任”最好不要滥用,如果网站打算长期运营下去的话。

百度(2)、这是在百度中搜索“张柏芝”,百度娱乐的页面摘要:

百度中百度娱乐的页面摘要

点评:抓住事件,再适当炒作、归纳、描述一番,撩起搜索者的“八卦”兴趣。

百度(3)、这是在百度中搜索“小游戏”,007小游戏的页面摘要:

百度中007小游戏的页面摘要

点评:元标签中,Title的权重胜于Description,让他们各行其事,各尽其长。

这样高质量的页面摘要(Snippet)还有很多很多,但有一个共同的特点,搜索结果页展现在搜索者眼前时,尽可能的吸引住搜索者,产生浏览、购买的兴趣。

总结:

页面摘要(Snippet)对于通过搜索引擎来访的浏览者而言,就是第一印象,如果能留给人良好的第一印象,就是迈出了成功的第一步;同时也是一个“抢眼球”的技巧,最先吸引搜索者注意力的,点击率就会相对较高。

既然搜索引擎会参考网页的Description,页面摘要就具“可控性”,可以好好把握,充分利用。

利用WordPress留言制造链接,要慎重!

2008年04月05日 by 樂思蜀

博客原创性强,加上WordPress的SEF(Search Engine Friendly,搜索引擎友好度)特性,使用WordPress搭建的博客,搜索引擎权重、更新频率等等相对较高。因为这一点,吸引了大量SEO,评论、Trackback一起上,甚至开发出各种各样的工具,试图制造大量‘高质量’的链接。

但是,樂思蜀建议这样制造链接的朋友,在WordPress中发表评论、Trackback需要慎重!

WordPress的两道“墙”

很多朋友问,为什么我发的评论不显示,下面我们来看原因:

Akismet

Akismet为WordPress自带的一个插件,使用最广泛的防垃圾评论工具。

工作原理:当一条评论发表后,Akismet会给服务器发送一个Ping,服务器将评论中包含的网址、姓名、邮箱等信息在“黑名单”中进行对比,把结果返回给Akismet。如果信息未包含在黑名单中,评论或Trackback直接显示或进入待审核队列;如果信息包含在黑名单中,Akismet直接将评论放到垃圾队列。

Akismet服务器中的黑名单,并不是既定的,而是借助所有Akismet使用者随时更新的。简单的说,如果一条评论信息发布在樂思蜀的博客,审核时被标记为垃圾评论,同样的信息出现在点石互动SEO博客,也被标注为垃圾评论……当??个Akismet使用者均将信息标记为垃评论后(具体算法未知,感谢想酷就要勤提醒),这条信息所包含的网址、邮箱等信息,将进入Akismet黑名单。

有幸进入黑名单的评论或Trackback,在全球所有使用了Akismet插件的博客中,将自动被Akismet放到垃圾队列。

由此看来,如果不慎重发表评论、Trackback,一旦进入黑名单,将是以此途径获得链接的终结,是网站的一大损失。

Spam Karma

这个WordPress插件同样是一款相当优秀的反SPAM工具,使用者很多。

Spam Karma 与 Akismet 的工作原理不同,它会通过一定算法,得出评论信息的 Karma ['ka:ma] 值,从而判断是否为垃圾评论(这篇文章中有较详细的说明)。

以此看来,在使用 Spam Karma 的WordPress博客中发表评论、Trackback,被标识为垃圾评论,所做的只是无用功。

再说说关于nofollow的个人观点

WordPress博客绝大部分评论链接代码中,都使用了“rel”标签对链接进行“nofollow”处理。

1、蓝斯登原则

搜索引擎在抓取博客内容时,会忽略nofollow标识的URL。

但是……并不代表搜索引擎就不会将nofollow标识的URL抓取到数据库中。

nofollow了的链接从外链的角度不会为目标网站带来权重,但如果在搜索引擎数据库中,一个网站nofollow形式的链接远远大于正常链接时,搜索引擎完全有可能认为这个网站有SPAM之嫌,个人观点。

2、防患于未然

目前,XX搜索引擎等并不认识nofollow。

但是……并不代表他们以后也不会认nofollow。一旦这些搜索引擎算法、机制改变,网站的有效外部链接数量将会急剧下降,SEO都知道,外链的暴涨暴跌对网站的危害性。

一句话总结:WordPress不是制造外链的首选目标。

Google工具条 也很流氓

2008年03月23日 by 樂思蜀

星箭今天给我看他的博客在百度中的收录,很强悍,连通过Web代理访问记录都收录了。

去年安装软件的时候不小心装了个“百度搜霸”,卸载之前用Winsock Expert监测了一下数据包,不少访问痕迹提交到了百度。我想星箭这样的收录效果,极有可能就是这个工具条的问题。

刚忙完,看星箭的日志中提到了Google工具条,也用Winsock监测了一下。结果,很郁闷,这个一向宣称“不作恶”的也来这一套。

 Google 工具条

查询了一下这个IP:209.85.175.147 美国 (GOOGLE公司)

高手分析一下看提交的数据是些什么,我看不懂,只知道把我的信息Send到Google了 :P

百度开始清理索引

2008年01月23日 by 樂思蜀

前几天也发表了对百度最近表现的个人观点,这段时间通过使用工具和手动记录方式相结合,观察百度索引、排名上的一些变化。今天作了一些分析,樂思蜀感觉之前的猜想有那么一点真实可靠了,百度似乎准备启用新的存储机制,开始对目前索引的数据进行清理。

通过对近20个站的观察,最近百度平均收录数量下降,但与实际URL数越来越接近。我通常把高于实际URL数量以外的收录数称作“水份”,归纳为这3种:

  • 百度水份:使用“site:域名”查询出来的搜索结果数,并不一定是真正的索引数,百度可能为了标榜其数据库,在索引数中注入了水份。检查的最简单方法就是翻页,翻到最后一页,如果出现“……点击这里可以看到所有搜索结果”,点击后看到的数字基本是准确的索引数。
  • 技术水份:搜索引擎(不仅限于百度)毕竟是机器完成的,对“相似页面”或“重复页面”的处理仍不够完善,索引中可能包含一个页面的多个版本(如:很多论坛的无图版+完整版;使用URL不规范的程序,不同位置指向同一页面的链接URL版本不一致;等……)。
  • 网站水份:已经失效的页面,搜索引擎会适当保留一定时间;并无实质性价值的功能页;用户上传的搜索引擎能够索引的附件等。

在观察的近20个网站中,这几天水份数量在急骤减少,约1/3的网站收录数几乎等于实际URL数。

个人猜测,可能是百度准备启用新的存储机制,或对索引处理上的一次改进,目前对已经索引的页面进行清理,为新的技术更新做准备。

如果这个猜测成为事实,樂思蜀倒是有点担心,这次清理的力度会不会有点过。

观察的网站中有1/3有不同版本URL,清理时,约15%包含多版本URL的页面直接被从索引中删除了,这就有些接近于“惩罚”了;另外,这次对带“采集”性质(实验站非真正的采集,只是大量转载)清理也有些过,有2个站直接被清空了,通过与几位朋友的交流中也证实了这一点。

按此清理的标准下去,这次对中文网站的冲击是相当大的;以目前的形势,对百度自身也不利。

关于百度最近表现的个人观点

2008年01月14日 by 樂思蜀

SEOer和站长们可能都发现,百度从2007年年底至今,一直表现的很不稳定,甚至诡异。有人说百度来大姨妈了,甚至有人用灵异现象来解释百度。樂思蜀也来发表一下,对百度最近一系列表现的个观点。

个人觉得,百度可能正在进行两项工作:搜索引擎技术更新,存储机制完善。

首先,研究SE或SEO的可能会发现,百度的技术已经相对落后了,要保住“全球最大的中文搜索引擎”必须强壮自我。现在搜索引擎市场竞争异常残酷,今天东家要“超越百度”,明天西家还是要“超越百度”,虽然表面上百度可能不屑一顾,但事实上百度时刻都在为其“霸主”地位而担心。

为什么觉得百度在进行技术更新呢?学过企业或人力资源管理的朋友可能清楚,有一种情况下企业人力资源是处于“只出不进”的。个人觉得百度技术机制部分处于这样一个阶段,一边暂时以旧的技术处理目前的资源,一边渗入新的技术,在新技术完全渗入之前,会出现一个“混合”阶段,这个阶段往往是最乱的,最难以控制的。如果此猜想属实,百度此时与站长们同样烦乱着,同样期待这个阶段早点过去。

其次,与算法机制相配套的存储技术也在完善。百度目前的数据中心已经不能满足百亿网页级的需要了,存储当然不是问题,问题在于如何把这些数据进行最合理的处理,打造强大的后端数据处理能力,提供多于“360度”的检索方法。

前段时间提出的.cn域名不收录问题,已经被Zac的实验打破。其实,虽然有那么一些可能,百度为控制.cn降价引起的垃圾网页满天飞的局面,而降低对.cn的索引;但细心的朋友可能会发现,不管是.com或.cn,这个阶段百度的索引都不那么勤快。

以此看来,百度目前一边以新的存储机制“少量吃进”;一边细化处理,对过去索引的数据进行必要的清理。

如果以上猜想属实,百度将会进行一次较大的变革。

个人随便猜测的,仅供参考,事实会随着时间显现出来。

Google AdSense 宕机声明 很正常

2007年06月09日 by 樂思蜀

如今,总有一些人喜欢人为制造一些新闻,甚至盯准目标制造新闻。前阵盛传Google工具条收集用户信息,不收集用户信息咋给用户个性化定制?再传Google如何作恶,不知道是不是没看见中国的搜索引擎如何作恶的。

这不,Google AdSense 宕机了,发表了一则声明,却又生出事端。

http://www.enet.com.cn/article/2007/0610/A20070610655201.shtml

英文在第一,中文排在日文后,这很奇怪吗?

英文作为使用范围最广的语种,理所当然应该排在第一位,而且是Google的母语。至于中文排在日文后,同样属正常现象,等中文的Adsense占有率到全球第一的时候,简体中文肯定出现在第二甚至超过英文排在第一。

至于文中所说,只出现简体中文就有些可笑了。据我所知,有不少留学生,自己有站,他们根本不懂中文,只不过收款地址是中国,登录位置在中国。如果只出现简体中文,他们还得请翻译……

省省吧,Google已经做的够好了,即使“不懂中文”或本土化不到位,但至少不作恶,为简体中文Google-谷歌自豪!

有感于CCTV新闻联播

2007年05月02日 by 樂思蜀

今日CCTV-1“新闻联播”让我大跌眼镜(虽然我不戴眼镜)。

1、报道三峡大坝景区时,现场记者感慨三峡大坝“将一条黄河(可能说的长河,没听清)拦腰截断……”。不服都不行,如果说的是一条黄河的话,该记者就太可爱了;即使是长河,同样也够可爱,江和河从概念上有根本的区别。搞不清楚就不要乱引用,这样张冠李戴引人发笑。

2、西柞高速开通,其隧道的规模罕见,全国上下先后曾大量报道。播音员竟将柞水县念成“(Zuò)水县”,笑死人了。

从小就看新闻联播,记忆中从来没有见过如此低级的错误。感慨ing……

果然,百度反应最快

2007年04月22日 by 樂思蜀

  前段时间,有位朋友在我QQ上就百度和GOOGLE谁的更新快一事有过争论,一直没时间就此实验一下,正好新博开通,注意观察了一下。结果如我所料,百度动作是最快的。

  这个SEO博客域名和空间都是全新的,昨天上午上线,今天用“白开水”写的“站长伴侣”查了一下。

  百度收录9项(查看),新浪爱问收录8项(查看),GOOGLE未收录,YAHOO未收录。让中搜的恶意插件害了8次,就不提他。

  看来百度的更新频率是要快些,当然这不能完全证实,只是这一轮胜出。有时间了再建几个站点实验一下,结果届时公布。