2010年03月18日 by 樂思蜀
2010年3月2日,Matt Cutts 发表了一篇 Google, transparency and our not-so-secret formula,3月18日Google黑板报翻译成中文发表。文章内容针对什么不进行讨论,作为SEO,其中的大量链接的目标,对我们极具参考价值,比如这篇。
樂思蜀觉得,Google真的是非常开放,除其核心算法规则之类不公布外,其他都能在网上找到资料文档,这一点是某度之流无法相比的。但Google的资料散布于网络各处,真正要收集整理还不那么容易。这次Matt Cutts发布的文章链接,对我们整理Google资料,研究其喜好有非常大的帮助,建议朋友们阅读或收藏,保存到本地是最稳妥的。
以下是原文:
谷歌搜索的透明度以及我们算不上什么秘密的“准则”
发表者:Matt Cutts,搜索质量团队首席工程师
原文:Google, transparency and our not-so-secret formula
转载自:谷歌中文网站管理员博客
最近,欧盟委员会就一系列竞争申诉开始展开初 步调查。部分申诉指责谷歌在确定搜索结果排名的方式和原因等问题上不够透明。这一说法让我难以接受。关于如何与网站发布者进行交流,谷歌已经设定 过标准。下面让我向您介绍,谷歌如何对搜索结果进行排名及其根据。
关于谷歌“打分”的讨论主要集中在网页排名上。其实,所谓的“秘密准 则”其实根本算不上什么秘密。这篇论文对其有详细的 介绍。这篇早期的论文不仅介绍了网页排名的规则,同时还提到了谷歌排名的其他标准,其中包括锚文本、词语在文档内的位置、搜索关键词的相关顿、所用字体的 字号和类型、页面原始HTML代码以及词语大小写状态等。在过去几年中,谷歌陆续发布了数百篇研究论文。这些论文展现了许多 与谷歌运营有关的“秘诀”,以及谷歌所使用的文档基础架 构。其中的一些论文不仅促进了开源项目的发展,同时还帮助了很多公司的成长。
学术论文只是 其中一个方面,谷歌同时还通过其他方法介绍其经营方式。1999年,谢尔盖.布林参加了首届“网站站长搜索引擎战略大会”。2001年,谷歌成为首批 加入“网站站长的世界” 这一网络发布商在线论坛的搜索引擎之一。谷歌的的一个代表在论坛上发言2800多次,而另一位代表 AdWords顾问则发言约5000次。
随 着网络的发展,谷歌为实现透明化并促进信息交流所做出的努力也随之并进。我们于2004年5月开始发布博客,迄今为止我们已经在官方博客上发布了数以千计 的博文。谷歌现有70多个官方博客,其中包括官 方网站站长博客,这是一个专门帮助网站站长了解谷歌运作方式并帮助他们在我们的搜索结果中获得期望排名的博客。相比其他任何一个大公司,谷歌发布 了更多的博文。同时,我们还使用几十种不 同语言,在我们的网站上提供大量公共文档, 向发布者提供建议。
作为谷歌“反垃圾网站”团队的主管(我们团队致力于阻止各种违反了谷歌的“网 站站长指南”里公开、明确规定的垃圾网站行为),经常有人问我谷歌是如何运作的。这也是我2005年开始撰写个人博客的原因。迄今,我已经 发表了数百篇关于谷歌的博文。我的博文话题广泛,从常见 的网站错误到博客新手建议。我还有幸在 30多个搜索引擎会议上为网站站长做演讲,并对一些公共网站做评论和解析。事实上,这周我还将与10多个谷歌同事一起参加另一个搜索引擎会议, 解答相关疑问。
我们实验了各种方式,以帮助网站站长了解谷歌搜索排名的运作。我们举行了多次网 站站长现场谈话的在线直播,吸引了数百名参与者实时参加。此外,我们还尝试过发布Twitter消息和播客。而我还想介绍一种我最喜欢的方式,通过它,我们开诚公布地向网络发布商提供建 议:去年,我们收集了许多来自公众的问题,并在网站站长视频频道中发布了数百段视频答 复。这些视频的播放次数超过150万次!我们还通过在线博客回答公众关于谷歌业务运作的问题。
这样的例子不胜枚举。谷歌还与其他搜索引擎 合作,探讨如何让网站站长的工作变得更为轻松。由此产生的一系列行业标准有:指 定首选的网站地址url格式以及网站 地图,此举将使网站站长能够轻松地告知搜索引擎关于其网页的信息。谷歌还推出了一个网站站长论坛,谷歌员工和一些经验丰富的“超级用户”经常会登 陆这一论坛,解答关于某些特定站点的问题。我们还推出了人工服务的“虚 拟网站诊所”,为从旧金山到俄罗 斯、从印 度到西班牙语系的各地用户提供一对一的回复和建议。我们甚至还确认了谷歌算法中并不使用的排名符号,如关 键词元标记,因为这样能帮助网站站长省去一些无用功,并帮 他们避免不必要的官司纠纷。
令人沮丧的是,即便是谷歌所有的2万名员工全天候回答网站发布商的问题,我们仍然无法解答所有网站站 长的问题。原因何在?因为互联网上有超过1.92 亿个注册域名。这也是我们推出谷歌网站站长工具的原因,谷歌网站站长工具是一个一站式站 点,能提供可扩展的自助式服务信息,网站站长也可通过该工具向我们提供数据。要全面介绍我们向网站站长推出的这些功能强大的免费工具,恐怕需要再写一篇完 整的博文,因此在这里我仅列出其中的一些功能:
最近,一位谷歌员工发表博文,介绍了如何通过这些免费的公共工具来诊断其超过宽带上限的网 站空间(webhost) 的问 题。数百万网站站长也采取了类似的办法,利用谷歌的免费工具获取与其网站相关的有用信息。
谷歌致力于创建一种尽可能公开的经营方 式,甚至帮助用户将数据从谷歌产 品中导出。同时,我们并不认为企业有某些特定的商业秘密是不合理的,尤其当我们的保密是为了避免网站垃圾制造者和黑客利用我们的系统。如果那些试 图篡改谷歌搜索排名的人了解到了谷歌排名运作的所有细节,那么要将我们的搜索结果“篡改”成毫无关联的内容简直就轻松多了,比如说改成色情内容和恶意站 点,而最终蒙受损失的将会是用户。
最后我想说的是,随便批评谷歌的“秘诀”不是什么难事,但这并不是事实。多年来,谷歌一直致力于以一种 开放的方式开展业务,它向发布商提供关于谷歌排名规则的信息,并努力解答无论是发布商还是用户的各种问题。如果这就是人们对“秘密”的定义的话,那么,谷 歌的秘密无疑是在搜索的世界中保守得最糟糕的秘密。
2010年03月08日 by 樂思蜀
来自Google内部的SEO评测报告(来源),详细讲述了Google产品中,各因素的影响,非常珍贵的资源。

配合着Google之前发布的Search Engine Optimization Starter Guide(中文,英文;官方文章),针对Google的SEO基本要素基本都包含了。
樂思蜀建议下载后打印保存,方便随时翻阅。
2010年03月07日 by 樂思蜀
在Google中搜索某些关键词,搜索结果会出现如下图所示的产品搜索结果:

是否想过,让你网站的产品也加入到这个结果中呢?
当然,不是按本文的方法就一定出现在特定关键词搜索结果中,但只要做了就有机会,再辅以适当的手法,会带来可观的流量和订单。
如何向Google提交自己的产品资料?
第一步:访问 http://base.google.com
第二步:看到下图,请根据你的情况选择。如果已经有Google帐户,点击“Sign in to Merchant Center”创建帐户;如果没有需要先注册一个Google帐户,登录后返回这个地址,进入下一步。

第三步:选择国家地区,这一项影响到Google产品搜索中的按地区搜索,建议选择你主要销售的目标国家地区。

第四步:同意Google的条款(必须的)。
第五步:Configure your account,按项目填入相应的信息。
当你看到下面的界面,说明你已经成功了!
Google Merchant Center 的一些设置
1、Settings -> General
设置常规选项,上面第五步中的信息也可以在这里修改。
2、Settings -> FTP
设置FTP方式上传产品列表文件信息。如果你的产品很少,更新也不频繁,可以在控制面板中手动上传;如果你的产品够多,且常更新,建议在这里设置FTP信息,使用这里面设置的FTP信息上传产品列表文件。
3、其他设置项
Tax and Shipping、AdWords、Checkout根据自己情况设置,不一一介绍。
如何制作、注册并提交Data Feed
这个过程比较多,但难度不大,大家可以查看Google帮助自己动手实践。
使用Zen Cart的朋友,可以下载这个插件。
2009年12月03日 by 樂思蜀
上一篇日志“对于Google伪静态与静态HTML的差别”中提到了Google管理员工具实验室的一个功能,像Googlebot一样抓取,很实用。现在你再访问Google管理员工具,会发现又多了一个“网站性能”功能。
在这个工具中,Google给出了网站的性能统计数据,很详细,很实用。
1、性能概况
如樂思蜀SEO博客看到的数据和图例为:
您网站的平均网页载入时间为 6.3 秒(更新时间:2009-11-30)。 该网站比 81% 的网站慢。下图显示了您网站的平均网页载入时间在近几个月中的变化趋势。为方便您参考,它还显示了全体网站的 20% 分界线,以区别慢速和快速载入时间。

2、示例网页
Google管理员工具会拿部分具代表性的网页,显示出载入的时间:

3、Page Speed 建议
这是“网站性能”功能最具价值的内容,对典型网页提出减少加载时间的建议,包括gzip、DNS、资源网址、CSS压缩等,直观的给出优化建议。

Google向站长提供的这个功能,也预示着之前所说的网站速度会影响排名(WebProNews采访Matt Cutts时所说,详情查看‘Google: Page Speed May Become a Ranking Factor in 2010’),即将或已经进入Google排名算法。
大家可以依据“网站性能”所提供的建议,调整自己的网站,加快访问速度,提高用户体验的同时,提升网站友好度。
看着Google不断的为站长提供更多更实用的功能,感觉甚是欣慰,希望更多的人成为“GFans”,更多人“知之为知之,不知Google之”……
2009年11月30日 by 樂思蜀
下面樂思蜀就静态HTML与伪静态问题,发表一下个人看法。
以下内容,仅针对Google,其他搜索引擎未必如此。
首先我们来看哪个更好的问题
就老樂多年对Google的观察,目前Google在这个问题上已经基本完美解决。也就是说,现在对于Google,无论使用伪静态还是静态HTML,基本都能很好的抓取和收录,不会出现几年前那种带多个参数的动态URL就不抓取的现象。
抓取解决了,那么同等情况下,伪静态还是静态HTML针对搜索引擎更好?答案是静态HTML,截止目前是这样,以后不保证(后面的内容会再说这个问题)。
上面所说一定是在同等情况,如前面的一篇文章“Google解说动态、静态、伪静态网址”所说,你要把这样一个URL地址:
http://www.domain.com/read.php?classid=123&lang=en&id=321
Rewrite成:
http://www.domain.com/read-321.html
效果理论来说反而不如上面的动态地址。
接下来我们来看Google看到的伪静态和静态HTML
Google 管理员工具 中增加了“像 Googlebot 一样抓取”功能,对于SEO来说,价值是非常大的,可以直观的看到,Googlebot看到你的网页是什么样的。
为了实验,上传了一个演示xhtml代码的静态HTML网页,与上一篇文章做对比。下面是模拟抓取出来的结果:

(点击查看大图)
上图中,左侧是一篇文章的伪静态页面,右侧是一个静态HTML文件,对比一下,能明显看到下面两个差别:
下图是静态HTML的文件属性:

最后,猜测一下Google为什么认为静态HTML优于动态URL
对比一下静态HTML与动态URL的工作方式:
使用动态URL:假如程序出现问题,所有基于些程序的内容将无法访问;假如模板变化,所有信息内容都会发生变化,而真正有价值的内容并没有改变;假如数据库ID不是唯一,新增的内容沿用了被删除内容的ID,将出现URL没有改变而页面完全变化……
而如果是静态HTML,文件只有“存在&不存在”(服务端状态不计算在内),“修改&未修改”(读Last-Modified就好了)。
经过这样的分析,得出的结果是:静态HTML具有更高的稳定性。
这个猜测也能解释SEO经常遇到的一个问题,网站中的一些文档(PDF&DOC&XML)权重相对都较高。
挺长时间没有写博客,语言有些混乱,呵呵
有时间的时候,专门写篇博客,介绍一下Google管理员工具中“像 Googlebot 一样抓取”各标签的意思,刚开始用的朋友可能对这些不是很了解。
2009年11月26日 by 樂思蜀
Jesus Diaz 同学周三公布了一个访问 Google 新界面的方法,摘录下来,大家尝试一下。
1、访问Google英文
2、在地址栏里输入以下代码,回车:
javascript:void(document.cookie="PREF=ID=20b6e4c2f44943bb:U=4bf292d46faad806:TM=1249677602:LM=1257919388:S=odm0Ys-53ZueXfZG;path=/; domain=.google.com");
3、按F5或点击刷新,就会看到 Google 的新界面了。

留意左侧,很方便快捷,常用的一些功能直观的展示出来了,据 Marissa Mayer 说是为了让页面整体更协调。
2009年09月28日 by 樂思蜀
2009年9月27日,Google挂出了这个Logo:

不是拼写错误,也不是Google改名了,是庆祝Google的11岁生日!
每年Google都会在其生日表示祝福,那么Google的生日到底是哪一天?
之前的几年里,Google也未确定具体某一天为其生日,时间一般都不一样;但近几年以来,都是9月27日这一天发布Logo庆祝,也就可以粗略的推断,Google公司将9月27日这一天作为其生日。
2009年02月19日 by 樂思蜀
今天在Google中查询欧派的收录时发现,Google将仅在联系方式页上做了一个图片链接的vCard文件也索引了,观察了其他几个站点,有些供客户下载的Word文档也出现类似情况,事实证明,Google现在已经能够正确识别图片链接了。

为了证实和确认,现在再做个实验,放个 Microsoft Dynamics CRM 4.0 实施指南,DOC文档,观察一下Google能否通过下面的图片链接索引到。