2008年04月08日 by 樂思蜀
樂思蜀提醒朋友们,从网上下载的部分模板需要当心,一定要将代码细细检查后再投入使用,以避免可能造成的损失。
noindex,nofollow
最近下载了几款WordPress模板,发现 header.php 文件中,竟然包含这样的 Meta标签:
<meta name="robots" content="noindex,nofollow" />
SEO都知道,这样会导致什么样的后果。
同样,页面中的各个链接也需要检查,某些模板在站内链接中也包含 rel="nofollow" 。
隐藏层
有时不能只看模板显示是否正常,部分心术不正者,在模板中插入一个或多个隐藏层,加入其网站链接或其他内容。
今天测试一个模板时,就发现其中包含了这样一段代码,链到一个X类站点:
<div style="margin-top:-10000px;"><a href="???"></a></div>
同时,CSS文件中,发现负N的margin,留心一下是样式上的需要还是恶意行为。
Javascript
Javascript脚本、.js文件需特别留心,最好先在本地使用工具扫描一下,目前的杀木马工具能识别出流行的木马或后门。
iframe
在模板中用0像素iframe调用页面,也是常见的一种伎俩。
这种影响可大可小,一般作恶者会在iframe目标网页中再加入其他内容,如果包含木马,将是网站的一大后患。
程序文件
如WordPress的模板,都是.php文件,需检查各个文件的功能和所包含的内容,重点是 functions.php 文件,其中可以定义很多函数,也最有可能被利用。
再就是注意模板中的文件,是否都是模板所必需的,有时一个文件(如phpspy等)对于网站安全将是致命的。
链接
分享别人的劳动成果时,为作者做上链接是一种良好的习惯。但部分模板并不是发布者创作,或创作者本身的恶意行为,在模板版权位置留下作者链接,而链接的网站已经被搜索引擎惩罚,甚至是违法的站点。
这种情况建议去除链接,为尊重作者,留下模板、作者名称即可。
上面所列的只是几种常见问题,如果你经常下载模板,观察一下会发现还有更多的恶意行为,所以在使用时最好对各个文件进行细致的检查,确保网站的安全和针对搜索引擎的友好。
2008年04月03日 by 樂思蜀
最近忙着为一个客户做优化,其实基本的优化工作已经结束,现在主要做的是分析工作,根据分析出来的数据对网站做适当调整,和一些营销工作。
今天将数据进行了汇总,分析了一下上月的情况,不由得感慨,也为我之前耗费精力去做些垃圾网站而汗颜。
一个行业产品销售平台,由这么些内容组成:30多个静态网页,1个程序文件(订单,由1个php的小程序将订单发送到邮箱),1个CSS文件,8个图片。
而就这样一个网站,日独立访客近3千,搜索来源67%,回访比率33%,人均访问6页以上。
其产出量更是惊人,3月完成交易近80单,最低售价都以万为单位,加上高额的利润比率,收益十分可观
写到这里,又想起2005年一个让我记忆很深的客户,做一个传统的冷门行业,他的网站一天独立访问量不到300,站上的广告位却卖1000元/月,而且奇怪的是竟然都卖出去了。
问他原因时他说:我选这个行业就是因为做的人少,我虽然一天不到300个访问量,但同行业的其他网站还不到200,我就是最好的,当然广告位就能卖出去。
一个日访问客不到300的网站,却将10多个1000元/月的广告位全卖出去了,这位朋友就这样SOHO着,对于他来说是否富足不知道,但起码衣食无忧了。
最近将MSN的签名改成了“Do meaningful things”,是基于上面的感慨和自勉。
向网站要收益吧,别再做垃圾流量了,靠做流量赚广告费已经是过去的事,是时候计算一下投入、产出的比例,冷静下来做有意义的事了。
2008年03月09日 by 樂思蜀
由于种种因素,目前国内SEO资料趋于“老龄化”,很多已经过时的、就目前来说已经不正确的理论,让初学者产生错误的理解。
比如Zac前几天在SEO每天一贴中写道,Google其实已经不跳舞了,但很多文章中还在大说Gooogle Dance。
樂思蜀最近在交流中发现,很多朋友对网站结构深度的理解是不正确的,或已经过时的。
早期由于技术原因,搜索引擎会避免索引多级物理目录下的网页,甚至目录级数会影响排名。随着搜索技术完善,目前这种情况已经不存在了,一个网站中,“/1/2/3/4/5/6/7/8/9/0/a.html” 这样物理目录的网页,如果在首页有它的链接,搜索引擎索引、排名,与根目录下的网页没有任何区别。
网站结构深度取决于链接策略,直观的理解就是到达点击次数。即从网站首页开始,到达点击次数越少,结构深度就越浅;反之,需要点击多次才能到达的,结构深度就深。
另据有关文章称,搜索引擎对有条理、有特征的URL结构比较喜欢,如WordPress常见的“/年/月/日/标题/”结构。
这有待确认,但我觉得不是没有可能。
2008年01月10日 by 樂思蜀
在修改WordPress模板,制作页面时,经常需要批量转换文件编码,通过搜索找到这个小工具,分享一下。
这个80KB的小工具,可以将文件在GB、GIG5、UTF-8之间批量转换,使用起来很方便。
当前最新版本V1.3,可以在作者网站下载,或点这里下载。
为培养写博客的习惯,坚持每天写一篇,没有想到写什么内容时,就拿些小工具出来分享,贵在坚持。
2008年01月09日 by 樂思蜀
网页编码相信都很熟悉了,樂思蜀想说的是,如果针对搜索引擎,UTF-8不是你的最佳选择。
原因很简单:大家都知道,一个日本网站,在Google.com搜索结果中的排名可能很低,但可能在google.co.jp搜索结果中排名可能较高。
我们在制作网页时,应尽可能的使用区域性的编码(GB2312、iso-8859-1、windows-1252……),以便搜索引擎尽快或准确的将网站识别成“本地”的。
当然也是根据访问者而定,如果涉及多语言访问者,必须考虑UTF-8的通用性。
2006年12月14日 by 樂思蜀
前两天发完《SEO参考:DIV+CSS三行两列经典布局》一文,不少朋友在MSN上问我,使用XHTML标准的DIV+CSS布局对于SEO到底有什么作用。这两天简单总结了一下,写出来供参考。
XHTML技术问题请参考相关网站研究,下面说说在SEO方面的影响。
代码精简
使用DIV+CSS布局,页面代码精简,这一点相信对XHTML有所了解的都知道。代码精简所带来的直接好处有两点:一是提高spider爬行效率,能在最短的时间内爬完整个页面,这样对收录质量有一定好处;二是由于能高效的爬行,就会受到spider喜欢,这样对收录数量有一定好处。
表格的嵌套问题
很多SEOer在其文章中称,搜索引擎一般不抓取三层以上的表格嵌套,这一点一直没有得到搜索引擎官方的证实。我的几项实验结果没有完全出来,但根据目前掌握的情况来看,spider爬行Table布局的页面,遇到多层表格嵌套时,会跳过嵌套的内容或直接放弃整个页面。
使用Table布局,为了达到一定的视觉效果,不得不套用多个表格。如果嵌套的表格中是核心内容,spider爬行时跳过了这一段没有抓取到页面的核心,这个页面就成了相似页面。网站中过多的相似页面会影响排名及域名信任度。
而DIV+CSS布局基本上不会存在这样的问题,从技术角度来说,XHTML在控制样式时也不需要过多的嵌套。
这虽然没有得到确认,但还是建议使用Table布局的朋友们,在设计时尽可能的不要使用多层表格嵌套,SEOer们在文章中说明了这一点,相信他们也不是没有依据的。
速度问题
DIV+CSS布局较Table布局减少了页面代码,加载速度得到很大的提高,这在spider爬行时是非常有利的。过多的页面代码可能造成爬行超时,spider就会认为这个页面无法访问,影响收录及权重。
另一方面,真正的SEOer不只是为了追求收录、排名,快速的响应速度是提高用户体验度的基础,这对整个搜索引擎优化及营销都是非常有利的。
对排名的影响
基于XTHML标准的DIV+CSS布局,一般在设计完成后会尽可能的完善到能通过W3C验证。截止目前没有搜索引擎表示排名规则会倾向于符合W3C标准的网站或页面,但事实证明使用XTHML架构的网站排名状况一般都不错。这一点或许会有争议,但樂思蜀本人保持这样的观点,有异议者可以拿三组以上基本同等质量的网站对比观察。
我想,这样的情况可能不是排名规则,最大的可能还是spider爬行网站时,出现以上差异导致收录质量的不同。
毕竟廖胜于无,建议建站或改版的朋友们,技术许可的情况下,还是选择DIV+CSS布局为好。
2006年12月11日 by 樂思蜀
这个XHTML1标准的DIV+CSS布局是著名网页设计师阿捷2004年发布在《网页设计师》上的,一个非常经典的布局,在IE、Mozilla和Opera浏览器中均可以实现居中和高度自适应。完整代码如下(在原代码的基础上作了一定规范整理):
点此下载代码 (seo_div_css_32.txt)
页面样式图:

页面实现居中等XHTML技术分析请到我编辑整理的帖子,或《网页设计师》查看,效果演示及代码:http://www.seobbs.net/xhtml32.html
下面从SEO角度分析这个布局的优势:
我们先按网页设计惯例来看页面中的内容分布,一般情况下,头部(A区)为站点导航,底部(D区)为辅助导航及版权信息等,左侧(B区)会放搜索、列表、排行等功能性内容,核心内容就集中在右侧(C区)。
如上图标识所示,按传统的布局,代码编写顺序是”A->B->C->D”,也可以理解为”功能->功能->核心内容->功能”。
都知道,搜索引擎蜘蛛爬行时,是按着页面代码顺序自上而下的,这种情况下蜘蛛很难最快的爬行到核心内容;而当页面代码过多的时候蜘蛛完全有可能没有爬行到核心内容就折回,抓取到的是与其他页面一样的功能内容时,这个页面就成为相似网页。
为了避免这样的情况,包括新浪、搜狐、网易在内的很多网站(可能也包括你^_^),都在设计时将页面中B区和C区对调。
再来看本布局方式,页面代码顺序是”A->C->B->D”,按内容分布可以理解为”功能->核心内容->功能->功能”,在不改变页面展示的情况下,将核心内容部分放到了前面。
这样,蜘蛛爬行时就能在最短时间内索引到网页的核心内容。
再加上XHTML标准设计代码精简的优势,蜘蛛爬行的效率和质量都会很高,也会更受蜘蛛欢迎的。