从HTTP状态 301,302,200 来看页面跳转

301和302 Http状态有啥区别?

301,302 都是HTTP状态的编码,都代表着某个URL发生了转移,不同之处在于:

301 redirect: 301 代表永久性转移(Permanently Moved),

302 redirect: 302 代表暂时性转移(Temporarily Moved ),

当然 Http 状态 200 标示没有任何问题发生。

这两种转移在使用的时候有啥好处或者问题?

301 重定向是网页更改地址后对搜索引擎友好的最好方法,只要不是暂时搬移的情况,都建议使用301来做转址。

302 重定向是临时性转移。 Continue reading

如何禁止搜索引擎蜘蛛爬行

方法一、robots Meta标签

robots.txt是放在网站中,文件级的网络蜘蛛授权;而robots Meta标签是放在网页中,一般用于部分网页需要单独设置的情况下。两者的功能是一样的。
Meta robots标签必须放在<head>和</head>之间,格式:
<meta name=”robots” content=”index,follow” />
content中的值决定允许抓取的类型,必须同时包含两个值:是否允许索引(index)和是否跟踪链接(follow,也可以理解为是否允许沿着网页中的超级链接继续抓取)。共有4个参数可选,组成4个组合:
index,follow:允许抓取本页,允许跟踪链接。
index,nofollow:允许抓取本页,但禁止跟踪链接。
noindex,follow:禁止抓取本页,但允许跟踪链接。
noindex,nofllow:禁止抓取本页,同时禁止跟踪本页中的链接。
以上1和4还有另一种写法:
index,follow可以写成all,如:
<meta name=”robots” content=”all” />
noindex,nofollow可以写成none,如:
<meta name=”robots” content=”none” />
方法二、创建robots.txt文本
对于robots.txt文本的相关概念或者是协议我就不提了,主要是直接告诉大家这个文件的写法。
文件应该同时包含2个域,“User-agent:”和“Disallow:”,每条指令独立一行。 Continue reading

SEO URL的优化方案【转】

针对搜索引擎优化(SEO),页面URL的布局与呈现是影响排名和网站索引率的重要因素之一。对于搜索引擎而言,URL是它们找到一个网页的入口,URL的好坏会直接影响搜索引擎对一个网站的索引及理解程度。对于用户,URL会直接显示在搜索结果中,从而影响人们的点击意愿。因此一个好的URL结构无论是对搜索引擎,还是用户,都有着非常重要的作用。在本文中,我们将详细探讨针对SEO的URL优化技巧,但同时也想提醒大家,对于一个现有的网站,URL的改动需要谨慎。URL的改动会牵扯到原有URL权重的转移等问题,因此除非在万不得已的情况下,尽量不要改动现有的URL。但如果你是在策划一个新的网站或者生成新的页面,那么就让我们来探讨一下如何得到一个完美的URL吧。
1. URL愈短愈好
无论是搜索引擎,还是浏览者,都喜欢简短的URL。URL的层级不宜过多,尽量控制在4级之内。虽然搜索引擎仍然会抓取四级之后的页面,但页面的权重会大大降低。 Continue reading

Sitemap的XML格式及注意事项

这篇文章介绍的比较全的:http://wenku.baidu.com/view/bb73b94acf84b9d528ea7a69.html

此文档介绍适用于 Sitemap 协议的 XML 架构。

Sitemaps 协议格式由 XML 标记组成。Sitemap 的所有数据数值应为实体转义过的。文件本身应为 UTF-8 编码。

Sitemap 必须:

  • 以 <urlset> 开始标记作为开始,以 </urlset> 结束标记作为结束。
  • 在 <urlset> 标记中指定命名空间(协议标准)。
  • 每个网址包含一个<url> 条目作为 XML 父标记。
  • 在每个 <url> 父标记中包含一个 <loc> 子标记条目。

其他所有标记均为可选,搜索引擎不同,对可选标记的支持也各不相同。有关详情,请参阅各个搜索引擎的文档。 Continue reading

站点地图标记定义

下表简要介绍了站点地图在列举网络网址时所需的标记。要添加关于特定内容类型的更多详情,请参见视频图片移动新闻软件源代码以及地理 (KML) 信息

标记 必需 说明
<urlset> 必需 包含站点地图中网址集的所有相关信息。
<url> 必需 包含特定网址的所有相关信息。
<loc> 必需 指定网址。请指定图片和视频的目标网页(又称播放页、引用页)。必须是具有唯一性的网址。
<lastmod> 可选 网址的最后修改时间,使用 YYYY-MM-DDThh:mmTZD 格式(时间值是可选的)。
<changefreq> 可选 提供关于网页更改频率的提示。有效值为:

  • always。对于每次访问时都发生更改的网页,请使用该值。
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never。对于已存档的网址,请使用该值。
<priority> 可选 说明网站上的某个网址相对于其他所有网址的优先级。此优先级的范围是 1.0(极其重要)到 0.1(一点都不重要)。不影响您的网站在 Google 搜索结果中的评级。由于该值是相对于您网站上的其他网页而言的,指定高优先级(或为所有网址指定相同优先级)对提高您网站的搜索评级毫无帮助。此外,将所有网页设置为同一优先级也不起作用。

来源:http://www.google.com/support/webmasters/bin/answer.py?answer=183668

要注意内容里的一些特殊字符,可能会产生异常的,解决方案见这里xml特殊字符的处理

网站登录 搜索引擎登录入口,网站收录入口

百度网站登录入口
Google网站登录入口
Yahoo网站登录入口
Bing网站登录入口
Dmoz网站登录入口
Coodir网站目录登录入口
Alexa网站登录入口
搜狗网站收录提交入口
Soso网站收录提交入口
有道搜索网站登录入口
搜索引擎收录查询
中国搜索网站登录入口
Onebigdirectory.com 搜索引擎批量提交
Freewebsubmission.com 搜索引擎批量提交

JS内存释放问题

一个内存释放的实例

<SCRIPT LANGUAGE="JavaScript">
<!--
strTest = "1";
for ( var i = 0; i < 25; i ++ )
{
strTest += strTest;
}
alert(strTest);
delete strTest;
CollectGarbage();
//-->
</SCRIPT>

CollectGarbage, 是IE的一个特有属性,用于释放内存的使用方法嘛应该是,将该变量或引用对象,设置为null或delete然后在进行释放动作
在 做CollectGarbage前,要必需清楚的两个必备条件:

引用
- 一个对象在其生存的上下文环境之外,即会失效。
- 一个全局的对象在没有被执用(引用)的情况下,即会失效。 Continue reading

YSlow 使用指南_最新2.0使用指南中文版

YSlow分析网页,并提出如何提高其性能的基础上一套规则,高性能的网页。我搜索一下”Yslow使用说明“,发现都是旧版本Yslow的使用介 绍。于是翻译了一下yahoo官方关于新版Yslow的的使用帮助,希望给初次使用Yslow的朋友一些帮助。

注:英文不是很好,对着翻译软件翻译的,有不对的地方,大家指正。 Continue reading

Apache 网站访问速度提升优化

Yahoo 开 发者网站上,Yahoo 提出了优 化网站性能的N条规则(Best Practices for Speeding Up Your Web Site)。这些规则是:

1. 尽可能的减少 HTTP 的请求数(Minimize HTTP Requests) —— Tag: content

2. 使用 CDN(Use a Content Delivery Network) —— Tag: server

3. 添加 Expires 头(或者 Cache-control ) (Add an Expires or a Cache-Control Header) —— Tag: server

4. Gzip 组件(Gzip Components) —— Tag: server

5. 将 CSS 样式放在页面的上方 (Put Stylesheets at the Top) —— Tag: css

6. 将脚本移动到底部(包括内联的)(Put Scripts at the Bottom) —— Tag: javascript Continue reading