使用apache的rewrite功能来防迅雷

不知道为什么,本来不受重视的L’Yun,却一直多灾多难,前几天空间呗停掉了,一个很以为的原因,每天将近9G的流量,晕死了,最多的一天才只有6个IP,但竟然有这么大的流量。后来查看了下日志,竟然是两首MP3引起的,每一秒钟都有人在下载。刚开始以为是百度干的,但是后来看了下在百度的位置,还不至于达到那么大的流量,然后自然而然的就想到迅雷了,看看别人的文章,可以肯定下,迅雷是个流氓!

解决方案:
1、对服务器的攻击屏蔽后,不用理会,不会造成太大影响。
2、被百度收录的是一部分MP3,因为不希望不访问网站就直接从后台下载网站的mp3,于是增加搜索引擎访问限制。在网站根目录下放置robots.txt,内容如下:
User-agent: Baiduspider
Disallow: /****
*表示不允许百度搜索引擎收录的路径。相对于百度,雅虎、MSN和Google的搜索引擎机器人没有那么流氓,所以不需要屏蔽。 Continue reading

Nginx常用Rewrite(伪静态规则)

信现在大部分用Linux VPS的朋友都在使用这个迅速传播的Nginx,今天就整理一下最常见的PHP程序的Rewrite(伪静态规则)。

WordPress:

location / {
index index.html index.php;
if (-f $request_filename/index.html){
rewrite (.*) $1/index.html break;
}
if (-f $request_filename/index.php){
rewrite (.*) $1/index.php;
}
if (!-f $request_filename){
rewrite (.*) /index.php;
}
}

Continue reading

nginx rewrite规则和参考

推荐参考地址:
Mailing list ARChives 官方讨论区
http://marc.info/?l=nginx

Nginx 常见应用技术指南[Nginx Tips]
http://bbs.linuxtone.org/thread-1685-1-1.html

本日志内容来自互联网和平日使用经验,整理一下方便日后参考。

正则表达式匹配,其中:

  1. * ~ 为区分大小写匹配
  2. * ~* 为不区分大小写匹配
  3. * !~和!~*分别为区分大小写不匹配及不区分大小写不匹配

文件及目录匹配,其中:

  1. * -f和!-f用来判断是否存在文件
  2. * -d和!-d用来判断是否存在目录
  3. * -e和!-e用来判断是否存在文件或目录
  4. * -x和!-x用来判断文件是否可执行 Continue reading

apache中url_rewrite重写的一些正则的基本用法

来源:http://www.phpx.com/man/Apache-2/mod/mod_rewrite.html

top

RewriteRule 指 令

说 明 为重写引擎定义重写规则
语 法 RewriteRule Pattern Substitution [flags]
作 用域 server config, virtual host, directory, .htaccess
覆 盖项 FileInfo
状 态 扩展(E)
模 块 mod_rewrite
兼 容性 cookie-flag在Apache 2.0.40及以后的版本中可用

RewriteRule指令是重写引擎的根本。此指令可以多次使用。 每个指令定义一个简单的重写规则。这些规则的定义顺序尤为重要——在运行时,规则是按这个顺序逐一生效的。

Pattern是一个作用于当前 URL的perl兼容的正则表达式。”当前URL”是指该规则生效时刻的URL的 值。它可能与被请求的URL截然不同,因为其他规则可能在此之前已经发生匹配并对它做了改动。

正则表达式的一些用法示例: Continue reading

Apache mod_rewrite模块中RewriteCond和RewriteRule的指令格式

RewriteCond指令格式
语法: RewriteCond TestString CondPattern
1) TestString是一个纯文本的字符串,但是可以包含可扩展的成分
2) CondPattern是条件pattern, 即一个应用于当前实例TestString的正则表达式, 即TestString将会被计算然后与CondPattern匹配.
3) 另外,还可以为CondPattern追加特殊的标记[flags] 作为RewriteCond指令的第三个参数。Flags是一个以逗号分隔的以下标记的列表:
‘nocase|NC’  它使测试忽略大小写, 即TestString和CondPattern无大小写检查
‘ornext|OR’  它以OR方式组合若干规则的条件,而不是隐含的AND。

RewriteRule 指令
语法: RewriteRule Pattern Substitution
1) Pattern是一个作用于当前URL的兼容perl的正则表达式. 这里的“当前”是指该规则生效时的URL的值。
2) Substitution是,当原始URL与Pattern相匹配时,用以替代(或替换)的字符串。
3) 此外,Substitution还可以追加特殊标记[flags]  作为RewriteRule指令的第三个参数。 Flags是一个包含以逗号分隔的下列标记的列表:
‘redirect|R [=code]‘ (强制重定向 redirect)
以http://thishost[:thisport]/(使新的URL成为一个URI) 为前缀的Substitution可以强制性执行一个外部重定向。 如果code没有指定,则产生一个HTTP响应代码302(临时 性移动)。 如果需要使用在300-400范围内的其他响应代码,只需在此指定这个数值即可, 另外,还可以使用下列符号名称之一: temp (默认的), permanent, seeother. 用它可以把规范化的URL反馈给客户端,如, 重写“/~”为 “/u/”,或对/u/user加上斜杠,等等。 Continue reading

RewriteLog 指令

RewriteLog 指令

说 明 设置重写引擎日志的文件名
语 法 RewriteLog file-path
作 用域 server config, virtual host
状 态 扩展(E)
模 块 mod_rewrite

RewriteLog指 令设置用于记录所有重写操作的日志文件的名称。如果此文件名不以斜杠(‘/‘) 开头,则它是相对于Server Root的,此指令应该在每个服务器级别的配置中仅仅出现一次。

如果要关闭对重写操作的记录,不推荐将Filename设为/dev/null ,因为,虽然重写引擎不能输出记录了,但仍会在内部建立这个日志文件,这 样会使服务器速度降低,而且对管理员毫无益处!要关闭日志,可以删除或注解RewriteLog指令, 或者使用”RewriteLogLevel 0“的设置 Continue reading

Apache URL重写指南

本文阐述在实际应用中如何解决网管所面临的基于URL的典型问题,并详细描述了如何配置URL重写规则集以解决这些问题。

注意:根据你的服务器配置,有可能必须对这里的例子作些小修改,比如,在额外启用mod_aliasmod_userdir的 情况下要增加[PT]标志,或者为了适应目录级(.htaccess)的配置而将针对服务器级的规 则集进行重写。对一个特定的规则集应该先透彻理解然后再考虑应用,这样才能避免出现问题。

规范化URL

描述:
在有些web服务器上,一个资源会拥有多个URL。在实际应用和发布中应该使用的是规范的URL,其他的则是 简写或者只在内部使用。无论用户在请求中使用什么形式的URL,最终看见的都应该是规范的URL。 Continue reading

Apache的URL重写规则的标志详细说明

Apache的URL重写规则的标志详细说明

1) R[=code](force redirect) 强制外部重定向

强制在替代字符串加上http://thishost[:thisport]/前缀重定向到 外部的URL.如果code不指定,将用缺省的302 HTTP状态码。

2) F(force URL to be forbidden)禁用URL,返回403HTTP状态码。

3) G(force URL to be gone) 强制URL为GONE,返回410HTTP状态码。

4) P(force proxy) 强制使用代理转发。

5) L(last rule) 表明当前规则是最后一条规则,停止分析以后规则的重写。

6) N(next round) 重新从第一条规则开始运行重写过程。

7) C(chained with next rule) 与下一条规则关联 Continue reading

使用Apache的rewrite技术

做PHP项目中需要用到URL重定向技术,基本上的需求就是把比如 /user/heiyeluren 重定向到 /user.php?uid=heiyeluren 之类的URL上,当然,你也可以把 /article/200707291011.html重定向到 /article.php?id=200507291011 之类的,模拟好像是静态页面,能够隐藏URL真实地址,有助于雨鞋基本的安全防范等等。那么好像rewrite是个很好的解决办法。

要在Apache里运行rewrite的话,必须先安装mod_rewrite的组件,就是一个mod_rewrite.c文件,然后必须在./configure的时候要放上mod_rewrite就能安装。
一般配置rewrite的话,可以在httpd.conf里面配置,也能在网页当前目录的.htaccess文件里进行定义来决定重定向去那个文件,那样的话,就非常具有灵活性了,同样也能够适合虚拟主机用户来做。

我们看一个.htaccess文件的例子:


1 <IfModule mod_rewrite.c>
2 RewriteEngine On
3 RewriteBase /
4 RewriteCond % -f [OR]
5 RewriteCond % -d
6 RewriteRule ^.*$ – [S=42]
7
8 #RewriteRule ^share/$ /share.php [QSA,L]
9 RewriteRule ^tag/([^/] )/?$ /user_tags.php?tag= [QSA,L]
10 RewriteRule ^city/([^/] )/?$ /user_city.php?tag= [QSA,L]
11 #RewriteRule ^([^/] )/day/([^/] )/?$ /user_share.php?id=&s=1&selTime= [QSA,L]
12 #RewriteRule ^([^/] )/day/([^/] )/?$ /user_share.php?id=&s=1&selTime= [QSA,L]
13
14 RewriteRule ^([^/] )/day/([^/] )/?$ /user_share.php?id=&s=1&selTime= [QSA,L]
15 RewriteRule ^([^/] )/week/([^/] )/?$ /user_share.php?id=&s=2&selTime= [QSA,L]
16 RewRiteRule ^([^/] )/month/([^/] )/?$ /user_share.php?id=&s=3&selTime= [QSA,L]
17
18 RewriteRule ^([^/] )/day/?$ /user_share.php?id=&s=1 [QSA,L]
19 RewriteRule ^([^/] )/week/?$ /user_share.php?id=&s=2 [QSA,L]
20 RewriteRule ^([^/] )/month/?$ /user_share.php?id=&s=3 [QSA,L]
21
22 RewriteRule ^([^/] )/?$ /user_share.php?id= [QSA,L]
23 </IfModule>


比较长吧,我们就简单关注一下关键的内容。<IfModule></IfModule>之间就是定义的内容,RewriteEngine就是确定是否运行URL重写功能,RewriteBase就是基本的路径是什么,最关键的就是下面的RewriteRule,就是我们需要重写的规则了,这里应用了兼容Perl规则的正则表达式:


Text:
. 匹配任意单个字符
[chars] 匹配当前字符
[^chars] 不匹配当前字符
text1|text2 包含text1或者text2任何一个

Quantifiers:
? 零个或者一个?号前的字符
* 零个或者任意个任意长度的任意字符
一个或者任意个任意长度的字符

Grouping:
(text) Grouping of text
(either to set the borders of an alternative or
for making backreferences where the Nth group can
be used on the RHS of a RewriteRule with $N)

Anchors:
^ 匹配内容开始标记
$ 匹配内容结束标记

Escaping:
char 使用来进行特殊字符的转义,包括”.[]()”等字符的转义


基本规则如上,比如下面的正则表达式:^/([^/] )/~([^/] )/(.*)$ 就是能够匹配象 /Language/~ Realname/…/File 这样的路径。

那么从这个角度去看上面的内容就比较容易理解了。我们简单看一下RewriteRule指令的规则:
RewriteRule 访问的路径 需要指向的真实路径
这样就很清楚了,比如说我要把/user/heiyeluren重定向到/user.php?uid=heiyeluren那么我的规则就必须这样:
RewriteRule ^user/([^/] )$ ^/user.php?uid= [QSA,L]

举一反三,就很容易理解规则如何去写,也就能够理解上面规则脚本的内容了。

没有清楚的,请参考附上的链接,更深入的了解具体内容。写的不好请见谅。

Apache重写规则的常见应用

—- 本文旨在提供如何用Apache重写规则来解决一些常见的URL重写方法的问题,通过常见的实例给用户一些使用重写规则的基本方法和线索。

一、 为什么需要用重写规则

—- 网站的生命在于不断地进行更新和维护,根据业务发展的需求转移服务器进行维护、重新组织目录结构、变换URL甚至改变到新的域名等情况是经常发生的。为了 让客户不会因此受到任何影响,最好的方法就是使用Apache Rewrite Rule(重写规则)。

二、重写规则的作用范围

—- 1.使用在Apache主配置文件httpd.conf中。
—- 2.使用在httpd.conf里定义的虚拟主机配置中。
—- 3.使用在基本目录的跨越配置文件.htaccess中。

三、重写规则的应用条件

—- 当用户的Web请求最终被导向到某台Web服务器的Apache守护进程,Apache根据配置文件判断该请求是主配置还是虚拟主机,再根据用户在浏览器 中请求的URL来匹配重写规则,并且根据实际的请求路径匹配.htaccess中的重写规则,最后把请求的内容传回给用户。该响应可能有2种。

—- 1.将请求内容外部重定向(Redirect)到另一个URL
—- 让浏览器再次以新的URL发出请求(R=301或者R=302,临时的或是永久的重定向)。

—- 例如,一个网站有正规的URL和别名URL,对别名URL进行重定向到正规URL,或者网站改换成了新的域名,则把旧的域名重定向到新的域名。

—- 2.由Apache内部子请求代理产生新的内容送回给客户[P,L]
—- 这是Apache内部根据重写后的URL,通过代理模块请求内容并将最终内容送回给客户,客户端浏览器不必再次请求,浏览器中的URL不会被重写,但实际 内容由Apache根据重写规则后的URL生成。

—- 例如,在公司防火墙上运行的Apache启动这种代理重写规则,代理对内部网段上的Web服务器的请求。

四、重写规则怎样工作

—- 我们假定在编译Apache时已经把mod_rewrite编译成模块,确信您的httpd.conf中有LoadModule rewrite_module libexec/mod_rewrite.so,并且在Addmodule中有Addmodule mod_rewrite.c,则可以使用重写规则。

—- 当外部请求到达Apache,Apache调用重写规则中的定义来重写由用户浏览器指定请求的URL,最后被重写的URL如果是重定向,则送交浏览器做再 一次请求;如果是代理则把重写后的URL交给代理模块请求最终的内容(Content),最后把内容送回给浏览器。

五、何时使 用.htaccess中的重写规则定义

—- 假如您对网站内容所在的服务器没有管理员权限,或者您的网站内容放在ISP的服务器上托管,无法改写主配置文件,但是您对Web站点内容所在的目录有写权 限,则可以设置自己的.htaccess文件达到同样的目的。但您需要确定主配置文件中对您的网站所在的目录定义了下面的内容,否则您 的.htaccess不会工作。

—- < Directory /usr/local/apache/htdocs/www.abc.com> options indexes followsymLinks
—- allowoverride all
—- < /Directory >

六、应用举例

—- 假定Apache被编译安装在主机192.168.1.56的/usr/local/apache目录下面,同时编译了重写和代理模块。

—- 1.隐藏Apache下的某个目录,使得对该目录的任何请求都重定向到另一个文件
—- (1)httpd.conf的实现方法
—- 我们将下面的部分放到/usr/local/apache/conf/httpd.conf中。

—- < Directory “/usr/local/apache/htdocs/manual/”> options Indexes followsymlinks
—- allowoverride all
—- rewriteengine on
—- rewritebase /
—- rewriterule ^(.*)$ index.html.en [R=301]
—- < /Directory >

—- 注: “rewriteengine on”为重写引擎开关,如果设为“off”,则任何重写规则定义将不被应用,该开关的另一用处就是如果为了临时去掉重写规则,可以将引擎开关设为 “off”再重新启动Apache即可,不必将其中的各条重写规则注释掉。

—- “rewritebase /”的作用是如果在下面的rewriterule定义中被重写后的部分(此处为文件名index.html.en)前面没有“/”,则表明是相对目录,相 对于这个rewritebase后面的定义也就是/usr/local/apache/htdocs/index.html.en,否则,如果此处没有 “rewritebase /”这一项,则被重写成http://192.168.1.56/usr/local/apache/htdocs/manual /index.html.en,显然是不正确的。

—- 我们也可以不用“rewritebase /”,而是将其改为如下部分。
—- rewriteengine on
—- rewriterule ^(.*)$ /index.html.en [R=301]
—- 或者更改为:
—- rewriteengine on
—- rewriterule ^(.*)$ http://192.168.1.56/index.html.en [R=301]

—- (2).htaccess的实现方法
—- 我们将下面的部分放到httpd.conf中。

—- < Directory “/usr/local/apache/htdocs/manual/”> options Indexes followsymlinks
—- allowoverride all
—- < /Directory >

—- 然后将下面的部分放到/usr/local/apache/htdocs/manual/.htaccess中。
—- rewriteengine on
—- rewritebase /
—- rewriterule ^(.*)$ index.html.en [R=301]

—- 注: 对文件.htaccess所做的任何改动不需要重启动Apache。

—- 您还可以利用.htaccess方案将这个manual目录重定向到用户jephe自己的主目录。
—- rewriteengine on
—- rewritebase /~jephe/
—- rewriterule ^(.*)$ $1 [R=301]

—- 这样,对manual目录下任何文件的请求被重定向到~jephe目录下相同文件的请求。

—- 2.将http://www.username.domain.com对于username的主页请求转换为对http: //www.domain.com/username的请求
—- 对于HTTP/1.1的请求包括一个Host: HTTP头,我们能用下面的规则集重写http://www.username.domain .com/anypath到/home/username/anypath。
—- rewriteengine on
—- rewritecond %{HTTP_HOST} ^www.[^.]+.host.com$
—- rewriterule ^(.+) %{HTTP_HOST}$1 [C]
—- rewriterule ^www.([^.]+).host.com(.*) /home/$1$2

—- 注: “rewritecond”表明是条件重写规则,当满足后面定义的条件后才会应用下面的重写规则,“rewritecond”有各种变量,请查阅相关文 档。

—- 3.防火墙上的重写规则代理内部网段上服务器的请求
—- NameVirtualhost 1.2.3.4
—- < Virtualhost 1.2.3.4:80 > servername www.domain.com
—- rewriteengine on
—- proxyrequest on
—- rewriterule ^/(.*)$ http://192.168.1.3/$1 [P,L]
—- < /Virtualhost >

—- 注: 当外部浏览器请求http://www.domain.com时,将被解析到IP地址1.2.3.4,Apache交由mod_rewrite处理,转换 成http://192.168.1.3/$1后再交由代理模块mod_proxy,得到内容后传送回用户的浏览器。

—- 4.基本预先设定的转换Map表进行重写rewritemap
—- 转换http://www.domain.com/{countrycode}/anypath到Map表中规定的URL,前面是虚拟主机中的定义。
—- rewritelog /usr/local/apache/logs/rewrite.log
—- rewriteloglevel 9
—- rewriteengine on
—- proxyrequest on
—- rewritemap sitemap txt:/usr/local/apache/conf/rewrite.map
—- rewriterule ^/([^/]+)+/(.*)$ http://%{REMOTE_HOST}::$1 [C]
—- rewriterule (.*):[a-z]+)$ ${sitemap:$2|http://h.i.j.k/} [R=301,L]
—- 文件/usr/local/apache/conf/rewrite.map的内容如下:
—- sg http://a.b.c.d/
—- sh http://e.f.g.h/

—- 注: 当用户请求http://www.domain.com/sg/anypath时被重写为http://a.b.c.d/anypath。当需要调试时请 用rewritelog和 rewriteloglevel 9联合,9为最大,即得到最多的调试信息;最小为1,表示得到最少的调试信息;默认为0,表示没有调试信息。

—- sitemap的语法是${sitemap: LookupKey | Defaultvalue},有些书上把$写成了%是错误的。 {tag_ 点击标签样式三}