PHP过滤器的实现方法
作者:
要想在PHP中实现一个类似过滤器的功能,因为我的需求是这样的,有个开发好了的OA系统,要集成到我们的应用中,OA要对外来的数据进行过滤,在给自己处理。
PHP 过滤器用于验证和过滤来自非安全来源的数据,比如用户的输入。
什么是 PHP 过滤器?
PHP 过滤器用于验证和过滤来自非安全来源的数据。
验证和过滤用户输入或自定义数据是任何 Web 应用程序的重要组成部分。
设计 PHP 的过滤器扩展的目的是使数据过滤更轻松快捷。
为什么使用过滤器?
几乎所有 web 应用程序都依赖外部的输入。这些数据通常来自用户或其他应用程序(比如 web 服务)。通过使用过滤器,您能够确保应有程序获得正确的输入类型。
您应该始终对外部数据进行过滤!
输入过滤是最重要的应用程序安全课题之一。
什么是外部数据?
来自表单的输入数据
Cookies
服务器变量
数据库查询结果
函数和过滤器
如需过滤变量,请使用下面的过滤器函数之一:
filter_var() - 通过一个指定的过滤器来过滤单一的变量
filter_var_array() - 通过相同的或不同的过滤器来过滤多个变量
filter_input - 获取一个输入变量,并对它进行过滤
filter_input_array - 获取多个输入变量,并通过相同的或不同的过滤器对它们进行过滤
在下面的例子中,我们用 filter_var() 函数验证了一个整数:
<?php
$int = 123;
if(!filter_var($int, FILTER_VALIDATE_INT))
{
echo("Integer is not valid");
}
else
{
echo("Integer is valid");
}
?>
上面的代码使用了 "FILTER_VALIDATE_INT" 过滤器来过滤变量。由于这个整数是合法的,因此代码的输出是:"Integer is valid"。
假如我们尝试使用一个非整数的变量,则输出是:"Integer is not valid"。
如需完整的函数和过滤器列表,请访问我们的 PHP Filter 参考手册。
Validating 和 Sanitizing
有两种过滤器:
Validating 过滤器:
用于验证用户输入
严格的格式规则(比如 URL 或 E-Mail 验证)
返回若成功预期的类型,否则返回 FALSE
Sanitizing 过滤器:
用于允许或禁止字符串中指定的字符
无数据格式规则
始终返回字符串
选项和标志
选项和标志用于向指定的过滤器添加额外的过滤选项。
不同的过滤器有不同的选项和标志。
在下面的例子中,我们用 filter_var() 和 "min_range" 以及 "max_range" 选项验证了一个整数:
<?php
$var=300;
$int_options = array(
"options"=>array
(
"min_range"=>0,
"max_range"=>256
)
);
if(!filter_var($var, FILTER_VALIDATE_INT, $int_options))
{
echo("Integer is not valid");
}
else
{
echo("Integer is valid");
}
?>
就像上面的代码一样,选项必须放入一个名为 "options" 的相关数组中。如果使用标志,则不需在数组内。
由于整数是 "300",它不在指定的氛围内,以上代码的输出将是 "Integer is not valid"。
如需完整的函数及过滤器列表,请访问 W3School 提供的 PHP Filter 参考手册。您可以看到每个过滤器的可用选项和标志。
验证输入
让我们试着验证来自表单的输入。
我们需要作的第一件事情是确认是否存在我们正在查找的输入数据。
然后我们用 filter_input() 函数过滤输入的数据。
在下面的例子中,输入变量 "email" 被传到 PHP 页面:
<?php
if(!filter_has_var(INPUT_GET, "email"))
{
echo("Input type does not exist");
}
else
{
if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL))
{
echo "E-Mail is not valid";
}
else
{
echo "E-Mail is valid";
}
}
?>
例子解释:
上面的例子有一个通过 "GET" 方法传送的输入变量 (email):
检测是否存在 "GET" 类型的 "email" 输入变量
如果存在输入变量,检测它是否是有效的邮件地址
净化输入
让我们试着清理一下从表单传来的 URL。
首先,我们要确认是否存在我们正在查找的输入数据。
然后,我们用 filter_input() 函数来净化输入数据。
在下面的例子中,输入变量 "url" 被传到 PHP 页面:
<?php
if(!filter_has_var(INPUT_POST, "url"))
{
echo("Input type does not exist");
}
else
{
$url = filter_input(INPUT_POST,
"url", FILTER_SANITIZE_URL);
}
?>
例子解释:
上面的例子有一个通过 "POST" 方法传送的输入变量 (url):
检测是否存在 "POST" 类型的 "url" 输入变量
如果存在此输入变量,对其进行净化(删除非法字符),并将其存储在 $url 变量中
假如输入变量类似这样:"http://www.W3#$%S^%$#ool.com.cn/",则净化后的 $url 变量应该是这样的:
http://www.W3School.com.cn/过滤多个输入
表单通常由多个输入字段组成。为了避免对 filter_var 或 filter_input 重复调用,我们可以使用 filter_var_array 或 the filter_input_array 函数。
在本例中,我们使用 filter_input_array() 函数来过滤三个 GET 变量。接收到的 GET 变量是一个名称、一个年龄以及一个邮件地址:
<?php
$filters = array
(
"name" => array
(
"filter"=>FILTER_SANITIZE_STRING
),
"age" => array
(
"filter"=>FILTER_VALIDATE_INT,
"options"=>array
(
"min_range"=>1,
"max_range"=>120
)
),
"email"=> FILTER_VALIDATE_EMAIL,
);
$result = filter_input_array(INPUT_GET, $filters);
if (!$result["age"])
{
echo("Age must be a number between 1 and 120.<br />");
}
elseif(!$result["email"])
{
echo("E-Mail is not valid.<br />");
}
else
{
echo("User input is valid");
}
?>
例子解释:
上面的例子有三个通过 "GET" 方法传送的输入变量 (name, age and email)
设置一个数组,其中包含了输入变量的名称,以及用于指定的输入变量的过滤器
调用 filter_input_array 函数,参数包括 GET 输入变量及刚才设置的数组
检测 $result 变量中的 "age" 和 "email" 变量是否有非法的输入。(如果存在非法输入,)
filter_input_array() 函数的第二个参数可以是数组或单一过滤器的 ID。
如果该参数是单一过滤器的 ID,那么这个指定的过滤器会过滤输入数组中所有的值。
如果该参数是一个数组,那么此数组必须遵循下面的规则:
必须是一个关联数组,其中包含的输入变量是数组的键(比如 "age" 输入变量)
此数组的值必须是过滤器的 ID ,或者是规定了过滤器、标志以及选项的数组
使用 Filter Callback
通过使用 FILTER_CALLBACK 过滤器,可以调用自定义的函数,把它作为一个过滤器来使用。这样,我们就拥有了数据过滤的完全控制权。
您可以创建自己的自定义函数,也可以使用已有的 PHP 函数。
规定您准备用到过滤器的函数,与规定选项的方法相同。
在下面的例子中,我们使用了一个自定义的函数把所有 "_" 转换为空格:
<?php
function convertSpace($string)
{
return str_replace("_", " ", $string);
}
$string = "Peter_is_a_great_guy!";
echo filter_var($string, FILTER_CALLBACK,
array("options"=>"convertSpace"));
?>
以上代码的结果是这样的:
Peter is a great guy!例子解释:
上面的例子把所有 "_" 转换成空格:
创建一个把 "_" 替换为空格的函数
调用 filter_var() 函数,它的参数是 FILTER_CALLBACK 过滤器以及包含我们的函数的数组
在java中实现过滤器,很简单,只需要在web.xml中配置如:
<filter>
<filter-name>iSpaceAuth</filter-name>
<filter-class>
com.skylark.console.servlet.ISpaceLoginFilter
</filter-class>
</filter>
<filter-mapping>
<filter-name>iSpaceAuth</filter-name>
<url-pattern>/console/*</url-pattern>
</filter-mapping>
要想在PHP中实现一个类似的功能,因为我的需求是这样的,有个开发好了的OA系统,要集成到我们的应用中,OA要对外来的数据进行过滤,在给自己处理。这样就等于我必须写一个Php文件进行过滤,然后OA系统的文件都必须include该文件。这多恐怖,要重复的改好多代码,而且,代码的耦合度相当的高。
查找PHP手册发现了有一些过滤的东西,
一、过滤函数
filter_has_var — Checks if variable of specified type exists 检查变量是否是指定的类型
filter_id — Returns the filter ID belonging to a named filter 通过过滤器名得到过滤器的ID
filter_input_array — Gets external variables and optionally filters them
filter_input — Gets a specific external variable by name and optionally filters it
filter_list — Returns a list of all supported filters 返回支持的过滤器列表
filter_var_array — Gets multiple variables and optionally filters them 得到多个变量的值,每个变量选择一个过滤器
filter_var — Filters a variable with a specified filter 用指定的过滤器过滤变量
以前没使用过这个东东,今天试用下。
<?php
function convertSpace($string){
return str_replace("_", " ", $string);
}
$string = "Peter_is_a_great_guy!";
echo filter_var($string, FILTER_CALLBACK,array("options"=>"convertSpace"));
?>
会输出 Peter is a great guy!
发现PHP提供的过滤器只是对输入数据的过滤。不能像java一样,对整个项目访问进行过滤。java的过
滤器还能指定过滤规则。看到这个规则让我想起了apache有个rewrite_rules的模块。让所有的访问都
重定向到一个文件,那个文件就相当于一个过滤器了。我个那个文件取名filter
RewriteEngine on
RewriteCond %{HTTP_HOST} ^(.*)host [NC]
RewriteRule ^(.*) filter.php
虽然这样是可以实现。但是文件的组织方式必须是有规则的,就像单入口访问一样的。通过在filter.php通过new一个访问对象,
调用一个方法来访问页面。
单入口的代码
<?php
require_once './config.php';
$act = isset($_REQUEST['act']) ? trim($_REQUEST['act']) : 'index';
$ctl = isset($_REQUEST['ctl']) ? trim($_REQUEST['ctl']) : 'default';
$ctl = strtolower($ctl);
$act = strtolower($act);
require_once ROOTPATH.'/'.'lib'.'/controller/'.$ctl.'.php';
$ctl = ucfirst($ctl).'Controller';
$act = $act.'Action';
$app = new $ctl($act);
但是该OA实现的不是单入口访问。这样的话访问的页面就一直是filter.php跳转之后又跳回来了。
最后在发现在PHP的配置文件php.ini中可以配置 auto_prepend_file,该值的作用是在每个文件访问
之前include该文件。这样include的文件就相当一个过滤器了。哈哈!该配置文件要重启服务啊,有点
郁闷,那有没有改了之后不用重启服务的方法呢?当然有了,那就是采用.htaccess文件了。配置如
下。
RewriteEngine on
php_value auto_prepend_file "D:/web/htdocs/demo1/filter.php" 不过这样有个缺点就是,当访问量大的时候,性能会受到影响。而直接在php.ini文件中改得花就不用 会了。还有个优点就是如果把.htaccess文件某个目录,只对该目录有效。那么在web目录下不是所有 的项目都会添加该文件。 下面我们来测试下。我建个项目叫demo该项目下的文件有
index.php
echo "index.php \n";
filter.php
代码
<?php
echo 'filter'."\n";
$fileName = pathinfo($_SERVER['SCRIPT_FILENAME']);
if($fileName['filename'] == 'index')
{
header("location:".'./test.php');
}
test.php
<?php
echo 'test';
?>
我们在url 中输入 http://localhost/demo/index.php
结果是:filter test
虽然实现了但是还是java的相差太多了.java的过滤器可以实现多个,这个就不行了。还可以指定哪些访问要过滤,这个就不行了。
附:
1、apache rewrite模块的启用方法。
在http.conf文件中找到LoadModule rewrite_module modules/mod_rewrite.so把前面的# 删除。
什么是 PHP 过滤器?
PHP 过滤器用于验证和过滤来自非安全来源的数据。
验证和过滤用户输入或自定义数据是任何 Web 应用程序的重要组成部分。
设计 PHP 的过滤器扩展的目的是使数据过滤更轻松快捷。
为什么使用过滤器?
几乎所有 web 应用程序都依赖外部的输入。这些数据通常来自用户或其他应用程序(比如 web 服务)。通过使用过滤器,您能够确保应有程序获得正确的输入类型。
您应该始终对外部数据进行过滤!
输入过滤是最重要的应用程序安全课题之一。
什么是外部数据?
来自表单的输入数据
Cookies
服务器变量
数据库查询结果
函数和过滤器
如需过滤变量,请使用下面的过滤器函数之一:
filter_var() - 通过一个指定的过滤器来过滤单一的变量
filter_var_array() - 通过相同的或不同的过滤器来过滤多个变量
filter_input - 获取一个输入变量,并对它进行过滤
filter_input_array - 获取多个输入变量,并通过相同的或不同的过滤器对它们进行过滤
在下面的例子中,我们用 filter_var() 函数验证了一个整数:
复制代码 代码如下:
<?php
$int = 123;
if(!filter_var($int, FILTER_VALIDATE_INT))
{
echo("Integer is not valid");
}
else
{
echo("Integer is valid");
}
?>
上面的代码使用了 "FILTER_VALIDATE_INT" 过滤器来过滤变量。由于这个整数是合法的,因此代码的输出是:"Integer is valid"。
假如我们尝试使用一个非整数的变量,则输出是:"Integer is not valid"。
如需完整的函数和过滤器列表,请访问我们的 PHP Filter 参考手册。
Validating 和 Sanitizing
有两种过滤器:
Validating 过滤器:
用于验证用户输入
严格的格式规则(比如 URL 或 E-Mail 验证)
返回若成功预期的类型,否则返回 FALSE
Sanitizing 过滤器:
用于允许或禁止字符串中指定的字符
无数据格式规则
始终返回字符串
选项和标志
选项和标志用于向指定的过滤器添加额外的过滤选项。
不同的过滤器有不同的选项和标志。
在下面的例子中,我们用 filter_var() 和 "min_range" 以及 "max_range" 选项验证了一个整数:
复制代码 代码如下:
<?php
$var=300;
$int_options = array(
"options"=>array
(
"min_range"=>0,
"max_range"=>256
)
);
if(!filter_var($var, FILTER_VALIDATE_INT, $int_options))
{
echo("Integer is not valid");
}
else
{
echo("Integer is valid");
}
?>
就像上面的代码一样,选项必须放入一个名为 "options" 的相关数组中。如果使用标志,则不需在数组内。
由于整数是 "300",它不在指定的氛围内,以上代码的输出将是 "Integer is not valid"。
如需完整的函数及过滤器列表,请访问 W3School 提供的 PHP Filter 参考手册。您可以看到每个过滤器的可用选项和标志。
验证输入
让我们试着验证来自表单的输入。
我们需要作的第一件事情是确认是否存在我们正在查找的输入数据。
然后我们用 filter_input() 函数过滤输入的数据。
在下面的例子中,输入变量 "email" 被传到 PHP 页面:
复制代码 代码如下:
<?php
if(!filter_has_var(INPUT_GET, "email"))
{
echo("Input type does not exist");
}
else
{
if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL))
{
echo "E-Mail is not valid";
}
else
{
echo "E-Mail is valid";
}
}
?>
例子解释:
上面的例子有一个通过 "GET" 方法传送的输入变量 (email):
检测是否存在 "GET" 类型的 "email" 输入变量
如果存在输入变量,检测它是否是有效的邮件地址
净化输入
让我们试着清理一下从表单传来的 URL。
首先,我们要确认是否存在我们正在查找的输入数据。
然后,我们用 filter_input() 函数来净化输入数据。
在下面的例子中,输入变量 "url" 被传到 PHP 页面:
复制代码 代码如下:
<?php
if(!filter_has_var(INPUT_POST, "url"))
{
echo("Input type does not exist");
}
else
{
$url = filter_input(INPUT_POST,
"url", FILTER_SANITIZE_URL);
}
?>
例子解释:
上面的例子有一个通过 "POST" 方法传送的输入变量 (url):
检测是否存在 "POST" 类型的 "url" 输入变量
如果存在此输入变量,对其进行净化(删除非法字符),并将其存储在 $url 变量中
假如输入变量类似这样:"http://www.W3#$%S^%$#ool.com.cn/",则净化后的 $url 变量应该是这样的:
http://www.W3School.com.cn/过滤多个输入
表单通常由多个输入字段组成。为了避免对 filter_var 或 filter_input 重复调用,我们可以使用 filter_var_array 或 the filter_input_array 函数。
在本例中,我们使用 filter_input_array() 函数来过滤三个 GET 变量。接收到的 GET 变量是一个名称、一个年龄以及一个邮件地址:
复制代码 代码如下:
<?php
$filters = array
(
"name" => array
(
"filter"=>FILTER_SANITIZE_STRING
),
"age" => array
(
"filter"=>FILTER_VALIDATE_INT,
"options"=>array
(
"min_range"=>1,
"max_range"=>120
)
),
"email"=> FILTER_VALIDATE_EMAIL,
);
$result = filter_input_array(INPUT_GET, $filters);
if (!$result["age"])
{
echo("Age must be a number between 1 and 120.<br />");
}
elseif(!$result["email"])
{
echo("E-Mail is not valid.<br />");
}
else
{
echo("User input is valid");
}
?>
例子解释:
上面的例子有三个通过 "GET" 方法传送的输入变量 (name, age and email)
设置一个数组,其中包含了输入变量的名称,以及用于指定的输入变量的过滤器
调用 filter_input_array 函数,参数包括 GET 输入变量及刚才设置的数组
检测 $result 变量中的 "age" 和 "email" 变量是否有非法的输入。(如果存在非法输入,)
filter_input_array() 函数的第二个参数可以是数组或单一过滤器的 ID。
如果该参数是单一过滤器的 ID,那么这个指定的过滤器会过滤输入数组中所有的值。
如果该参数是一个数组,那么此数组必须遵循下面的规则:
必须是一个关联数组,其中包含的输入变量是数组的键(比如 "age" 输入变量)
此数组的值必须是过滤器的 ID ,或者是规定了过滤器、标志以及选项的数组
使用 Filter Callback
通过使用 FILTER_CALLBACK 过滤器,可以调用自定义的函数,把它作为一个过滤器来使用。这样,我们就拥有了数据过滤的完全控制权。
您可以创建自己的自定义函数,也可以使用已有的 PHP 函数。
规定您准备用到过滤器的函数,与规定选项的方法相同。
在下面的例子中,我们使用了一个自定义的函数把所有 "_" 转换为空格:
复制代码 代码如下:
<?php
function convertSpace($string)
{
return str_replace("_", " ", $string);
}
$string = "Peter_is_a_great_guy!";
echo filter_var($string, FILTER_CALLBACK,
array("options"=>"convertSpace"));
?>
以上代码的结果是这样的:
Peter is a great guy!例子解释:
上面的例子把所有 "_" 转换成空格:
创建一个把 "_" 替换为空格的函数
调用 filter_var() 函数,它的参数是 FILTER_CALLBACK 过滤器以及包含我们的函数的数组
在java中实现过滤器,很简单,只需要在web.xml中配置如:
<filter>
<filter-name>iSpaceAuth</filter-name>
<filter-class>
com.skylark.console.servlet.ISpaceLoginFilter
</filter-class>
</filter>
<filter-mapping>
<filter-name>iSpaceAuth</filter-name>
<url-pattern>/console/*</url-pattern>
</filter-mapping>
要想在PHP中实现一个类似的功能,因为我的需求是这样的,有个开发好了的OA系统,要集成到我们的应用中,OA要对外来的数据进行过滤,在给自己处理。这样就等于我必须写一个Php文件进行过滤,然后OA系统的文件都必须include该文件。这多恐怖,要重复的改好多代码,而且,代码的耦合度相当的高。
查找PHP手册发现了有一些过滤的东西,
一、过滤函数
filter_has_var — Checks if variable of specified type exists 检查变量是否是指定的类型
filter_id — Returns the filter ID belonging to a named filter 通过过滤器名得到过滤器的ID
filter_input_array — Gets external variables and optionally filters them
filter_input — Gets a specific external variable by name and optionally filters it
filter_list — Returns a list of all supported filters 返回支持的过滤器列表
filter_var_array — Gets multiple variables and optionally filters them 得到多个变量的值,每个变量选择一个过滤器
filter_var — Filters a variable with a specified filter 用指定的过滤器过滤变量
以前没使用过这个东东,今天试用下。
<?php
function convertSpace($string){
return str_replace("_", " ", $string);
}
$string = "Peter_is_a_great_guy!";
echo filter_var($string, FILTER_CALLBACK,array("options"=>"convertSpace"));
?>
会输出 Peter is a great guy!
发现PHP提供的过滤器只是对输入数据的过滤。不能像java一样,对整个项目访问进行过滤。java的过
滤器还能指定过滤规则。看到这个规则让我想起了apache有个rewrite_rules的模块。让所有的访问都
重定向到一个文件,那个文件就相当于一个过滤器了。我个那个文件取名filter
RewriteEngine on
RewriteCond %{HTTP_HOST} ^(.*)host [NC]
RewriteRule ^(.*) filter.php
虽然这样是可以实现。但是文件的组织方式必须是有规则的,就像单入口访问一样的。通过在filter.php通过new一个访问对象,
调用一个方法来访问页面。
单入口的代码
复制代码 代码如下:
<?php
require_once './config.php';
$act = isset($_REQUEST['act']) ? trim($_REQUEST['act']) : 'index';
$ctl = isset($_REQUEST['ctl']) ? trim($_REQUEST['ctl']) : 'default';
$ctl = strtolower($ctl);
$act = strtolower($act);
require_once ROOTPATH.'/'.'lib'.'/controller/'.$ctl.'.php';
$ctl = ucfirst($ctl).'Controller';
$act = $act.'Action';
$app = new $ctl($act);
但是该OA实现的不是单入口访问。这样的话访问的页面就一直是filter.php跳转之后又跳回来了。
最后在发现在PHP的配置文件php.ini中可以配置 auto_prepend_file,该值的作用是在每个文件访问
之前include该文件。这样include的文件就相当一个过滤器了。哈哈!该配置文件要重启服务啊,有点
郁闷,那有没有改了之后不用重启服务的方法呢?当然有了,那就是采用.htaccess文件了。配置如
下。
RewriteEngine on
php_value auto_prepend_file "D:/web/htdocs/demo1/filter.php" 不过这样有个缺点就是,当访问量大的时候,性能会受到影响。而直接在php.ini文件中改得花就不用 会了。还有个优点就是如果把.htaccess文件某个目录,只对该目录有效。那么在web目录下不是所有 的项目都会添加该文件。 下面我们来测试下。我建个项目叫demo该项目下的文件有
index.php
复制代码 代码如下:
echo "index.php \n";
filter.php
代码
复制代码 代码如下:
<?php
echo 'filter'."\n";
$fileName = pathinfo($_SERVER['SCRIPT_FILENAME']);
if($fileName['filename'] == 'index')
{
header("location:".'./test.php');
}
test.php
复制代码 代码如下:
<?php
echo 'test';
?>
我们在url 中输入 http://localhost/demo/index.php
结果是:filter test
虽然实现了但是还是java的相差太多了.java的过滤器可以实现多个,这个就不行了。还可以指定哪些访问要过滤,这个就不行了。
附:
1、apache rewrite模块的启用方法。
在http.conf文件中找到LoadModule rewrite_module modules/mod_rewrite.so把前面的# 删除。