[返回目录](index.html)#### [常见问题](changjian_index.html) —— [采集过滤规则无效](cj_caijiguolv.html "test")
```
<pre class="brush:xml">
在采集的使用中我们为采集项,设置了过滤项后,有的时候会出现无效的情况。也就是采集出来的结果并没有按我们的想像的把过滤项给删除了。这是为什么呢?
<em class="calibre18">如下面的一个例子,我们在过滤项中进行如下的设置:</em>
```
```
<pre class="brush:xml">
../down.php?uri=[|]
```
他的意思是要把“../down.php?uri=”给过滤掉。可采集出来的结果很不近人意。并没有把这个字符串给过滤掉。这是为什么呢? PHPCMS V9的采集过滤项,使用的是正则表达式匹配过滤。在我们的上面所设置的过滤项中出现了一些正则表达式的特殊符号。当我把过滤规则修改为: ```
<pre class="brush:xml">
\.\./down\.php\?uri=[|]
```
过滤项生效了。这里要给大家说明的一个问题就是,正则表达式中的特殊字符只要在它的前面加一个反斜线(\),他的意思就是表示为符号本身了,不再是正则表达式中的有特殊意义的字符了。 那么正则表达式里面又有哪些需要注意的特殊符号呢?如下表所示,这些符号如果我们要匹配他们的时候都需要在他们的前面添加反斜线。 字符说明^匹配输入字符串的开始位置。要匹配 "^" 字符本身,请使用 "\\^"$匹配输入字符串的结尾位置。要匹配 "$" 字符本身,请使用 "\\$"( )标记一个子表达式的开始和结束位置。要匹配小括号,请使用 "\\(" 和 "\\)"\[ \]用来自定义能够匹配 '多种字符' 的表达式。要匹配中括号,请使用 "\\\[" 和 "\\\]"{ }修饰匹配次数的符号。要匹配大括号,请使用 "\\{" 和 "\\}".匹配除了换行符(\\n)以外的任意一个字符。要匹配小数点本身,请使用 "\\."?修饰匹配次数为 0 次或 1 次。要匹配 "?" 字符本身,请使用 "\\?"+修饰匹配次数为至少 1 次。要匹配 "+" 字符本身,请使用 "\\+"\*修饰匹配次数为 0 次或任意次。要匹配 "\*" 字符本身,请使用 "\\\*"|左右两边表达式之间 "或" 关系。匹配 "|" 本身,请使用 "\\|"
[返回目录](index.html) 上海盛大网络发展有限公司 c 2006 - 2011 B2-20040053.
问题和建议请反馈至:http://bbs.phpcms.cn
- 首页
- 简介
- PHPCMS v9 安装环境要求
- 安装
- Linux 环境搭建推荐教程
- Windows 环境搭建推荐教程
- CentOS5下Nginx 环境推荐教程
- PC_webserver 安装说明
- PHPCMS V9 安装说明
- 使用
- 后台主界面
- 我的面板
- 修改个人信息
- 修改密码
- 生成首页
- 设置
- 相关设置
- 站点管理
- 发布点管理
- 基本设置
- 安全配置
- PHPSSO配置
- 邮箱配置
- connect
- 管理员设置
- 管理员管理
- 角色管理
- 模块
- 模块管理
- 模块管理
- 在线充值
- 短信平台
- 物流管理
- 外部数据导入
- 点评
- 表单向导
- 手机门户
- 广告
- 新闻心情
- 短消息
- 投票
- 友情链接
- 评论
- 公告
- 全站搜索
- 数据源
- 企业黄页
- 模块配置
- 分类管理
- 黄页模型管理
- 企业模板管理
- 信息管理
- 企业库管理
- 批量更新URL
- 内容
- 内容发布管理
- 管理内容
- 附件管理
- 专题
- 碎片管理
- 采集管理
- 评论管理
- 发布管理
- 批量更新栏目页
- 生成首页
- 批量更新URL
- 批量更新内容页
- 同步到发布点
- 内容相关设置
- 管理栏目
- 模型管理
- 类别管理
- 推荐位管理
- 用户
- 会员管理
- 会员管理
- 审核会员
- 会员模块配置
- 会员组管理
- 管理会员组
- 会员模型管理
- 管理会员模型
- 界面
- 模板风格
- 标签向导
- 扩展
- 附加字段管理
- 在线升级
- 信息模型设置
- 前台菜单管理
- 来源管理
- 木马查杀
- 更新全站缓存
- 后台操作日志
- 下载镜像管理
- IP禁止
- URL规则管理
- 数据库工具
- 菜单管理
- 敏感词管理
- Baibu/Google地图
- 关联链接
- 联动菜单
- 工作流
- phpsso
- 会员管理
- 应用管理
- 通信信息
- 积分兑换
- 管理员管理
- 系统设置
- 更新缓存
- 修改密码
- 应用
- 升级与转换
- 程序升级
- 离线升级
- 在线升级
- 程序转换
- phpcms2008 to v9
- phpcms2007 to v9
- DEDECMS 5.6 to v9
- 帝国cms 6.5 to v9
- PHP168 Sharp to v9
- 万能数据导入
- 整合文档
- 整合Discuz 7.0 - X1.5
- 整合Discuz X2
- 整合PHPWIND 8.7
- 标签使用
- PC标签使用说明
- PC标签保留参数
- 系统常量
- 功能模块
- 内容模块
- 评论模块
- 投票模块
- 公告模块
- 专题模块
- 会员模块
- 友情链接模块
- 黄页模块
- 工具箱
- json工具箱
- xml工具箱
- get标签
- 碎片工具箱
- 高级应用与部署
- Apache下Rewrite设置
- Sphinx全文索引教程
- Mysql开启全文索引
- Mysql优化
- 修改后台路径
- 数据库分离部署
- 万能字段应用
- 推荐位高级应用
- 主程序与web目录分离
- 第三方手册
- JQuery 手册
- artDialog 手册
- formValidator手册
- calendar手册
- CKEditor
- 二次开发
- 目录结构分析
- 数据库结构
- 二次开发流程
- 入口程序
- 系统类库与函数库调用
- 配置文件调用
- 函数扩展
- 控制器扩展技巧
- 常见问题
- 采集过滤规则无效
- 网站更换域名怎么办?
- 后台登陆提示验证码错误
- 应用间同步登陆问题
- 提示通信失败,用户登录失败
- 如何将静态文件生成到根目录
- 为什么添加的内容没有生成静态?