名站网址导航为大驾家提供DedeCMS站点程序站点教程相关的知识,比如织梦程序安装教程,织梦程序系统故障等教程。
织梦程序dedecms网站程序的过滤规则写起来不是很难,规则如下:
相关具体代码如下示例:
{dede:trim}要过滤的网站内容{/dede:trim}
如果要过滤的网站内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。
以下是一些过滤规则的例子,供大驾家参考。
1、采集中去除网站内容里的超链接:
相关具体代码如下示例:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
假如要将所有超链接网站内容都去除,规则是:
相关具体代码如下示例:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
这两个规则的不同通过下面相关具体代码如下来解释
例如文章相关具体代码如下中包含着如下网站内容:
<a href="#">超链接</a>
通过第一个规则,采集结果是:超链接
2、过滤广告
对于广告来说,过滤规则就得针对html中看到的网站内容使用规则了,例如某些广告仅仅是引用某个JS网站文件,例如
相关具体代码如下示例:
<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>
这样的规则只需
相关具体代码如下示例:
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}
如果某些广告的网站内容是JS相关具体代码如下写在<script></script>区间里的,例如GG的广告,那么过滤规则应该是:
相关具体代码如下示例:
{dede:trim}<script>(.*)</script>{/dede:trim}
3、一些测试过的过滤规则
相关具体代码如下示例:
{dede:trim}<!–(.*)–>{/dede:trim} {dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim} {dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim} {dede:trim}<select([^>]*)>{/dede:trim} {dede:trim}</select>{/dede:trim} {dede:trim}<param([^>]*)>{/dede:trim} {dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim} {dede:trim}<embed([^>]*)>{/dede:trim} {dede:trim}</embed>{/dede:trim} {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim} {dede:trim}<object([^>]*)>{/dede:trim} {dede:trim}</object>{/dede:trim} {dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim} {dede:trim}<OBJECT([^>]*)>{/dede:trim} {dede:trim}</OBJECT>{/dede:trim} {dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim} {dede:trim}<iframe([^>]*)>{/dede:trim} //by www.mzdh.net// {dede:trim}</iframe>{/dede:trim} {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim} {dede:trim}<IFRAME([^>]*)>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim} {dede:trim}<font([^>]*)>{/dede:trim} {dede:trim}</font>{/dede:trim} {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim} {dede:trim}<a([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim} {dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim} {dede:trim}<td([^>]*)>{/dede:trim} {dede:trim}</td>{/dede:trim} {dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim} {dede:trim}<tr([^>]*)>{/dede:trim} {dede:trim}</tr>{/dede:trim} {dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim} {dede:trim}<tbody>{/dede:trim} {dede:trim}</tbody>{/dede:trim} // 网站内容来自www.mzdh.net// {dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim} {dede:trim}<table([^>]*)>{/dede:trim} {dede:trim}</table>{/dede:trim} {dede:trim}<span([^>]*)>{/dede:trim} {dede:trim}</span>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<script>(.*)</script>{/dede:trim} {dede:trim}<script(.*)>{/dede:trim} {dede:trim}</script>{/dede:trim} |
关于DedeCMS站点程序站点教程相关的知识,就说到这里了希望能帮助朋友们。织梦程序自带采集器的高阶技巧