织梦dedecms 采集节点 一个通用过滤规则过滤内容规则 适用于大部分网站采集过滤

 andlly   2018-07-03 08:14   113 人阅读  0 条评论
{dede:trim replace=""}<a([^>]*)(.*)>{/dede:trim}
{dede:trim replace=""}</a>{/dede:trim}
{dede:trim replace=""}<span(.*)>{/dede:trim}
{dede:trim replace=""}</span>{/dede:trim}
{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace=""}<!--(.*)-->{/dede:trim}
{dede:trim replace=""}<table([^>]*)>(.*)</table>{/dede:trim}
{dede:trim replace=""}<style([^>]*)>(.*)</style>{/dede:trim}
{dede:trim replace=""}<object([^>]*)>(.*)</object>{/dede:trim}
{dede:trim replace=""}<embed([^>]*)>(.*)</embed>{/dede:trim}
{dede:trim replace=""}<param([^>]*)>(.*)</param>{/dede:trim}
{dede:trim replace=""}<div([^.]*)>{/dede:trim}
{dede:trim replace=""}</div>{/dede:trim}

一般通用处理  (.*) 等同于火车头采集 *


替换


{dede:trim replace=湖北教育网}www.2021edu.com{/dede:trim}

说明:

将 www.2021edu.com 

替换成

湖北教育网


{dede:trim replace=}<h3>{/dede:trim}

<h3> 替换成空白


本文地址:http://10tf.com/post/24.html
版权声明:本文为原创文章,版权归 andlly 所有,欢迎分享本文,转载请保留出处!

 发表评论


表情

还没有留言,还不快点抢沙发?