联系官方销售客服

1835022288

028-61286886

开发框架 版主:迅睿框架研发组
采集的文章内容中包含了很多的div标签,导致网页打开经常变形,可以一键更新吗
类型:迅睿CMS 更新时间:2022-03-04 11:06:39 百度编辑器

采集的文章内容中包含了很多的div标签,导致网页打开经常变形,有一键更新百度编辑器内容的地方吗?或者有在调用内容的时候,有函数可以过滤div吗

回帖
  • 小黄人 18html
    #1楼    小黄人 18html
    2022-03-03 20:40:13
    安卓手机 0
    火车头采集器就可以过滤啊
  • 仿站织梦转换特199
    #2楼    仿站织梦转换特199
    2022-03-03 20:41:00
    Chrome 0
    小黄人 18html 老早以前采集的,已经很久了,才发现。
  • Java
    #3楼    Java
    2022-03-03 20:49:55
    Chrome 0
    用内容维护工具进行批量替换。
  • 小黄人 18html
    #4楼    小黄人 18html
    2022-03-03 22:45:53
    Chrome 0
    $str=preg_replace("/\s+/", " ", $str); //过滤多余回车
    $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格)
     
    $str=preg_replace("/<\!--.*?-->/si","",$str); //注释
    $str=preg_replace("/<(\!.*?)>/si","",$str); //过滤DOCTYPE
    $str=preg_replace("/<(\/?html.*?)>/si","",$str); //过滤html标签
    $str=preg_replace("/<(\/?head.*?)>/si","",$str); //过滤head标签
    $str=preg_replace("/<(\/?meta.*?)>/si","",$str); //过滤meta标签
    $str=preg_replace("/<(\/?body.*?)>/si","",$str); //过滤body标签
    $str=preg_replace("/<(\/?link.*?)>/si","",$str); //过滤link标签
    $str=preg_replace("/<(\/?form.*?)>/si","",$str); //过滤form标签
    $str=preg_replace("/cookie/si","COOKIE",$str); //过滤COOKIE标签
     
    $str=preg_replace("/<(applet.*?)>(.*?)<(\/applet.*?)>/si","",$str); //过滤applet标签
    $str=preg_replace("/<(\/?applet.*?)>/si","",$str); //过滤applet标签
     
    $str=preg_replace("/<(style.*?)>(.*?)<(\/style.*?)>/si","",$str); //过滤style标签
    $str=preg_replace("/<(\/?style.*?)>/si","",$str); //过滤style标签
     
    $str=preg_replace("/<(title.*?)>(.*?)<(\/title.*?)>/si","",$str); //过滤title标签
    $str=preg_replace("/<(\/?title.*?)>/si","",$str); //过滤title标签
     
    $str=preg_replace("/<(object.*?)>(.*?)<(\/object.*?)>/si","",$str); //过滤object标签
    $str=preg_replace("/<(\/?objec.*?)>/si","",$str); //过滤object标签
     
    $str=preg_replace("/<(noframes.*?)>(.*?)<(\/noframes.*?)>/si","",$str); //过滤noframes标签
    $str=preg_replace("/<(\/?noframes.*?)>/si","",$str); //过滤noframes标签
     
    $str=preg_replace("/<(i?frame.*?)>(.*?)<(\/i?frame.*?)>/si","",$str); //过滤frame标签
    $str=preg_replace("/<(\/?i?frame.*?)>/si","",$str); //过滤frame标签
     
    $str=preg_replace("/<(script.*?)>(.*?)<(\/script.*?)>/si","",$str); //过滤script标签
    $str=preg_replace("/<(\/?script.*?)>/si","",$str); //过滤script标签
    $str=preg_replace("/javascript/si","Javascript",$str); //过滤script标签
    $str=preg_replace("/vbscript/si","Vbscript",$str); //过滤script标签
    $str=preg_replace("/on([a-z]+)\s*=/si","On\\1=",$str); //过滤script标签
    $str=preg_replace("/&#/si","&#",$str); //过滤script标签,如javAsCript:alert(
    满意答案
  • 仿站织梦转换特199
    #5楼    仿站织梦转换特199
    2022-03-04 11:06:39
    Chrome 0
    @小黄人 18html:用内容批量替换直接div换成p了