我们在采集内容的时候,比如有些网站img图片内容非常多或者是对方站点添加了密密麻麻的水印,这个时候我们就需要过滤掉,该如何来设置屏蔽掉呢,请看下面的教程。
登录蓝天采集器后台:任务----任务列表----选择对应任务
点击---获取内容字段----选择需要过滤的字段名---选择数据处理
选择:html标签过滤 (如下图设置)
选择需要过滤的img的参数内容,点击保存,这样我们采集回来的内容就会自动吧img的内容过滤掉,比如我们还可以手动添加,png.jpeg等。以上就是全部的操作教程,入还有不明白的地方欢迎下方留言。
相关知识点: img过滤- 1狂雨小说CMS安装搭建使用中常见问题汇总
- 2蓝天采集器采集中断、自动采集无效、图片下载不了,解决方法!
- 3七牛云加速域名开启https教程
- 4蓝天采集器希望指定网址允许重复采集或网址添加随机数功能!
- 5蓝天采集器蓝天采集器V1.3版本更新文档,升级必看!
- 6集团/公司品牌营销网站建设方案
- 7pbootcms蓝天采集器发布插件制作参数教程
- 8蓝天采集器求助-内容页网址获取- 测试时和实际采集时结果不同
- 9蓝天采集器这个网页怎么采集
- 10易优cms(eyoucms)蓝天采集器发布插件
- 11SEO站长每天需要做的9件事
- 12蓝天采集器请问怎么采集新浪的这段网址
- 13蓝天采集器exception 'Requests_Exception' with message 'cURL error 60: SSL certificate p...
- 14蓝天采集器json分类信息采集规则教程
- 15蓝天采集器群主希望能支持destoon7.0
- 16蜀戎网络温馨小提示今天大雪“进补”的好时节到了
- 17蓝天采集器请问一下 多级网址获取 应该怎么使用
- 18蓝天采集器列表页 分页如何设置
- 19蓝天采集器建议:下个版本能否开发将“发布设置”导入导出?
- 20PbootCMS升级时文件IndexController.php更新失败,请重试!解决办法
-
pbootcms升级到3.0.3+最···
pbootcms系统在升级3.0.3最新版本以后伪静态会出现问题,二级目录正常,所有的文章点击后跳转首页,用的宝塔nginx的环境,php版本5.6等,各种环境都有,都会出现这个情况,比如我测试的阿里云虚拟主机和服务器。今天呢蜀戎给大家讲解···
-
蓝天采集器chrome提取的xpat···
新手完全按照手册来的,自己尝试用后台的中国农业网新闻做测试,把原来的规则匹配改为chrome提取的xpath却一直抓不到数据,反倒是用chrome或xpathhelper插件匹配都是可以的,是规则写的不对么? 比如抓标题"http···
-
蓝天采集器如何简单只抓取列表页中的标···
在论坛看了半天,也没有系统针对初学者的教程。 打个比方啊:如果只想抓取一个列表页中的信息,比如列表标题。进入采集器后台把这个页面地址写入起始页,并把“设为内容网址”钩上,接下来就不知道怎么操作了,哪位大神给解释一下? 在获取内容里面添加···
-
蓝天采集器安装不了,啥情况
确定环境都符合要求并且数据库名等也填写正确 SQLSTATE[3D000]: Invalid catalog name: 1046 No database selected 没有选择数据库,截图数据安装界面看看 同样的情况,使用amh···
-
易优cms(eyoucms)蓝天采集···
插件下载:https://www.srso.cn/chajian/697.html采集入库对应字段:title:标题typeid:栏目IDis_head:属性 头条[h]、推荐[c]、特荐[a]、加粗[b]、跳转[j]、图片[p···