之前设置了补全网址,然后改了不补全网址了,但是还是自动补全了,用内容替换页去不掉网址,有人知道怎么回事吗?
嗯,这是个bug
暂时解决》内容替换:
- <a href="([^"]+)"
- <a href="填写域名$1"
我也遇到了,弄得我死去活来,各种检查也没搞定。原来真是bug啊
admin 发表于 2018-8-31 21:33
嗯,这是个bug
暂时解决》内容替换:
我为了这个弄了两个小时,死去活来啊,不懂正则表达式,所以内容替换弄不好。
我采集到的是a标签内容磁力链接,补全网址之后就不能用了,应该怎么替换呢? 链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
- <a href="[内容1]">
admin 发表于 2018-9-9 21:38
链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
谢谢建议,只是因为链接有很多,而且分段标题,单独采集很难后期组合。
所以我整段采集然后整体做处理比较现实。
最后唯一的问题就是磁力链接在 a标签内被强制补齐。
我现在是采集后,在数据库中批量替换关键词来处理的。如果后续能修复网址补全这个问题就太好了。
admin 发表于 2018-9-9 21:38
链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
这个我知道,因为数据特点,这样会造成后面数据处理的麻烦,所以只能整体采集。
不过,数据库替换也还好,采集完成后一键批量处理。 暂时解决不了,后期修复 我的好像没遇到过这样的问题呢、取消了就取消了
qijianchuan 发表于 2018-9-21 23:32
我的好像没遇到过这样的问题呢、取消了就取消了
已经修复了 相关知识点: 链接 内容 发表于
- 1pbootcms类型站点怎么查看图片、网页元素的路径和大小和颜色
- 2SEO站长每天需要做的9件事
- 3蓝天采集器安装到最后一步出错了!怎么回事啊
- 4蓝天采集器内容页指定关键词办法参考
- 5火车头采集器文章内容如何导入数据库
- 6163K网站系统公众号配置说明(微信登录)
- 7蓝天采集器请问发布方式的自定义插件是使用方法
- 8蓝天采集器这采集软件可以采集1688商品所有数据吗
- 9蓝天采集器采集器取消了自动补全网址,还是会自动补全
- 10狂雨小说CMS模版下载与设置
- 11163K网站系统腾讯云验证码配置说明
- 12蓝天采集器有没有可能增加这么一个“采集筛选”的功能?
- 13狂雨小说CMS网站fileinfo插件安装方法
- 14蓝天采集器[求助]请问采集内容页短路径如何采集?
- 15蓝天采集器内容页上一级是分页
- 16蓝天采集器是否可以利用火车头的免登录发布程序发布数据呢?
- 17蓝天采集器发布到本地数据库失败
- 18蓝天采集器只能翻译一个字段。
- 19蓝天采集器关于设置和触发自动采集时系统会卡死状态!
- 20163K网站系统视频系统详解+七牛远程附件配置教程
-
蓝天采集器采集中断、自动采集无效、图···
因为web服务器有运行时间限制,所以只要采集执行时间太长都会导致程序中断,需要修改web服务器的超时时间 IIS服务器: 桌面>计算机>右键>管理>服务和应用程序>IIS>根目录>FastCGI 设···
-
蓝天采集器请大佬帮忙看一下 要采集这···
请大佬帮忙看一下 要采集这个站的快讯要怎么设置,自己鼓捣了一天也不好使,采集不到标题和内容。 http://www.bishijie.com/kuaixun 对方网站列表页和文章页的内容都是ajax加载出来的,所以正常的url是···
-
蓝天采集器自动采集-访问触发 里面的···
需在您的网站底部模板中加入一条html代码: <script src="http://domin.mydomin.com/index.php?m=admin&c=index&a=caiji">···
-
蓝天采集器Z-BlogPHP 1.5···
没搞定,配置好后抓瞎了,不会操作,有搞定的能否分享个,谢谢了
-
蓝天采集器采集保存API问题
采集器设置API发布方式保存不了怎么办啊 api数据不做保存的,是实时抓取显示的 那怎么访问 admin 发表于 2018-4-23 19:35 api数据不做保存的,是实时抓取显示的 那要怎么访问啊 直接访问api接口网址啊,然···