本帖最后由 ihua 于 2019-6-20 12:00 编辑
我写了一个电影资源采集的东西
所有东西都很正常,但是下载链接(本应是磁力)变成了如下样子:
http://www.abc.com/def/magnet:?xt=urn:btih:b7d7eda2ef502a1d9fcd13f2be1fdc7a0e541c0a&dn=Human.2015.720p.BluRay.x264-WiKi&tr=http%3A%2F%2Ftracker.trackerfix.com%3A80%2Fannounce&tr=udp%3A%2F%2F9.rarbg.me%3A2710&tr=udp%3A%2F%2F9.rarbg.to%3A2710
应该将http://www.abc.com/def/这部分去除。
尝试字段采集后进行“数据处理”,但无法成功。
后来,想再采集CMS插件脚本中实时将“http://www.abc.com/def/”替换成“”也没能成功(因为个人不熟悉php操作mysql)不知道可行不可行?
希望有办法解决的大佬们给点建议。
已经解决:
问题出现:当采集数据才关联页时,网址会强制补全,如果内容页时起始页就没问题。
修复方法:
如题,解决方案如下:
在SkycaijiApp/Admin/event/Capttern.php1316行,即
- $val_values=implode($this->config['new_paging_fields'][$fieldName]['delimiter'], $val_values);
下面一行。
加入内容:
- $val_values= str_replace("http://www.abc.com/cef/","",$val_values);
如需替换其他,再加一条替换网址就行! 这是个笨方法 相关知识点: 东西 代码 网址
- 1蓝天采集器exception 'Requests_Exception' with message 'cURL error 60: SSL certificate p...
- 2蓝天采集器[求助]请问采集内容页短路径如何采集?
- 3PbootCMS发布的内容带反斜杠不显示问题
- 4163K网站系统短信通知配置教程(S版)
- 5蓝天采集器dedecms标签怎么写?
- 6蓝天采集器数据库问题
- 7蓝天采集器提示信息
- 8蓝天采集器批量添加起始网址数量有问题
- 9pbootcms首页只调用推荐的文章的教程
- 10蓝天采集器远程图片采集下来能否保存至阿里云OSS图片服务器?
- 11蓝天采集器图片本地化问题,请问一下站长
- 12新手站长快速操作PbootCMS安装百度统计代码教程
- 13网站SEO优化100条解答经验分享1-30
- 14蓝天采集器后台更新系统失败
- 15蓝天采集器要爬的网站里分很多语言怎么选择
- 16zblog蓝天采集器发布插件带评论置顶标签
- 17蓝天采集器版主吧群公布出来吧。
- 18蓝天采集器API接口使用问题
- 19蓝天采集器系统安装问题
- 20163K网站系统七牛云加速域名开启https教程
-
蓝天采集器请问一下,获取正文的时候这···
www.xiaodao.la/i-wz-78636429.html 采集匹配出来的正文 都是一直在转圈圈 请问一下这种类型的情况应该怎么处理,一直获取不到正确的图片内容 查看网页源代码,图片链接<imgsr···
-
蓝天采集器系统安装问题
问下,服务器只有oracle数据库。这系统可以直接安装在这数据库中不。。。。 要装php+mysql,很好配置的,搜lnmp或lamp安装包 admin 发表于 2018-7-23 00:03 要装php+mysql,很好配置的,搜ln···
-
蓝天采集器使用常见问题及解决办法
采集中断、自动采集无效、图片下载不了详见:https://www.srso.cn/fy/657.htmlcli命令模式php可执行文件:默认自动识别,识别不了,在linux系统中关闭目录跨站保护,手动输入:可输入环境变量名“php”(需要系···
-
蓝天采集器测试的时候没有问题。真正采···
测试的时候没有问题。真正采集出现这种问题 关闭图片本地化试试,一般是图片下载超时了
-
小浣熊漫画cms首页热门点击数人气是···
在使用小浣熊漫画cms的时候相信许多的站长都会遇到一个问题就是首页的热门漫画一直是0也不知道在哪儿去设置。今天蜀戎网就给大家分享一下操作的教程。章节封面人气为,0,首页的热门漫画和章节封面这里的人气是连接在一起的。由于小浣熊漫画cms采用的···