蓝天采集器又有新的问题!版主来哈。关于采集的

2018-04-23 201 19 编辑:qq869216264 来源:蓝天采集社区

突然发现网易新闻采集页面编码是UTF-8而内容页面却是gb2312这个怎么解决啊。前面开启自动检测编码,页面无法检测出来,内容貌似也是一样,设置成UTF-8后 页面出连接了,而内容却乱码了 这个怎么解决啊。我吧采集规则传到云平台了,希望大家有解决方法后再传上去!谢谢你们
内容页用Xpath可以抓取到!!!
问一下站长下一个版本多久更新,真心迫不及待!
测试了下,网站编码选择自动检测可以抓取到数据啊

admin 发表于 2018-4-23 19:34
测试了下,网站编码选择自动检测可以抓取到数据啊

自动编码我的抓不起来0.0看图,最后一个是utf-8我也不清楚那里问题。要不我把程序传到云平台你看看 下个版本自动检测编码已强化,基本能检测出所有编码

相关知识点: 自动检测 页面 内容
本站文章均为蜀戎网络摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,未经允许禁止复制转载!感谢...
更多人喜欢

在线
客服

在线客服服务时间:9:00-21:00

客服
热线

13227777380
7*24小时客服服务热线

客服
微信

扫一扫微信咨询
顶部