页面地址:https://www.baidu.com/baidu.php?sc.K000000fJeHuq9k18PvSMTqPVJOr4I_DzW-zvs73x61JUfvts0nEt5ScVepMPVZhii51-vXAnK5ygXHOoDeRyTaegBhq5RupmOFY8B2XObNQ9JDKLPXmmfah8AlxGJHv7tdQ7-Vjx3SbeWelvtiUJGITFu5UghTjGHNSnCuGa2POhm6TGf.DR_iwt5-8vc69JsTrajE6CpXyPvap7QDpIrXPhBh55X1BsutT5y5ZGmLX5H8ovUqLZGtx2E_vUtMW_vUqdxgKfYt_QrMAzONDkAhWwl32AM-YG8x6Y_f33X_IH8jZ-Wmkst8ER_HAOuugb_vUrgWzLp-9h9merzEx3J0.U1YY0ZDqdS2LEsKspynqnfKY5TM8vqog3oXO0A-V5HczPfKM5gNbXWD0Iybqmh7GuZN_UfKspyfqP0KWpyfqrHn0UgfqnH0kPdtknjD4g1DsnHPxn1msnfKopHYs0ZFY5HcvP6K-pyfqnHfznNtznH04n-tznj63nNtznWDvn0KBpHYznjf0UynqP1nvnjRYrHTLg1T1PW0dPjb3n7tzP1nkPWc4nW0vg100TgKGujYs0Z7Wpyfqn0KzuLw9u1Ys0A7B5HKxn0K-ThTqnfKsTjY1nH03P1TkrjcY0A4vTjYsQW0snj0snj0s0AdYTjYs0AwbUL0qn0KzpWYs0Aw-IWdsmsKhIjYs0ZKC5H00ULnqn0KBI1Yv0A4Y5H00TLCq0ZwdT1YknWRsPjT4rHbYPW0dn1Tdnj63n0Kzug7Y5HDdnWnLnWm3n1D1nj00Tv-b5HbkujRsnyn1nj0snWbLPHT0mLPV5H6LPH0vrDfLrD7DnjR1PYn0mynqnfKsUWYs0Z7VIjYs0Z7VT1Ys0ZGY5H00UyPxuMFEUHYsg1Kxn7ts0Aw9UMNBuNqsUA78pyw15HKxn7tsg100TA7Ygvu_myTqn0Kbmv-b5H00ugwGujYVnfK9TLKWm1Ys0ZNspy4Wm1Ys0Z7VuWYs0AuWIgfqn0KhXh6qn0Khmgfqn0KlTAkdT1Ys0A7buhk9u1Yk0Akhm1Ys0APzm1YkPWcLns&ck=1491.15.78.260.492.350.141.458&shh=www.baidu.com&sht=98012088_3_dg&us=4.0.1.0.17.6376.0&ie=utf-8&f=8&ch=14&tn=98012088_3_dg&wd=%E7%A7%9F%E6%88%BF&oq=%E7%A7%9F%E6%88%BF&rqlang=cn&bc=110101|Cn5lxFfhSDpa3yYFHJoKAg==&PGTID=0d3090a7-0000-4794-2709-75761993ea05&local=4&apptype=0&key=&pubid=30945153&trackkey=33244024629037_fc9df3cf-eb54-48f0-b158-dec9bf6a436c_20180415013130_1523727090906&fcinfotype=gz]点击查看[/url]
我想采集信息如下图:
我想采集页面上图的两处信息,信息包括样式、图片、连接、文字
请问在编辑正文字段时选用什么规则,规则方式怎么编写
添加3个字段,1个抓取描述,1个抓取图片,1个字段组合前两个
描述xpath:
- /html/body/div[4]/div[3]/div[1]/div[1]/ul/li[2]/span[2]
图片xpath:
- //*[@id="housePicList"]
这个采集58同城数据的兄弟,搞定了吗,我试了采集不了啊 相关知识点: 字段 我想 标签
- 1蓝天采集器发布设置问题
- 2蓝天采集器发布数据库
- 3pbootcms详情页判断有无轮播图调用缩略图或者内容第一张图教程
- 4蓝天采集器安装出问题 显示版本问题
- 5蓝天采集器为什么我一采集入库就报表只可读保存失败
- 6163K网站系统阿里短信状态全部是发送中的解决办法
- 7给PbootCMS增加个换行格式化标签br=1
- 8163K网站系统QQ登录配置教程
- 9蓝天采集器自动采集不定时停止运行
- 10蓝天采集器关于绑定cms及自己开发的cms发布应用的问题
- 11Discuz! Q宝塔面板在线安装操作教程
- 12狂雨小说CMS安装搭建使用中常见问题汇总
- 13蓝天采集器如何导入发布插件操作教程
- 14蓝天采集器数据库 发布失败 发布以一条后停止
- 15html5外贸营销型网站建设方案
- 16蓝天采集器请问时间转换为时间戳这个工具应该怎么使用?
- 17蓝天采集器如何导入函数插件使用操作教程
- 18蓝天采集器请问一下 多级网址获取 应该怎么使用
- 19蓝天采集器后台更新系统失败
- 20餐饮及酒店行业网站建设方案
-
影视站建设教程-零基础搭建影视站
影视建站 1.购买域名/主机 2.绑定解析 3.安装程序 4.安装影视模板 5.采集教程 常见问题 零基···
-
蓝天采集器关键词过滤
关键词过滤第四个检测到关键词采集用不了呀,第二个检测到关键词不采集倒是可以用
-
蓝天采集器无法获取post方式获得的···
如题无法获得这个http://ggzyjy.sc.gov.cn/jyxx/transactionInfo.html列表页面的网址,F12查看了下它是通过post参数到这个地址 http://ggzyjy.sc.gov.cn/intelige···
-
蓝天采集器任务列表应新增复制功能
谢谢反馈,你暂时可以在任务中导入其它任务的采集规则
-
163K网站系统X12(201910···
1:在线自动升级前,如果您的门户程序版本是X12(20191014),务必先下载 http://shengji.163k.com/shengji.rar 解压后将 shengji.js 这个文件复制到服务器网站根目录下的 /AdminSk···