资源预览内容
第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
亲,该文档总共8页全部预览完了,如果喜欢就下载吧!
资源描述
八爪鱼云采集服务平台www.bazhuayu.com八爪鱼单个文本输入及点击登录方法(7.0 版本)本文给大家演示单个文本输入及点击登录进行数据采集的方式。有些网站是需要登陆账号之后才能进行采集数据的,这里文章所讲示例采集数据网址为https:/list.tmall.com/search_product.htm?q=%C1%AC%D2%C2%C8%B9&click_id=%C1%AC%D2%C2%C8%B9&from=mallfp.pc_1.1_hq&spm=875.7931836%2FB.a1z5h.2.vxUxbA上述网址如果是需要登陆才能采集的,就需要做一个登陆流程。登陆地址为 https:/login.tmall.com/我们这个网址里面需要输入用户名、密码登陆进去然后打开前面的网址采集数据。具体步骤如下:步骤 1 登陆八爪鱼 7.0 采集器点击新建任务自定义采集,进入到任务配置页面:然后输入网址保存网址,系统会进入到流程设计页面并自动打开前面输入的网址。 八爪鱼云采集服务平台www.bazhuayu.com单个本文输入及点击登录-图 1:输入网址接下来步骤是输入用户名密码了,八爪鱼模拟的是人的操作行为,所以这一步过程也很简单步骤 2 在浏览器中鼠标点击用户名输入框在右边弹出的提示里面选择 “输入文字”输入自己的用户名选择“确定” 八爪鱼云采集服务平台www.bazhuayu.com单个本文输入及点击登录-图 2:输入账号 八爪鱼云采集服务平台www.bazhuayu.com单个本文输入及点击登录-图 3:输入账号同样的方式输入密码。这样输入用户名密码的步骤就完成了。接下来模拟人工手动点击登陆按钮,完成这一步就会进入到登陆之后的页面采集我们最终需要的数据了。步骤 3 在浏览器中鼠标点击登陆按钮在右边弹出的提示框里选择“点击该按钮”。这时候就会看到浏览器会跳转到登陆页面,这时登陆流程便做好了单个本文输入及点击登录-图 4:点击登录 八爪鱼云采集服务平台www.bazhuayu.com前面的步骤都完成之后打开我们最终需要采集数据的网址再做之后的采集流程步骤 4 点开页面上的“流程”按钮,流程显示出来之后,我们往流程里拖入一个打开网页的步骤,打开最终采集的天猫网址。可以看到浏览器打开之后的网址就已经是登陆的网址了单个本文输入及点击登录-图 5:打开要采集的 URL本教材重点是教用户怎么通过输入用户名、密码方式登陆网站,至于后面的数据采集步骤按照前面新手入门的方法提取即可。 八爪鱼云采集服务平台www.bazhuayu.com小贴士:另外有些网站这个登录框其实是 iframe 的登录框,iframe 即 html 标签,会创建包含另外一个文档的内联框架(即行内框架),含义是网页中的网页。 例如上面天猫的登陆地址,八爪鱼获取的是当时操作时的 iframe,但是天猫有防采集措施,如果登录框的xpath 有变化的话,就需要通过下面的方式获取登录框的详细 URL 直接输入这个 URL 做登陆流程。 我们可以通过火狐获取登陆框的详细地址,然后直接输入这个详细的地址进行流程设计在火狐浏览器上鼠标右键登录框选择此框架查看框架信息地址 这个地址即为登录框的真实地址,获取到这个地址之后在八爪鱼规则里输入这个地址做规则即可。单个本文输入及点击登录-图 6:查看框架信息 八爪鱼云采集服务平台www.bazhuayu.com单个本文输入及点击登录-图 7:复制地址栏中的 URL单个本文输入及点击登录-图 8:在网页中打开复制的 URL 八爪鱼云采集服务平台www.bazhuayu.com相关采集教程:京东商品信息采集新浪微博数据采集赶集招聘信息采集八爪鱼 70 万用户选择的网页数据采集器。1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2 分钟即可快速入门。2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax 脚本异步加载数据的网页,均可经过简单设置进行采集。3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群 24*7 不间断运行,不用担心 IP 被封,网络中断。4、功能免费+ 增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号