后羿采集器mac版是专为mac用户提供的一款专业实用的的网页数据采集器。后羿采集器不需要开发,任何人都能用,数据可导出到本地文件、发布到网站和数据库等。有需要的赶快试试吧!
后羿采集器是一款免费的网页数据采集,具有可视化点选,一键采集网页数据的特点,是一款不需要开发,任何人都能用的网页数据采集器。后羿采集器导出数据无限制,数据可导出到本地文件、发布到网站和数据库等,十分方便,需要的朋友赶紧下载吧。
可视化点选,一键采集网页数据
全程拖拽和点击操作,不需要开发更不需要懂技术任何人都能用的网页数据采集器
采集和导出全免费,无限制放心用
全免费的采集软件,导出数据无限制数据可导出到本地文件、发布到网站和数据库等。
可后台运行,速度实时显示
可切换软件后台运行,不打扰您的其他前台工作悬浮窗口实时查看采集速度和采集数据等。
全平台,Win/Mac/Linux都可用
不同于其他采集器,后羿支持所有操作系统版本更新和功能升级同步所有平台。
如何采集58二手房房源信息数据
步骤1:创建采集任务
1)打开后羿采集器,进入主界面,点击创建任务按钮创建 "向导采集任务"
2)输入58二手房网站的URL,包括三种方式
1、手动输入:在输入框中直接输入URL,多个URL时须要换行分割
2、点击从文件中读取方式:用户选择一个存放URL的文件,文件中可以有多个URL地址,地址须要换行分割。
3、批量添加方式:通过添加并调整地址参数生成多个有规律的地址
步骤2:定制采集过程
1)点击创建后自动打开第一个URL进而进入向导设置,点击下一步进入列表页
2)在想要采集的元素所在的列表块中挑选一块,并点击块内想要抽取的元素
3)再点击列表中的其他一块,可以自动选中整个列表,点击下一步
4)选择下一页按钮,选中选择下一页选项,然后点击页面中的下一页按钮填充第一个输入框,第二个数据框可以调节任务运行中点击下一页按钮的次数。理论上次数越多,采集到的数据结果越多。点击下一步
5)在焦点框中点击选择要采集的字段。下方会显示采集到的结果,针对每个字段的结果可以设置抽取的方式,双击字段可编辑。点击下一步。
6)选择是否进入详情页面,进入详情页须要点击焦点框中可以点击进入详情页的元素,输入框中会得到该元素的xpath,点击下一步
7)在详情页中可以继续点击添加字段,此处添加二手房价格、*室*卫*厅、房源面积、楼层号,所在小区位置,点击保存或保存并运行
步骤3:数据采集及导出
1)采集任务运行中
2)采集完成后,选择“导出数据”可以把数据都导出到本地文件
3)选择“导出方式”,将采集好的数据导出,这里可以选择excel作为导出为格式
4)采集数据导出后如下图
1、可视化自定义采集流程
全程问答式引导、可视化操作、自定义采集流程。
自动记录和模拟网页操作顺序
高级设置满足更多采集需求
2、点选抽取网页数据
鼠标点击选择要爬取的网页内容、操作简单。
可选择抽取文本、链接、属性、html标签等。
3、运行批量采集数据
软件按照采集流程和抽取规则自动批量采集
快速稳定,实时显示采集速度和过程可切换软件后台运行,不打扰前台工作。
4、导出和发布采集的数据
采集的数据自动表格化,自由配置字段。
支持数据导出到Excel等本地文件和一键发布到CMS网站/数据库/微信公众号等媒体。