搜索关键字：数据抽取，搜索到211个结果！码迷,mamicode.com！

前嗅ForeSpider教程：采集CSDN

以CSDN（https://blog.csdn.net/nav/career）为例，采集当前列表页博文的正文数据：第一步：新建任务①点击左上角“加号”新建任务，如图1：【图1】②在弹窗里填写采集地址，任务名称，如图2：【图2】③点击下一步，选择进行数据抽取还是链接抽取，本次采集当前列表页博文的正文数据，正文数据是通过点击列表链接进入的，所以本次需要抽取列表链接，所以点击抽取链接，如图3：【图3】第

分类：其他好文时间：2019-01-27 14:46:27 阅读次数：249

前嗅ForeSpider教程：采集360问答

今天，小编来教大家如何采集论坛自媒体类网站的数据，以采集360问答为例，为大家进行演示操作，该操作同样适用于其他类似网站：第一步：新建任务①点击左上角“加号”新建任务，如图1：②弹窗里填写采集地址，任务名称，开启手动登录配置，如图2：若未在此处开启登录配置，可在模板抽取配置中点击相应的模板，开启登录配置，如图3。③点击下一步，选择进行数据抽取还是链接抽取，本次采集列表下的正文数据，所以本次需要抽取

分类：其他好文时间：2019-01-27 14:44:20 阅读次数：274

前嗅ForeSpider教程：采集需要登陆的网页内容

第一步：新建任务①点击左上角“加号”新建任务，如图1：【图1】②弹窗里填写采集地址，任务名称，开启手动登录配置，如图2：【图2】若未在此处开启登录配置，可在模板抽取配置中点击相应的模板，开启登录配置，如图3。【图3】③点击下一步，选择进行数据抽取还是链接抽取，本次采集列表下的正文数据，所以本次需要抽取内容选择链接列表，所以点击抽取链接，选择链接列表，如图4：【图4】④完成后模板抽取配置列表有两个模

分类：Web程序时间：2019-01-27 14:43:11 阅读次数：213

前嗅ForeSpider教程：采集新浪新闻

最近后台有很多童鞋问怎么采集新闻，今天小编以采集新浪新闻为例，来为大家进行演示，同样适用于其他新闻网站的采集，具体操作如下：第一步：新建任务①点击左上角“加号”新建任务，如图1：②在弹窗里填写采集地址，任务名称，如图2：③点击下一步，选择进行数据抽取还是链接抽取，本次采集当前列表页新闻的正文数据，正文数据是通过点击列表链接进入的，所以本次需要抽取列表链接，所以点击抽取链接，如图3：第二步：通过定位

分类：其他好文时间：2019-01-27 14:36:19 阅读次数：176

前嗅教程：同一个网站中从另一页面采集数据

第一步：新建任务①点击左上角“加号”新建任务，如图1：【图1】②在弹窗里填写采集地址，任务名称，如图2：【图2】③点击下一步，选择进行数据抽取还是链接抽取，本次采集企业最新动态链接列表，所以点击抽取链接，选择链接列表，如图3：【图3】④完成之后，在模板抽取配置下生成两个模板，默认模板：01和链接列表：02。模板1中的“链接列表”链接抽取已与模板2关联，如图4。如果配置的时候发现关联有问题，可以自己

分类：Web程序时间：2019-01-27 14:35:14 阅读次数：254

前嗅ForeSpider教程：采集列表和正文的数据

第一步：新建任务①点击左上角“加号”新建任务，如图1：【图1】②弹窗里填写采集地址，任务名称，如图2：【图2】③点击下一步，选择进行数据抽取还是链接抽取，本次采集当前页面子栏目下的列表房源的正文数据，子栏目房源列表是通过点击子栏目链接进入的，所以本次需要抽取子栏目链接，所以点击抽取链接，选择子栏目，如图3：【图3】④完成后模板抽取配置列表有两个模板，默认模板和子栏目。默认模板下自动生成一个链接抽取

分类：其他好文时间：2019-01-27 14:34:28 阅读次数：182

前嗅ForeSpider教程：采集图片/视频/资源文件的链接地址

昨天为大家介绍了如何采集图片/视频/资源文件后，有小伙伴问我如何采集他们的链接地址，今天小编就为大家演示如何采集图片/视频/资源文件的链接地址，操作如下：第一步：新建任务①点击左上角“加号”新建任务，如图1：②在弹窗里填写采集地址，任务名称如图2：③点击下一步，选择进行数据抽取还是链接抽取，本次采集所有页面的图片，图片链接是通过点击图片列表链接进入的，所以本次需要抽取列表图片链接，所以点击抽取链接

分类：其他好文时间：2019-01-27 11:29:31 阅读次数：274

前嗅ForeSpider教程：采集表格/列表页中的数据（不翻页）

第一步：新建任务①击左上角“加号”新建任务，如图1：【图1】②在弹窗里填写采集地址，任务名称如图2：【图2】③点击下一步，选择进行数据抽取还是链接抽取，本次采集需要采集当前页面列表中的所有内容，所以只需抽取列表数据即可，点击“抽取数据”，如图3：【图3】第二步：创建/选择表单在ForeSpider爬虫中，表单是可以复用的，所以可以在数据表单出直接选择之前建过的表单，也可以通过表单ID来进行查找并关

分类：其他好文时间：2019-01-09 11:44:47 阅读次数：251

前嗅ForeSpider教程：通过链接列表采集正文数据（不翻页）

第一步：新建任务①点击左上角“加号”新建任务，如图1：【图1】②在弹窗里填写采集地址，任务名称如图2：【图2】③点击下一步，选择进行数据抽取还是链接抽取，本次采集当前列表页新闻的正文数据，正文数据是通过点击列表链接进入的，所以本次需要抽取列表链接，所以点击抽取链接，如图3：【图3】第二步：通过智能过滤，得到所需链接。①按住Ctrl+鼠标左键点击所需链接；②击“智能过滤”按钮，如图4：【图4】第三步

分类：其他好文时间：2019-01-09 11:36:47 阅读次数：241

前嗅ForeSpider教程：采集表格/列表页中的数据（翻页）

以孔夫子旧书网的最近出版板块为例（http://www.kongfz.com/1004/）为例，采集列表页的所有数据：第一步：新建任务①击左上角“加号”新建任务，如图1：②在弹窗里填写采集地址，任务名称如图2：③点击下一步，选择进行数据抽取还是链接抽取，本次采集需要采集当前板块的列表页所有内容，所以只需要在同一个模板中进行翻页链接抽取以及数据抽取即可。此处需要勾选“抽取链接”-“普通翻页”以及“抽

分类：其他好文时间：2019-01-09 11:15:14 阅读次数：949