火车头采集器技术控使用手册教程(入门+高级)课程目录
1.1- 火车头采集器的安装和功能简介
1.2 – 火车头采集器的相关术语
1.3 – 火车头采集器的学习建议
2.1 – 如何添加需要采集的单条网址
2.10 – 多级网址采集规则之列表分页获取的方式
2.11 – 多级网址采集规则之附加参数是什么意思?
2.2 – 如何添加批量和多页网址
2.3 – 如何导入txt网址到开始采集地址
2.4 – 如何获取Rss地址中的网址作为起始网址
2.5 – 如何自定义一些网址的格式来采集新的数据
2.6 – 多级网址采集规则之从页面自动分析得到地址链接
2.7- 多级网址采集规则之手动填写链接地址规则
2.8 – 多级网址采集规则之使用Xpath方式获取网址
2.9 – 如何判断Http请求方式?是get还是post?
3.1 – 提取数据方式有哪些
火车头采集器技术控使用手册(高级)
第1章: 序章
第2章: 中级教程开fiddler篇
第3章: 分类信息网站的采集
第4章: 火车头采集器在采集各大新闻腾讯网易新浪等网站内容的使用
第5章: 采集数据合成成文本
第6章: 火车头采集器在威客领域的使用
第7章: 优酷网站相关内容采集的讲解
第8章: 火车头采集器采集百度相关内容
第9章: 火车头采集器发布模块的制作思路和方法
第10章: 后续视频发布,持续更新各种案例
火车头采集器使用教程(入门)
3.10 – 数据处理之同义词替换
3.11 – 数据处理之提取文章中的第一张图片
3.12 – 数据处理之空内容缺省值
3.13 – 数据处理之内容前后缀
3.14 – 数据处理之随机插入
3.15- 数据处理之OCR图片识别
3.16 – 数据处理之对单网址进行补全
3.17 – 数据处理之文件下载的设置方法
3.18 – 数据处理之内容过滤相关设置
3.19 – 自定义固定格式的数据
3.2 – 数据处理之内容替换
3.20- 如何循环采集一些数据
3.21 – 如何采集网址中的数据
3.3 – 数据处理之Html标签过滤如何使用
3.4 – 数据处理之字符截取
3.5- 数据处理之纯正则替换如何使用
3.6 – 数据处理之数据转换
3.7 – 数据处理之自动摘要
3.8 – 数据处理之自动分词
3.9 – 数据处理之字符编码和解码
4.1 – Web在线发布到网址的设置方式
4.2 – 将采集到的数据保存为本地TXT文件形式
4.3 – 将采集到的数据保存为本地Word文件形式
4.4 – 将采集到的数据保存为本地Excel文件形式
4.5- 将采集到的数据保存为本地Html文件形式
4.6 – 将采集到的数据保存为本地Csv文件形式
4.7 – 将采集到的数据导入到自定义数据库
4.8 – 发布数据完成之后可以对数据进行哪些操作
4.9 – 如何控制每次发布的数据的条数
5.1 – 任务运行时线程设置的讲解
5.2 – 文件下载设置的相关注意事项
5.3 – FTP同步文件上传如何设置
5.4 – 如何给采集到的图片加上水印
6.1 – 中级内容简介,希望大家多多支持