借阅:1人
收藏:0人
/韦世东著
ISBN/ISSN:978-7-115-52873-5
价格:CNY89.00
出版:北京 :人民邮电出版社 ,2020.1(2020.3重印)
载体形态:377页 ;24cm
中图分类号:TP311.561
责任者:韦世东著 著
加入暂存架
豆瓣内容简介:
本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网页对爬虫造成的影响,紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过,然后概览了App数据爬取的关键和常用的反爬虫手段,最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。
豆瓣作者简介:
韦世东,资深爬虫工程师,2019年华为云·云享专家,掘金社区优秀作者,GitChat认证作者,夜幕团队(NightTeam)成员。拥有七年互联网从业经验,擅长反爬虫的设计和绕过技巧。
目录:
序
前言
第1章 开发环境配置
第2章 Web网站的构成和页面渲染
第3章 爬虫与反爬虫
第4章 信息校验型反爬虫
第5章 动态渲染反爬虫
第6章 文本混淆反爬虫
第7章 特征识别反爬虫
第8章 App反爬虫
第9章 验证码
第10章 综合知识
北京创讯未来软件技术有限公司 版权所有 ALL RIGHTS RESERVED 京ICP备 09032139
欢迎第6598943位用户访问本系统