会员登录
注册
问题
等待回复
按关键字查看
用户
提交新建议/意见
欢迎来到 『华蛛社区』, 你可以在这里提问和回复,来跟其它用户一起交流。让我们共同打造中国第一个Web数据采集技术交流社区。
提示:验证邮箱后即可摆脱讨厌的验证码。
按分类查看
技术交流
(118)
社区事务
(2)
掌握Web数据抓取所需要学会的技能
–1
票
请问一下要想掌握Web数据抓取,都需要学习哪些语言? 掌握哪些技能?
谢谢
数据抓取
jason.zhangkangfu
(
110
积分)
发表于
12 年
之前
在
技术交流
1 条回复
0
票
你好!欢迎你加入社区。以下是我的几点建议:
1)首先要选择一门合适的开发语言。我们推荐Python,它具有简单易学、开发效率高、支持多线程、跨平台等优点。
2)你需要对HTTP协议相关知识有所了解。例如,浏览器和服务器是怎么进行交互的?为什么需要Cookie?gzip压缩是怎么回事?
3)正则表达式 - 强大的字符串提取工具。
4)XPath - XML文档元素定位工具。
5)了解JavaScript。
6)一些常用的辅助分析插件(FireFox):FireBug,Live HTTP Headers,HttpFox。
redice
(
640
积分)
回复于
12 年
之前
相关问题
0
票
1
回复
抓取微信小程序摩单车的数据
kds123
(
120
积分)
发表于
7 年
之前
在
技术交流
数据抓取
app数据抓取
+1
票
1
回复
自己配置的代理高匿代理ip,php curl 多线程抓取百度网盘的数据被封
pifire
(
130
积分)
发表于
8 年
之前
在
技术交流
数据抓取
稳定高匿名http代理
http代理
0
票
1
回复
如何抓取微信小程序的数据?
sddhc53
(
120
积分)
发表于
6 年
之前
在
技术交流
–1
票
1
回复
如何抓取app数据包(除了fiddler工具)?
361620381
(
110
积分)
发表于
8 年
之前
在
技术交流
app数据抓取
post
–1
票
2
回复
加入华蛛社区,一起交流Web数据采集技术
redice
(
640
积分)
发表于
13 年
之前
在
社区事务
华蛛社区
华蛛社区
- 中国第一个Web数据采集技术交流社区
spider AT site-digger.com