Python想能够写出代码明白爬取数据需要学多久?
2天,特定网站一小时。
很多人没接触过以为编程是统计学是微积分是别的数学逻辑关系。但如果只是读一个网页的话,一小时足够了。
面向对象的编程换成日常用语的话可以直白的说是方便复制粘帖的语言。大多数时候你不需要搞明白你复制的东西具体怎么实现,你只要知道他是干嘛的。
比如你说的爬虫,基础的话你可以完全不理会网络访问的原理。你只要知道有个有re包,有requeset包,有urllib包,有selenium。。。。
然后选一个你觉得不错的包,看下这个包的基本用法。比如selenium里有个webdriver,webdriver.chrome()是使用chrome浏览器,get("http://abc.com")是打开abc.com。。。。是的,你只用知道你输入啥对应他会干啥就好。正如上面的例子,你知道输入地址它帮你打开这个网址对应的网页。至于哪个方法保存哪个方法找哪些元素同样如此。用对应的工具包输入你想干嘛。
至此一个特定网页的爬虫就好了,耗时可能不到一小时(看查资料的速度)。当然如果你要求高,想多线程,想对抗反爬虫,想各种精确定位那需要一些知识。而那些知识大多和语言关系不大。