Python爬虫学习之路第一天


一、Python环境的安装


Python版本:3.7.2

下载地址:https://pan.baidu.com/s/1HLV339eFOyiFbgJsVrxRmw

提取码:jk0t


下载之后只需要无脑的执行即可,这里需要注意的是需要勾选红框里的内容,就会自动添加到环境变量中,省去了不少麻烦

微信图片_20190109164038.png


打开cmd执行python命令出现以下页面即为成功


微信图片_20190109165305.png


二、Pycharm编辑器的安装


Pycharm版本:2018.3.2

下载地址包含注册码:https://pan.baidu.com/s/1-mTRwKY4PsbQjFmeQGIHKg

提取码:a75q

后来的一系列的无脑式安装就不多bb了。大概就是这样,然后一直下一步

微信图片_20190109164755.png



三、bs4模块的安装


进入你安装Python路径下的Scripts文件夹

微信图片_20190109165659.png


继续执行命令pip install beautifulsoup4,出现以下画面即为成功。

也可以运用cmd在python环境下import bs4进行验证

1f330564c259d4c7841933e2827a40d.png



四、Python代码的实现


本实例我爬取的是“https://www.27270.com/ent/meinvtupian/”网址下的美女图片的url


代码如下:


from urllib import request
from bs4 import BeautifulSoup

response = request.urlopen('https://www.27270.com/ent/meinvtupian/')
html_doc = response.read()

soup = BeautifulSoup(html_doc,'html.parser',from_encoding='utf-8')

links = soup.findAll('img')

for link in links:
    print(link['src'])


然后使用Pycharm运行此程序,即可看到效果。

微信图片_20190109222952.png



这样最简单的一段小爬虫就实现了。如果遇到什么问题,欢迎给本站长留言。

打赏 支付宝打赏 微信打赏

如果文章对您有帮助,欢迎移至上方打赏按钮...

评论

0.349049s