import requests
import re
content=requests.get('https://blog.csdn.net/seanyang_?type=blog',headers).content.decode()
想通过requests获取网站源码,但是发现获取不到响应。猜想可能是有反爬虫机制。
解决办法使用requests-html库
1、安装
pip install requests-html
2、使用如下代码,成功获取到网页数据。
from requests_html import HTMLSession
session = HTMLSession()
logging_url = session.get('https://blog.csdn.net/seanyang_?type=blog')
print(logging_url.html.html)