如何使用python从内网站点抓取URL数据?

2023-12-15

我需要一个 Python Warrior 来帮助我(我是个菜鸟)!我正在尝试使用模块 urllib 从内部网站点抓取某些数据。但是,由于这是我公司的网站,仅供员工查看,而不可供公众查看,我认为这就是我得到此代码的原因:

IOError: ('http 错误', 401, '未经授权',)

我该怎么办?它甚至不会使用 htmlfile.read() 读取网站

获取公共站点的示例代码:

import urllib
import re

htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL")

htmltext = htmlfile.read()

regex = '<span id="yfs_l84_aapl">(.+?)</span>' 

pattern = re.compile(regex)

price = re.findall(pattern,htmltext)

print price

Try requests with 请求_ntlm:

import requests
from requests_ntlm import HttpNtlmAuth

r = requests.get("http://ntlm_protected_site.com",auth=HttpNtlmAuth('domain\\username','password'))

    print r.text

如果您需要有关此库的任何细节的帮助并且在文档中找不到它,请发表评论。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用python从内网站点抓取URL数据? 的相关文章