如何使用python从内网站点抓取URL数据？

2023-12-15

我需要一个 Python Warrior 来帮助我（我是个菜鸟）！我正在尝试使用模块 urllib 从内部网站点抓取某些数据。但是，由于这是我公司的网站，仅供员工查看，而不可供公众查看，我认为这就是我得到此代码的原因：

IOError: ('http 错误', 401, '未经授权',)

我该怎么办？它甚至不会使用 htmlfile.read() 读取网站

获取公共站点的示例代码：

import urllib
import re

htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL")

htmltext = htmlfile.read()

regex = '<span id="yfs_l84_aapl">(.+?)</span>' 

pattern = re.compile(regex)

price = re.findall(pattern,htmltext)

print price

Try requests with 请求_ntlm:

import requests
from requests_ntlm import HttpNtlmAuth

r = requests.get("http://ntlm_protected_site.com",auth=HttpNtlmAuth('domain\\username','password'))

    print r.text

如果您需要有关此库的任何细节的帮助并且在文档中找不到它，请发表评论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用python从内网站点抓取URL数据？

python

webscraping

urllib

intranet

如何使用python从内网站点抓取URL数据？的相关文章

“扩展”numpy ndarray 的好方法？

如何在 Python 中使用 .format() 打印“for”循环中的列表？

如何关闭python服务器

不能在jinja2宏中使用current_user？

无法使用 beautifulsoup 模块 python 从 HTML 检索温度值

Flask/Apache 提交按钮用于文件上传

AttributeError：模块“tensorflow.python.framework.ops”没有属性“RegisterShape”

插入多行并返回主键时 Sqlalchemy 的奇怪行为

Python 3.4.3 subprocess.Popen 在没有管道的情况下获取命令的输出？

Pythoncom - 将相同的 COM 对象传递给多个线程

如何使用python从内网站点抓取URL数据？

如何使用python从内网站点抓取URL数据？ 的相关文章

如何使用python从内网站点抓取URL数据？的相关文章