获取 S&P 500 股票代码列表

2024-01-08

所以我用这个在 Python for Finance 上，它总是给我错误——

1) line 22, in <module> save_sp500_tickers() and 

2) line 8, in save_sp500_tickers
    soup = bs.BeautifulSoup(resp.text,'lxml')and 

3) line 165, in __init__
    % ",".join(features))
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml.
Do you need to install a parser library?

我已经为此工作了一整天，老实说我拒绝放弃，对此的任何帮助将不胜感激。另外，如果有人对pickle以外的东西有任何建议，并且可以帮助写一些东西，让我可以在没有pickle的情况下调用SP500，那就太好了。

import bs4 as bs    
import pickle    
import requests    
import lxml    
def save_sp500_tickers():
    resp = requests.get('https://en.wikipedia.org/wiki/List_of_S%26P_500_companies')        
    soup = bs.BeautifulSoup(resp.text,'lxml')        
    table = soup.find('table', {'class': 'wikitable sortable'})        

    tickers = []

    for row in table.findAll('tr')[1:]:
        ticker = row.findAll('td')[0].text
        tickers.append(ticker)

    with open("sp500tickers.pickle", "wb") as f:
        pickle.dump(tickers, f)
    print(tickers)

    return tickers    

save_sp500_tickers()

按原样运行您的代码可以在我的系统上运行。也许，正如 Eric 建议的那样，您应该安装 lxml。

不幸的是，如果您使用的是 Windowspip install lxml除非您设置了完整的编译器基础结构，否则它不起作用，而您可能没有。

幸运的是，您可以从以下位置获取预编译的二进制安装程序http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml- 确保您选择的 Python 版本与您的 Python 版本相匹配，以及它是 32 位还是 64 位。

Edit:只是为了兴趣，尝试改变线路

soup = bs.BeautifulSoup(resp.text, 'html.parser')   # use Python's built-in parser instead

See https://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-a-parser https://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-a-parser获取可用解析器的列表。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

获取 S&P 500 股票代码列表的相关文章

如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce

随机推荐

如何使用 Java 8 DateTime API 从序列值本地日期时间获取 POSIX 时间 (UTC)

我有一个类似于POSIX 时间 https en wikipedia org wiki Unix time唯一的例外是它不被计算在内UTC https en wikipedia org wiki Coordinated Universal
Spring STS 挂起的原因可能是什么？

有时在启动时 STS 会挂起能找到原因吗可能存在日志或可能在调试模式下启动另外我如何区分完全挂起和工作速度非常慢谢谢附怎么修这通常是出于与此处描述的相同原因加速日食的技巧 https stackoverflow com qu
C# Lambda 返回一些空值

opencall Priority averages Where x gt x ProblemCode opencall ProblemCode SingleOrDefault Priority 上面的 lambda 语句返回一些空值因为
将 NSDate 转换为其他格式[重复]

这个问题在这里已经有答案了可能的重复 NSDateFormatter 和 yyyy MM dd https stackoverflow com questions 5087173 nsdateformatter and yyyy mm d
是否逐行替换并将覆盖字典中的值两次？

假设我有以下数据集 lst u v w x y lst rev list reversed lst dct dict zip lst lst rev df pd DataFrame A a b a c a B lst dtype categ
如何在客户端使用 JavaScript 检查 webRTC 数据通道兼容性？

WebRTC 数据通道仅在 Firefox nightly 中工作如何在客户端查看代码如下 if Firefox s d d test navigator userAgent test for Firefox x x or Firefo
让 fields_for 与 has_many 关系一起工作

我在生成嵌套模型表单时遇到问题这是我的模型 class Workout lt ActiveRecord Base has many scores has many users through gt scores accepts neste
Fiddler 使网页浏览速度非常慢

虽然 Fiddler 对我来说工作得很好但它似乎确实使浏览速度变得非常慢在 Fiddler 运行的情况下打开这个网站只需要大约十秒钟如果我关闭它它几乎会立即加载我想知道这是否就是 Fiddler 的工作方式或者是否有一个选项或设
我如何克隆/复制某种 iOS 的 UIView？

下面的屏幕截图有助于解释我想要做什么这背后的想法是我有一个UIView 与各种不同的UI里面的元素例如假设我有一个UIView 里面有一个UILabel 现在我想复制UIView 里面有标签但不知何故之后我可能需要对标签进行更改例
Vue.JS 倒计时不起作用

我有一个 vue 应用程序但倒计时效果不好其实我不知道为什么 View parent timer 我看到了很好的价值视图数据 data function return timer 3 这是我的倒计时功能 countdown funct
检查 windows/page/document/iframe 是否有焦点

我已经问过类似的问题但我需要它来解决更具体的情况所以我决定提出一个新问题以免混淆检查窗口是否有焦点 https stackoverflow com questions 17389280 check if window has foc
确保一次仅运行一个 setTimeout（处于活动状态）？

递归setTimeout函数 getRandomProducts 被调用onload在html body标签中如此不断地迭代正在调用函数 setCategoryTreeonclick来自导航栏嵌套 ul 中的链接然后该函数将变量 m
图像处理中的联合直方图和边缘直方图是什么？

什么是图像处理中的联合直方图和边缘直方图它们如何工作以及如何构建联合直方图和边缘直方图如果可能的话提供简单的示例例如如果我有 10 个维度的特征空间并且想要构建一个直方图每个维度量化为 20 个值如何计算联合直方图和边缘直方
gem 已安装，但“rails”命令不起作用

当我运行任何 Rails 命令时例如rails s我收到以下错误在任何来源中均找不到 diff lcs 1 1 2 尝试跑步bundle install 不过我已经安装了 diff lcs 捆绑显示 diff lcs opt loca
为什么使用 SpringJUnit4ClassRunner/MySQL/Spring/Hibernate 时事务不回滚

我正在进行单元测试我希望提交给 MySQL 数据库的所有数据都将被回滚但事实并非如此尽管我的日志显示正在发生回滚但数据正在提交我已经为此奋斗了几天所以我的设置发生了很大变化这是我当前的设置登录DAOTest java Run
C++ 中紧密耦合的并行类层次结构

对于上下文我正在研究 C 人工生命系统 http github com taliesinb floatworld 涉及由循环神经网络控制的代理但细节并不重要我需要将代理的大脑和身体的两个对象层次结构分开我想要各种不同的大脑和
抛出新的异常最佳实践[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 以下是好的做法吗如果不是应该做什
如何使用 .NET / GDI+ 禁用子采样？

我正在尝试使用 Bitmap 类保存 JPEG 图像我注意到无论我指定的质量级别如何锐利的边缘总是模糊的我发现这是由于一个或多个通道的二次采样造成的如何在保存图像时禁用子采样我目前正在使用这段代码 EncoderParameter
在“世界风”中单击时禁用地球仪移动

我正在尝试在世界风中单击鼠标禁用地球仪的移动我期望能够做到 void disableGlobeDrag WorldWindowGLCanvas ww ww addMouseMotionListener new MyMouseMotio
获取 S&P 500 股票代码列表

所以我用这个在 Python for Finance 上它总是给我错误 1 line 22 in

获取 S&P 500 股票代码列表

获取 S&P 500 股票代码列表 的相关文章

随机推荐

热门标签

获取 S&P 500 股票代码列表的相关文章