我正在尝试从路透社 (@reuters) 推特帐户下载 2019 年 11 月的推文。
我在 python 上使用 tweepy,这是我的代码:
pip install tweepy
import tweepy as tw
#Keys
consumer_key = "..."
consumer_secret = "..."
access_token = "..."
access_token_secret = "..."
# Login
auth = tw.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tw.API(auth, wait_on_rate_limit=True)
#Get user's tweets
tweets = tw.Cursor(api.user_timeline,
id="reuters",
lang="en",
since="2019-11-01",
until="2019-11-30").items()
all_tweets = [tweet.text for tweet in tweets]
all_tweets[:100]
“直到”参数似乎不起作用,因为我的代码提取的推文包括最新的推文。
tweepy 库仅支持 Twitter 的较旧版本标准搜索API此时,标准搜索仅涵盖7天的历史记录。为了搜索早至 2019 年 11 月的内容,您需要使用高级完整存档搜索 API 或企业完整存档搜索。这些 API 都是商业的,但高级 API 有一个名为“沙盒”的免费层,也可以使用。在 Python 中,您可以使用搜索推文库.
其他答案中提到的时间线方法也是一种选择,但这取决于 11 月以来的推文是否在时间线 API 的范围内,该 API 支持从今天起最多 3200 条推文。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)