使用 Python 列出在线目录中的所有文件？

2023-11-30

你好，我只是想知道我正在尝试创建一个从互联网下载文件的Python应用程序，但目前它只下载一个我知道的名称的文件...有什么方法可以获取文件列表在线目录并下载它们？我将向您展示我一次下载一个文件的代码，这样您就知道我不想做什么。

import urllib2

url = "http://cdn.primarygames.com/taxi.swf"

file_name = url.split('/')[-1]
u = urllib2.urlopen(url)
f = open(file_name, 'wb')
meta = u.info()
file_size = int(meta.getheaders("Content-Length")[0])
print "Downloading: %s Bytes: %s" % (file_name, file_size)

file_size_dl = 0
block_sz = 8192
while True:
    buffer = u.read(block_sz)
    if not buffer:
        break

    file_size_dl += len(buffer)
    f.write(buffer)
    status = r"%10d  [%3.2f%%]" % (file_size_dl, file_size_dl * 100. / file_size)
    status = status + chr(8)*(len(status)+1)
    print status,

f.close()

那么它从这个网站下载taxi.swf是做什么的，但我想要它做的是将所有.swf从该目录“/”下载到计算机？

是否可能，非常感谢您。 -特瑞-

由于您尝试一次下载一堆内容，因此首先要查找站点索引或网页，其中整齐地列出了您要下载的所有内容。网站的移动版本通常比桌面版本更轻，并且更容易抓取。

这个网站正是您所寻找的：所有游戏.

现在，这真的很简单。只需提取所有游戏页面链接即可。我用美丽汤 and requests去做这个：

import requests
from bs4 import BeautifulSoup

games_url = 'http://www.primarygames.com/mobile/category/all/'

def get_all_games():
    soup = BeautifulSoup(requests.get(games_url).text)

    for a in soup.find('div', {'class': 'catlist'}).find_all('a'):
        yield 'http://www.primarygames.com' + a['href']

def download_game(url):
    # You have to do this stuff. I'm lazy and won't do it.

if __name__ == '__main__':
    for game in get_all_games():
        download_game(url)

剩下的就取决于你了。download_game()根据游戏的 URL 下载游戏，因此您必须找出游戏的位置<object>DOM 中的标签。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Download

urllib2

使用 Python 列出在线目录中的所有文件？的相关文章

下载 PyQt6 的 Qt Designer 并使用 pyuic6 将 .ui 文件转换为 .py 文件

如何下载 PyQt6 的 QtDesigner 如果没有适用于 PyQt6 的 QtDesigner 我也可以使用 PyQt5 的 QtDesigner 但是如何将此 ui 文件转换为使用 PyQt6 库而不是 PyQt5 的 py 文件
Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f

随机推荐

Spark Kafka 流媒体问题

我正在使用maven 我添加了以下依赖项
如何将两个 jquery 对象包装成一个？

我有两个功能 1 function foo elems elems each function foo selector1 selector2 calling foo 2 function bar elem1 elem2 some logi
C# WinForms - 如何将更新从 DataGridView 发送到数据库

我有一个包含客户表和代理表的 mdb 文件代理表迄今为止所做的唯一一件事就是填充每个客户的代理下拉列表我有一个链接到 customerBindingSource 的 DataGridView customerBindingSource
使用 firebase 隐藏第 3 方 API 密钥

我正在使用 firebase 构建一个网站这是一个简单的查找服务只有一个输入元素可以向第 3 方 API 发出请求 www 3rdparty com api myapikey method 问题是我每秒只能发出 x 个请求并且无法向
PHP 5.2 中的 PHP date_parse_from_format() 替代方案

由于 date parse from format 仅在 PHP 5 3 中可用因此我需要编写一个函数来模仿其在 PHP 5 2 中的行为是否可以为 PHP 5 2 编写此函数并使其以与 PHP 5 3 中完全相同的方式工作 Examp
将函数参数重新声明为变量？

我似乎无法在网络上的任何地方找到这个问题的答案将函数参数重新声明为局部变量有什么原因优点或缺点吗 Example function param1 param2 var param1 param2 etc 对我来说似乎非常多余但也许我错
xmlpullparser 的 Android dalvik 转换

我正在开发一个 Android 应用程序对于一个组件我可以在 Android 之外进行测试因为它不使用任何 Android 代码它使用 xstream 我有以下库 xstream1 4 6 xpp3 min 1 1 4c xmlpu
在运行时动态加载程序集依赖项时出现问题

让我尝试解释一下我的问题我目前正在尝试开发一个用 Net编写的小型插件框架主要是为了进行一些实验因此我们的想法是拥有一个主应用程序可以通过在主应用程序的特定文件夹插件中部署 dll 来添加插件一切工作正常插件已正确实例
具有相同 id 的多个组件在 android 中如何工作？

我定义了几种布局其中很少有 id 被多重定义我很困惑它是如何工作的为什么它不像我们在java代码中那样给出错误最重要的是环境如何决定需要调用哪个组件我知道 id 生成的过程是自动化的它被添加到 R java 中例如如果我们
如何使用云函数触发数据流？（Python SDK）

我有一个由云发布订阅触发的云函数我想要使用 Python SDK 相同的函数触发数据流这是我的代码 import base64 def hello pubsub event context if data in event mess
基于多个 OCR 软件包输出来改进 OCR 结果的软件

是否有现有的商业或学术软件可以来自多个 OCR 软件包 Abbyy FineReader Adobe Acrobat Professional ReadIris 等的叠加结果根据从多个来源积累的知识提供完全自动化的改进允许在运行时使
如何在Robot Framework中执行JavaScript

下面是我的代码当我运行它时它显示 WebDriverException 如何在 Robot Framework 中执行 JavaScript 代码 This return arguments 0 data ToolTip options
SQL Server SELECT 转 JSON 函数

我想输出一个结果SELECT语句作为 JSON 对象我希望这是一个Function而不是一个存储过程例如下表用户 id name active 1 Bob Jones 1 2 John Smith 0 会像这样返回 id 1 name
RSelenium 连接尝试产生 Java 错误

我非常感谢有关 RSelenium 的帮助 2014 年 11 月 29 日下载的 v 2 4 4 我的第一个例子是直接从线程复制的 Get Google Chromes Inspect Element into R library RSe
将字符串拆分为单个字符的字符串数组

我想要像转动一样简单的事情 this is a test into new string t h i s i s a t e s t 我真的必须做类似的事情吗 test this is a test Select x gt x ToStri
SQL Server——如何将一个多元素 XML 分解为插入表中的单元素 XML 值？

我正在与 x nodes 因为我是 XQuery 的新手我确实有 XML 变量 x构建方式如下 CREATE TABLE tab a int b int c int GO INSERT INTO tab a b c VALUES 1 11
XHR.getAllResponseHeaders() 不会按 Chrome 60 中的预期返回标头

在我们的网络应用程序中我们使用XHR getAllResponseHeaders 获取标题字段名称的函数我们使用X Access Token接收我们在下一个请求中发送的 JWT 令牌以保持会话从今天开始登录后每个下一个请求都会重定
Qt 5.0 和 c++11 与 OSX Mountain Lion

离开 7 年之后我再次尝试 c 我已经下载了新发布的适用于 osx 的 Qt 5 0 sdk 但无法获得使用 Qt Creator 编译的基本 c 11 功能以下声明 auto i 3 导致编译错误 mainwindow cpp 19
GoogleConnect.Fetch 抛出无法转换对象错误

我正在将 Google API 集成到我的项目中我正在使用以下代码来执行此操作 public void google GoogleConnect ClientId xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
使用 Python 列出在线目录中的所有文件？

你好我只是想知道我正在尝试创建一个从互联网下载文件的Python应用程序但目前它只下载一个我知道的名称的文件有什么方法可以获取文件列表在线目录并下载它们我将向您展示我一次下载一个文件的代码这样您就知道我不想做什么 import u

使用 Python 列出在线目录中的所有文件？

使用 Python 列出在线目录中的所有文件？ 的相关文章

随机推荐

热门标签

使用 Python 列出在线目录中的所有文件？的相关文章