如何在 Python BaseHTTPRequestHandler 中处理分块编码？

2024-04-02

我有以下简单的 Web 服务器，利用 Pythonhttp module:

import http.server
import hashlib


class RequestHandler(http.server.BaseHTTPRequestHandler):
    protocol_version = "HTTP/1.1"

    def do_PUT(self):
        md5 = hashlib.md5()

        remaining = int(self.headers['Content-Length'])
        while True:
            data = self.rfile.read(min(remaining, 16384))
            remaining -= len(data)
            if not data or not remaining:
                break
            md5.update(data)
        print(md5.hexdigest())

        self.send_response(204)
        self.send_header('Connection', 'keep-alive')
        self.end_headers()


server = http.server.HTTPServer(('', 8000), RequestHandler)
server.serve_forever()

当我使用curl上传文件时，效果很好：

curl -vT /tmp/test http://localhost:8000/test

因为文件大小是预先知道的，curl 将发送一个Content-Length: 5header，这样我就可以知道应该从套接字读取多少内容。

但如果文件大小未知，或者客户端决定使用chunkedTransfer-Encoding，这种方法失败了。

可以使用以下命令进行模拟：

curl -vT /tmp/test -H "Transfer-Encoding: chunked" http://localhost:8000/test

如果我从self.rfile超过该块后，它将永远等待并挂起客户端，直到它断开 TCP 连接，其中self.rfile.read将返回一个空数据，然后跳出循环。

需要什么来扩展上述示例以支持chunked也是传输编码吗？

正如您在描述中看到的传输编码 https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Transfer-Encoding，分块传输将具有以下形状：

chunk1_length\r\n
chunk1 (binary data)
\r\n
chunk2_length\r\n
chunk2 (binary data)
\r\n
0\r\n
\r\n

您只需读取一行，获取下一个块的大小，然后消耗两个二进制块and后续换行符。

这个例子将能够处理请求Content-Length or Transfer-Encoding: chunked标头。

from http.server import HTTPServer, SimpleHTTPRequestHandler

PORT = 8080

class TestHTTPRequestHandler(SimpleHTTPRequestHandler):
    def do_PUT(self):
        self.send_response(200)
        self.end_headers()

        path = self.translate_path(self.path)

        if "Content-Length" in self.headers:
            content_length = int(self.headers["Content-Length"])
            body = self.rfile.read(content_length)
            with open(path, "wb") as out_file:
                out_file.write(body)
        elif "chunked" in self.headers.get("Transfer-Encoding", ""):
            with open(path, "wb") as out_file:
                while True:
                    line = self.rfile.readline().strip()
                    chunk_length = int(line, 16)

                    if chunk_length != 0:
                        chunk = self.rfile.read(chunk_length)
                        out_file.write(chunk)

                    # Each chunk is followed by an additional empty newline
                    # that we have to consume.
                    self.rfile.readline()

                    # Finally, a chunk size of 0 is an end indication
                    if chunk_length == 0:
                        break

httpd = HTTPServer(("", PORT), TestHTTPRequestHandler)

print("Serving at port:", httpd.server_port)
httpd.serve_forever()

注意我选择继承自简单HTTP请求处理程序代替基本HTTP请求处理程序，因为那么该方法SimpleHTTPRequestHandler.translate_path()可用于允许客户端选择目标路径（这可能有用也可能没用，具体取决于用例；我的示例已经编写为使用它）。

您可以使用以下命令测试两种操作模式curl命令，正如您提到的：

# PUT with "Content-Length":
curl --upload-file "file.txt" \
  "http://127.0.0.1:8080/uploaded.txt"

# PUT with "Transfer-Encoding: chunked":
curl --upload-file "file.txt" -H "Transfer-Encoding: chunked" \
  "http://127.0.0.1:8080/uploaded.txt"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

http

chunked

如何在 Python BaseHTTPRequestHandler 中处理分块编码？的相关文章

Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

SQLAlchemy——我可以在 DDL 中将空字符串映射到 null 吗？我想要一个可为空的整数列在插入或更新时将 '' 转换为 NULL

我有一个 SQLAlchemy 模型其中有一个从 HTML 表单填充的整数列我正在使用 Flask 和 WTForms alchemy 并且我试图避免在路由中编写自定义代码如果用户没有在表单上输入该整数的值则从表单填充对象的代码最终
如何从zuul路由中排除或忽略特殊路径或路由

是否可以从 Zuul 路由中排除路径或匹配器目标是所有请求合同被路由到Contract example com 所有请求审计被路由到审计 example com 所有请求心跳 or sso 直接从 zuul 提供服务所有其他
从第三方库扩展 vue.js 组件

我正在使用 element ui 中的组件 ElDatepicker 我想更改它的模板和事件处理程序方法我正在尝试在单个文件组件中执行类似的操作 import Vue from vue import ElDatePicker from e
使用 INotifyPropertyChanged 的静态属性。 C＃

我正在尝试创建一个静态属性其中INotifyPropertyChanged将更新对 a 所做的任何更改DataGrid ComboBox我有约束力我收到这个错误错误 CS0026 关键字 this 在静态属性静态中无效方法或静态字
当 Angular 2 中的一个文件中有两个类、一个装饰器/一类两个装饰器时会发生什么？

Component selector my cmp template div Hello World div here component metadata export class MyComponent 所以上面是我实际的组件文件如
具有空值的 MongoDb 查询数组

我的收藏中有一些看起来像这样的物品 MyArray null some value null 我想查询那些具有空值作为数组元素的对象查询 db collection find MyArray null 不起作用它似乎只找到 MyArra
在 emacs 中创建别名？

我有一个 emacs 副本可以从拇指驱动器在几台不同的 Windows 计算机上使用我想知道是否可以在 emacs 中创建类似于 bash 别名或符号链接的东西我可以在 find file 中使用的东西是我正在寻找的主要内容例如 C
Django 开发服务器错误：找不到图像

尝试运行 Django 开发服务器时出现以下错误我使用的是 OS X 10 8 我还使用 virtualenv 系统安装包 django env Glyns iMac Ares Glyn sudo python manage py run
pycurl 相当于“curl --data-binary”

我想知道 pycurl 中这个curl命令的等效项 curl data binary binary data file bin http server myapp method 注意上面的curl语句使用了POST方法我需要使用它来与我
无法加载参考程序集以供执行

突然我的网站无法加载并给出以下错误我在 Windows 10 Home 上运行带有 Net Framework 4 7 1 的 VS2017 BadImageFormatException Cannot load a reference
“docker images”显示图像，“docker rmi”表示“没有这样的图像”或“引用不存在”

由于某些原因我无法删除 docker 镜像这是输出操作系统版本 Linux localhost localdomain 4 12 13 300 fc26 x86 64 1 SMP Thu Sep 14 16 00 38 UTC 2017
django 模型中的星期几表示

我正在构建这个作业服务器模型我想添加一个字段来保存该作业将在一周中的哪几天运行最终在用户界面中我希望用户能够拥有一系列可以选择的复选框每天一个在我的模式中表示一周中的几天数据的最佳方式是什么 class Job model
如何设置Robots.txt或Apache仅在特定时间允许爬虫？

由于 24 小时内流量分布不均匀我希望在高峰时段禁止爬虫在非繁忙时段允许爬虫有没有一种方法可以实现这一目标编辑感谢所有的好建议这是我们找到的另一个解决方案 2bits com 有一篇关于设置 IPTables 防火墙以限制来自某
更新 appSettings 外部 web.config 中的变量

我需要更新 Azure TFS 中 web config 中的值我能够获取连接字符串替换的值该值是 appSettings 的一部分为此我需要启用名为 XML 变量替换的设置在 IIS Web 部署下但是 web config
字符显示/搜索 Unicode 字符

在回答另一个问题时question https stackoverflow com q 18686199 418556关于这些部分我对系统上可用字体显示的 Unicode 字符可能获得的字形感到好奇当然典型的机器上有 65 536 个
无法通过ajax将javascript对象传递给php

我在 javascript 中创建了一个新数组我从一个函数向其索引添加值然后将数组传递给 ajaxCall 函数如果我尝试将其转换为 json 并通过 ajax 将其发送到 php 文件但是变量 json 始终为空我已经阅读了很多
恢复小备份时磁盘空间不足

我正在尝试从 32MB 备份恢复数据库我的磁盘上有 6GB 可用空间当我尝试恢复备份时它显示磁盘空间不足错误 32MB 的备份怎么可能需要超过 6GB 的磁盘空间可能是因为备份被压缩或者因为有一个非常大的日志文件不需要成为备份本身
UIScrollView - (bounces = NO) 似乎覆盖 (pagingEnabled = YES)

我有一个带有分页功能的 UIScrollView 因此带有 UIPageControl 并在页面之间左右拖动轻拂的典型模型并且我的工作正常奇怪的是当我想摆脱弹跳这样就看不到左右两侧UI后面的黑色时突然分页不再起作用了换句话说
在 Storyboard 中实现视频视图

我想构建简单的视频应用程序可以查看用户添加的 YouTube 链接中的视频我没有找到 VideoView 我的意思是如果图像视图用于图像那么 UIView 用于视频原库中没有执行视频观看功能的对象但你可以导入MediaPlayer
如何在 Python BaseHTTPRequestHandler 中处理分块编码？

我有以下简单的 Web 服务器利用 Pythonhttp module import http server import hashlib class RequestHandler http server BaseHTTPRequestH

如何在 Python BaseHTTPRequestHandler 中处理分块编码？

如何在 Python BaseHTTPRequestHandler 中处理分块编码？ 的相关文章

随机推荐

热门标签

如何在 Python BaseHTTPRequestHandler 中处理分块编码？的相关文章