如何使用curl解码“Content-Encoding：gzip，gzip”？

2024-02-10

我正在尝试使用以下代码使用 CURL 解码网页 www.dealstan.com：

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url); // Define target site
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); // Return page in string
curl_setopt($cr, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533.2 (KHTML, like Gecko) Chrome/5.0.342.3 Safari/533.2');
curl_setopt($ch, CURLOPT_ENCODING , "gzip");     
curl_setopt($ch, CURLOPT_TIMEOUT,5); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE); // Follow redirects

$return = curl_exec($ch); 
$info = curl_getinfo($ch); 
curl_close($ch); 

$html = str_get_html("$return");
echo $html;

但是，它显示出一些垃圾特征

“��}{w�6��9�X�n��......”约 100 行。

我试图在 hurl.it 中找到响应，发现一个有趣的点，看起来 html 被编码了两次（只是猜测，基于响应）

找到下面的回复：得到http://www.dealstan.com/ http://www.dealstan.com/

200 正常 18.87 kB 490 毫秒查看请求查看响应标头

缓存控制：max-age=0，无缓存

Cf 射线：18be7f54f8d80f1b-IAD

连接：保持活动状态

内容编码：gzip，gzip ==============>？怀疑这个，有人知道吗？

内容类型：text/html；字符集=UTF-8

日期：2014 年 11 月 19 日星期三 18:33:39 GMT

服务器：cloudflare-nginx

设置 Cookie：__cfduid=d1cff1e3134c5f32d2bddc10207bae0681416422019；过期=2015 年 11 月 19 日星期四 18:33:39 GMT；路径=/；域名=.dealstan.com；仅HTTP

传输编码：分块

变化：接受编码

X 页面速度：1.8.31.2-3973

X-回拨：http://www.dealstan.com/xmlrpc.php http://www.dealstan.com/xmlrpc.php

X-Powered-By：HHVM/3.2.0 身体视图原始

H4sIAAAAAAAAA5V8Q5AoWrBk27Ztu/u2bdu2bdu2bdu2bds2583f/pjFVOQqozZnUxkVJ7PwoyAA/qeAb3y83LbYHs/3Hv79wKm/2N5cZyJVtCWu1xyteyzLNqYuWbdtHeELCyIZRRp/1Fe7 es3+wL3Vfb

任何人都知道如何使用标题“Content-Encoding：gzip，gzip”解码响应，

该网站可以在 Firefox、Chrome 等中正确加载，但是我无法使用 CURL 进行解码。

请帮我解码这个问题？

您可以通过修剪标题并使用 gzinflate 对其进行解码。

$url = "http://www.dealstan.com"

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url); // Define target site
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); // Return page in string
curl_setopt($cr, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533.2 (KHTML, like Gecko) Chrome/5.0.342.3 Safari/533.2');
curl_setopt($ch, CURLOPT_ENCODING, "gzip");     
curl_setopt($ch, CURLOPT_TIMEOUT, 5); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE); // Follow redirects

$return = curl_exec($ch); 
$info = curl_getinfo($ch); 
curl_close($ch); 

$return = gzinflate(substr($return, 10));
print_r($return);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

html

cURL

Nginx

gzip

如何使用curl解码“Content-Encoding：gzip，gzip”？的相关文章

项目链接在 Wamp 服务器上不起作用

我正在另一台计算机上安装 Wamp 服务器来运行中型数据库和 UI 我已成功阻止 IIS 并将服务器路由到 Localhost 8080 但是每当我尝试从 localhost 主页访问我的项目时在 www 文件中我被重定向到页面未找到错
在 PHP 中使用可变变量是不好的做法吗？

例如一个简单的MVC类型系统 api class method使用重写为 PHP 变量 htaccess nginx conf 然后做类似的事情
json_decode 到自定义类

是否可以将 json 字符串解码为 stdClass 以外的对象不是自动的但你可以按照老式的路线来做 data json decode json true class new Whatever foreach data as key g
使用活动目录对 Intranet 站点上的用户进行身份验证

我建立了一个内联网站点它有自己的登录系统用户注册为新用户并使用其上的用户名密码登录该站点但是现在我想扩展它让 Intranet 站点使用现有的 ActiveDirectory 进行身份验证这就是我正在寻找的前进当用户
FPM 与 apache2 无法工作（权限被拒绝）

我正在尝试使用 apache fastcgi 和 fpm 设置一个 Debian Web 服务器但我越来越恼火一旦我停用 mod php 我就会收到以下错误 2014 年 5 月 22 日星期四 12 16 10 错误客户端 xxx
如何使用 PATCH 更新简单的数据库字段？

我是 php 和 API 的新手我正在尝试学习这些方法但我无法执行 PATCH 或 PUT 来更新我的简单 mysql 数据库我使用了以下代码 if isset PATCH con mysqli connect localhost r
我应该在 Symfony 中哪里放置既不是控制器也不是模型的类？

对于我的应用程序包我需要一些既不是控制器也不是模型的类例如我想要一个scorecard具有诸如技能效率美丽等成员的类此外它可能具有诸如 meanScore 之类的成员方法 getters 这样的类在 Symfony 框架中
使用 VSCode 的 EJS 文件缩进错误

我在 VSCode 上遇到 EJS 文件问题每次保存文件时格式化程序都会应用错误的缩进在每个 EJS 标识符下方下一行向右移动缺少正确的垂直对齐我使用 ejs 的 HTML 格式并安装了 DigitalBrainstem 的 E
如何使用 Spring Boot 传输音频

我想让用户能够播放声音我的实现在 Firefox 上运行良好在 Safari 上不播放声音我验证了音频控制可以在 Safari 中与其他网站一起使用所以我认为我必须更改控制器中的某些内容控制器 RequestMapping v
django 模板上的 vscode html 自动套用格式

我喜欢 VSCode 的保存自动格式功能直到它弄乱了我的模板代码它错误地将我的 django 模板语法格式化为一行代码有时非常长的一行所以不用这段代码 for row in ABCDEFGH tr for col in 123456
php - 重定向ajax请求[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何在 php wordpress 中重定向 ajax 请求 I tried header Location http redirect
安全地评估简单的数学

我想知道是否有一种安全的方法来评估数学例如 2 2 10000 12000 10000 20 2 2 40 20 23 12 无需使用eval 因为输入可以来自任何用户我需要实现的只是整数的加法和减法是否有任何已经存在的代码片段或者
将默认搜索文本添加到搜索框 html

我正在努力将搜索文本添加到搜索框我正在努力实现 onfocus 消失文本 And onblur 重新出现文本到目前为止我已经实现了这一点但我必须将其硬编码为 html eg
如何在 HTML 中将文本设置为粗体？

我正在尝试使用 HTML 将一些文本加粗但我很难让它发挥作用这就是我正在尝试的 Some
MVC 框架中的缓存策略？

我编写了自己的小型 PHP MVC 框架现在正在探索 PHP MVC 框架中的缓存策略我正在考虑可以缓存什么在哪里以及如何缓存我的框架是简单的MVC框架我有前端控制器它启动应用程序注册类自动加载设置 php 运行时指令最后
如何在 CSS 中将容器内的多个 div 居中

我正在测试像 Windows Metro 风格的中心分隔线 container height 300px width 70 background EEE margin 10px auto position relative block ba
如何使用 Django (Python) 登录表单？

我在 Django 中构建了一个登录表单现在我遇到了路由问题当我选择登录按钮时表单不会发送正确的遮阳篷我认为前端的表单无法从查看 py 文件所以它不会发送任何 awnser 并且登录过程无法工作该表单是一个简单的静态 html
HTML5 地理定位 - 在 iOS 上无法始终工作

目前正在使用 HTML5 地理定位我已经在所有网络浏览器上测试了它它似乎工作正常然而当我在 iPad 上测试地理定位时它在 iPad mini 上始终有效但当我将其放在更大的 iPad iPad 2 上时位置似乎并不总是有效
如何强制下载图片？

我的页面上有一个动态生成的图像如下所示 img src 我不想告诉我的用户右键单击图像并点击保存而是想公开一个下载链接单击该链接将提示下载图像如何实现这一目标最初我在 js 中尝试这样做 var path my image att
将 Hbase 与 PHP 集成 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我已经安装了 Hbase 现在我正在寻找一些 PHP 库来将 hbase 与 PHP 集成我尝试了 2 个库第一个是我尝试与 th

随机推荐

在访问外部Web服务之前获取代理配置（.NET 2.0）

当尝试调用外部 Web 服务通过互联网上的方法时它抛出了我远程服务器返回错误 407 需要代理身份验证为了解决这个问题我使用以下代码来设置我们在办公室使用的代理 Set the system proxy with valid s
更新+使用（行锁）+ CTE

我找不到任何有关 T SQL 语句语法的文档我需要做一个WITH ROWLOCK CTE 结果更新像这样的东西所以更新后将是top1000 table1 col2 声明WITH ROWLOCK 在更新 table1 的行期间至关重要
如何将对子模块所做的更改的提交推送到主 git 存储库中？

我决定将我的应用程序存储库从 SVN 切换到 git 我的回购结构是这样的 AndroidStudioProjects MyMine tree L 1 ActionBarSherlock Android Universal Image Lo
存储8个整数的avx2指令是什么？

我想存储a中的8个整数 m256i变量为 8 x 32 位数组ints 我认为这方面的说明是 mm256 store epi32 但我收到一条错误消息该指令甚至不存在看看根据您的目的地是否一致您需要 or
寻找橄榄球联赛中连续获胜次数最多的次数

假设橄榄球联赛的结果是由这种数据给出的 Date Round Home Team Visitor Team Result 18 10 2018 1 ABC XYZ 30 20 18 10 2018 1 PQR ABC 13 12 有人可以阐
Flutter Firebase Google 登录无法正常工作。选择账户后停止

我目前正在尝试在我的应用程序中实现谷歌登录和身份验证我已经建立了一个项目并在 Firebase 中创建了一个应用程序将 google services json 放入应用程序中将必要的插件添加到 build gradle 并在 fir
使用 conv1D “检查输入时出错：期望 conv1d_input 有 3 个维度，但得到形状为 (213412, 36) 的数组”

我的输入只是一个 csv 文件237124行和37列首先36列作为特征 The last列是一个二进制类标签我正在尝试在 conv1D 模型上训练我的数据我尝试过建立一个一层 CNN 但我有一些问题编译器输出 ValueError
如何从cmd永久更新系统PATH变量？

我们可以用setx正如所讨论的here https stackoverflow com a 10411111 248616 setx PATH PATH C Something bin 但此命令只能更改为用户 PATH 变量而不是系统变量
是否可以从 .NET 中的动态方法调用内部方法？

我正在尝试从动态生成的方法调用内部方法 il代码很简单 ldarg 0 callvirt ret 执行该方法失败并出现 TypeLoadException 表示无法加载定义内部方法的类型当我想到这一点时这似乎是合乎逻辑的因为动态方法
WebKit 的类似 MDC（Mozilla 文档中心）资源？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案使用最新的 HTML5 功能感觉不错但最终往往会很麻烦因为标准及其浏览器特定的实现不断发展 Moz
如何在特定点暂停协程

我对以下问题感到不知所措我有以下代码 val parentJob Job Job launch parent parentJob while true if parentJob isCompleted I want to control
函数/类中全局变量的最佳方法是什么？ PHP

我的问题与 MySQL 的连接太多因为我为每个函数创建了一个新对象那需要它此操作的最佳解决方案是什么还有其他方法吗 db connection PDO 1 function test GLOBALS db gt prepare 2
Clang -fPIC 编译器选项解释

有人可以解释一下 fPIC 选项的作用吗我似乎找不到它的参考资料但我已经看到它在使用中我相信它与可执行文件将使用的内存分配空间有关但希望有更具体的东西 Cheers Nap 这些是您正在寻找的参考资料 https gcc gnu
如何从 YAML 构建管道访问 VSTS 变量组？

我目前正在将 VSTS 构建管道转换为YAML 构建定义 https github com Microsoft vsts agent blob master docs preview yamlgettingstarted md 但是我还找不
如何实现自定义std::streambuf的seekoff()？

我有以下基于例如的实现这个问题和答案 https stackoverflow com questions 6763646 istreamtellg returns 1 when used with my custom streambuf c
从一个 Web API 控制器访问另一个 Web API 控制器

我有两个 Web API 控制器 PageController and BlogController 它们包含用于创建页面和博客的简单内容每次创建博客时我都需要创建一个页面但反之则不然这样做的最好方法是什么我觉得如果我继承的话我
如何在 Bash 中像拉链一样合并两个数组？

我正在尝试以类似拉链的方式将两个数组合并为一个数组我很难做到这一点 array1 one three five seven array2 two four six eight 我尝试过嵌套 for 循环但无法弄清楚我不希望输出为 13
控制器外部的 Spring 异常处理程序

In ControllerAdvice类我有一个 ExceptionHandler 这个处理程序可以很好地处理控制器错误但如果我有一个过滤器它们就无法处理异常我该如何处理这些异常过滤器是 public class AuthFilte
python 3 中 math.isnan 、numpy.isnan 和 pandas.isnull 之间有什么区别？

A NaN类型为decimal Decimal的原因 math isnan 返回 True numpy isnan 抛出 TypeError 异常 pandas isnull 返回 False math isnan numpy isnan
如何使用curl解码“Content-Encoding：gzip，gzip”？

我正在尝试使用以下代码使用 CURL 解码网页 www dealstan com ch curl init curl setopt ch CURLOPT URL url Define target site curl setopt ch C

如何使用curl解码“Content-Encoding：gzip，gzip”？

如何使用curl解码“Content-Encoding：gzip，gzip”？ 的相关文章

随机推荐

热门标签

如何使用curl解码“Content-Encoding：gzip，gzip”？的相关文章