以编程方式登录网站的技术

2024-04-20

我正在尝试自动登录 Photobucket 以供 API 使用，用于需要使用存储的凭据自动下载照片的项目。

API 生成一个用于登录的 URL，并且使用 Firebug 我可以查看正在发送/接收的请求和响应。

我的问题是，如何使用 HttpWebRequest 和 HttpWebResponse 来模拟 C# 中浏览器中发生的情况？

是否可以在 C# 应用程序中使用 Web 浏览器组件，填充用户名和密码字段并提交登录？

我以前做过这种事情，最终得到了一个很好的工具包来编写这些类型的应用程序。我已经使用这个工具包来处理重要的来回网络请求，所以这是完全可能的，而且并不是非常困难。

我很快发现这样做HttpWebRequest/HttpWebResponse从头开始确实比我想要处理的级别要低。我的工具完全基于Html敏捷包 http://www.codeplex.com/htmlagilitypack作者：西蒙·穆里埃。这是一个优秀的工具集。它为您完成了很多繁重的工作，并对获取的 HTML 进行解析really简单的。如果您可以使用 XPath 查询，那么 HtmlAgilityPack 就是您想要开始的地方。它也能很好地处理格式不良的 HTML！

您仍然需要一个好的工具来帮助调试。除了调试器中的内容之外，能够检查在网络上来回传输的 http/https 流量是无价的。由于您的代码将发出这些请求，而不是您的浏览器，因此 FireBug 对调试您的代码不会有太大帮助。有各种各样的数据包嗅探器工具，但对于 HTTP/HTTPS 调试，我认为您无法超越其易用性和强大功能提琴手2 http://www.fiddler2.com/fiddler2/。最新版本甚至还附带了一个 Firefox 插件，可以通过 fiddler 快速转移请求并返回。因为它还可以充当无缝 HTTPS 代理，所以您也可以检查您的 HTTPS 流量。

尝试一下，我相信它们将成为您黑客攻击中不可或缺的两个工具。

Update:添加了以下代码示例。这是从一个不太大的“Session”类中提取的，该类登录到网站并为您保留相关的 cookie。我选择它是因为它不仅仅是一个简单的“请为我获取该网页”代码，而且它还具有针对最终目标页面的一两行 XPath 查询。

public bool Connect() {
   if (string.IsNullOrEmpty(_Username)) { base.ThrowHelper(new SessionException("Username not specified.")); } 
   if (string.IsNullOrEmpty(_Password)) { base.ThrowHelper(new SessionException("Password not specified.")); }

   _Cookies = new CookieContainer();
   HtmlWeb webFetcher = new HtmlWeb();
   webFetcher.UsingCache = false;
   webFetcher.UseCookies = true;

   HtmlWeb.PreRequestHandler justSetCookies = delegate(HttpWebRequest webRequest) {
      SetRequestHeaders(webRequest, false);
      return true;
   };
   HtmlWeb.PreRequestHandler postLoginInformation = delegate(HttpWebRequest webRequest) {
      SetRequestHeaders(webRequest, false);

      // before we let webGrabber get the response from the server, we must POST the login form's data
      // This posted form data is *VERY* specific to the web site in question, and it must be exactly right,
      // and exactly what the remote server is expecting, otherwise it will not work!
      //
      // You need to use an HTTP proxy/debugger such as Fiddler in order to adequately inspect the 
      // posted form data. 
      ASCIIEncoding encoding = new ASCIIEncoding();
      string postDataString = string.Format("edit%5Bname%5D={0}&edit%5Bpass%5D={1}&edit%5Bform_id%5D=user_login&op=Log+in", _Username, _Password);
      byte[] postData = encoding.GetBytes(postDataString);
      webRequest.ContentType = "application/x-www-form-urlencoded";
      webRequest.ContentLength = postData.Length;
      webRequest.Referer = Util.MakeUrlCore("/user"); // builds a proper-for-this-website referer string

      using (Stream postStream = webRequest.GetRequestStream()) {
         postStream.Write(postData, 0, postData.Length);
         postStream.Close();
      }

      return true;
   };

   string loginUrl = Util.GetUrlCore(ProjectUrl.Login); 
   bool atEndOfRedirects = false;
   string method = "POST";
   webFetcher.PreRequest = postLoginInformation;

   // this is trimmed...this was trimmed in order to handle one of those 'interesting' 
   // login processes...
   webFetcher.PostResponse = delegate(HttpWebRequest webRequest, HttpWebResponse response) {
      if (response.StatusCode == HttpStatusCode.Found) {
         // the login process is forwarding us on...update the URL to move to...
         loginUrl = response.Headers["Location"] as String;
         method = "GET";
         webFetcher.PreRequest = justSetCookies; // we only need to post cookies now, not all the login info
      } else {
         atEndOfRedirects = true;
      }

      foreach (Cookie cookie in response.Cookies) {
         // *snip*
      }
   };

   // Real work starts here:
   HtmlDocument retrievedDocument = null;
   while (!atEndOfRedirects) {
      retrievedDocument = webFetcher.Load(loginUrl, method);
   }


   // ok, we're fully logged in.  Check the returned HTML to see if we're sitting at an error page, or
   // if we're successfully logged in.
   if (retrievedDocument != null) {
      HtmlNode errorNode = retrievedDocument.DocumentNode.SelectSingleNode("//div[contains(@class, 'error')]");
      if (errorNode != null) { return false; }
   }

   return true; 
}


public void SetRequestHeaders(HttpWebRequest webRequest) { SetRequestHeaders(webRequest, true); }
public void SetRequestHeaders(HttpWebRequest webRequest, bool allowAutoRedirect) {
   try {
      webRequest.AllowAutoRedirect = allowAutoRedirect;
      webRequest.CookieContainer = _Cookies;

      // the rest of this stuff is just to try and make our request *look* like FireFox. 
      webRequest.UserAgent = @"Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.3) Gecko/20070309 Firefox/2.0.0.3";
      webRequest.Accept = @"text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5";
      webRequest.KeepAlive = true;
      webRequest.Headers.Add(@"Accept-Language: en-us,en;q=0.5");
      //webRequest.Headers.Add(@"Accept-Encoding: gzip,deflate");
   }
   catch (Exception ex) { base.ThrowHelper(ex); }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

以编程方式登录网站的技术的相关文章

EF Core Group By 翻译支持条件总和

听说 EF Core 2 1 将支持翻译小组我感到非常兴奋我下载了预览版并开始测试它但发现我在很多地方仍然没有得到翻译分组在下面的代码片段中对 TotalFlagCases 的查询将阻止翻译分组工作无论如何我可以重写这个以便我
通过 CMIS (dotCMIS) 连接到 SP2010：异常未经授权

我正在使用 dotCMIS 并且想要简单连接到我的 SP2010 服务器我尝试用 C 来做到这一点如下所示http chemistry apache org dotnet getting started with dotcmis htm
为什么两个不同的 Base64 字符串的转换会返回相等的字节数组？

我想知道为什么从 base64 字符串转换会为不同的字符串返回相同的字节数组 const string s1 dg const string s2 dq byte a1 Convert FromBase64String s1 byte a2
秒表有最长运行时间吗？

多久可以Stopwatch在 NET 中运行如果达到该限制它会回绕到负数还是从 0 重新开始 Stopwatch Elapsed返回一个TimeSpan From MSDN https learn microsoft com en us
用于检查类是否具有运算符/成员的 C++ 类型特征[重复]

这个问题在这里已经有答案了可能的重复是否可以编写一个 C 模板来检查函数是否存在 https stackoverflow com questions 257288 is it possible to write a c template
嵌套接口：将 IDictionary> 转换为 IDictionary>？

我认为投射一个相当简单IDictionary
类模板参数推导 - clang 和 gcc 不同

下面的代码使用 gcc 编译但不使用 clang 编译 https godbolt org z ttqGuL template
从Web API同步调用外部api

我需要从我的 Web API 2 控制器调用外部 api 类似于此处的要求使用 HttpClient 从 Web API 操作调用外部 HTTP 服务 https stackoverflow com questions 13222998
如何从 appsettings.json 文件中的对象数组读取值

我的 appsettings json 文件 StudentBirthdays Anne 01 11 2000 Peter 29 07 2001 Jane 15 10 2001 John Not Mentioned 我有一个单独的配置类 p
关于 C++ 转换：参数 1 从“[some_class]”到“[some_class]&”没有已知的转换

我正在研究 C 并且遇到了一个错误我不知道确切的原因我已经找到了解决方案但仍然想知道原因 class Base public void something Base b int main Base b b something Base
堆栈溢出：堆栈空间中重复的临时分配？

struct MemBlock char mem 1024 MemBlock operator const MemBlock b const return MemBlock global void foo int step 0 if ste
使用 WebClient 时出现 System.Net.WebException：无法创建 SSL/TLS 安全通道

当我执行以下代码时 System Net ServicePointManager ServerCertificateValidationCallback sender certificate chain errors gt return t
使用 Bearer Token 访问 IdentityServer4 上受保护的 API

我试图寻找此问题的解决方案但尚未找到正确的搜索文本我的问题是如何配置我的 IdentityServer 以便它也可以接受授权带有 BearerTokens 的 Api 请求我已经配置并运行了 IdentityServer4 我还在
SolrNet连接说明

为什么 SolrNet 连接的容器保持静态这是一个非常大的错误因为当我们在应用程序中向应用程序发送异步请求时 SolrNet 会表现异常在 SolrNet 中如何避免这个问题 class P static void M string
控件的命名约定[重复]

这个问题在这里已经有答案了 Microsoft 在其网站上提供了命名指南 here http msdn microsoft com en us library xzf533w0 VS 71 aspx 我还有框架设计指南一书我找不到有关
链接器错误：已定义

我尝试在 Microsoft Visual Studio 2012 中编译我的 Visual C 项目使用 MFC 但出现以下错误 error LNK2005 void cdecl operator new unsigned int 2
如何在Xamarin中删除ViewTreeObserver？

假设我需要获取并设置视图的高度在 Android 中众所周知只有在绘制视图之后才能获取视图高度如果您使用 Java 有很多答案最著名的方法之一如下取自这个答案 https stackoverflow com a 24035591
测试用例执行完成后，无论是否通过，如何将测试用例结果保存在变量中？

我正在使用 NUNIT 在 Visual Studio 中使用 Selenium WebDriver 测试用例的代码是我想在执行测试用例后立即在变量中记录测试用例通过或失败的情况我怎样才能实现这一点 NUnit 假设您使用 NUnit
是否可以在 .NET Core 中将 gRPC 与 HTTP/1.1 结合使用？

我有两个网络服务 gRPC 客户端和 gRPC 服务器服务器是用 NET Core编写的然而客户端是托管在 IIS 8 5 上的 NET Framework 4 7 2 Web 应用程序所以它只支持HTTP 1 1 https le
如何在文本框中插入图像

有没有办法在文本框中插入图像我正在开发一个聊天应用程序我想用图标图像更改值等但我找不到如何在文本框中插入图像 Thanks 如果您使用 RichTextBox 进行聊天请查看Paste http msdn microsoft co

随机推荐

单击由 div 使用 JavaScript 制作的按钮？

在 Google 中用于发表评论的按钮是由 div 制成的 div class d s r tk3N6e e tk3N6e e qc Post comment div 我想我可以点击它 document getElementById 1v
assertRaises 失败，即使可调用也会引发所需的异常（python，unittest）

我有以下测试代码检查函数中引发的异常我希望测试能够通过但是却显示失败这是测试代码 import unittest define a user defined exception class MyException Exception
在 Android 上使用 SQLite 的 AUTOINCREMENT 的开销是多少？

在 SQLite 文档中它包括以下内容 AUTOINCRMENT 关键字会施加额外的 CPU 内存磁盘空间和磁盘 I O 开销如果不是严格需要的话应该避免这是通常不需要 and AUTOINCRMENT 关键字实现的行为巧妙地
使用 Application Load Balancer 在 aws ECS 上进行服务发现

我想问一下您是否有一个微服务架构基于Spring Boot 涉及Amazon Elastic Container Service ECS 和Application Load Balancer ALB 服务发现是由平台自动执行的还是需要
如何在 Spring MVC 控制器中应用 Spring Data 投影？

是否可以指定projection当直接调用数据存储库方法时这是存储库代码请注意我不想通过 REST 公开它而是希望能够从服务或控制器调用它 RepositoryRestResource exported false public i
Jquery caroufredsel 脚本错误“不是函数”

正在研究一个轮播灯箱工具提示 http caroufredsel frebsite nl examples carousel lightbox tooltip php演示据我所知jsfiddle http jsfiddle net s39
什么类型提示同时包含列表和元组？

我有一个函数可以接受任何可以索引的变量作为输入例如列表或元组如何在函数的类型提示中指出这一点你的方法正在接受sequence https docs python org 3 glossary html term sequence 所以
将多个参数传递给 std::thread

我问的是
在 C# 中从 SQL 数据库读取 DateTime 值时没有毫秒值

我在 SQL 服务器中存储了高精度日期例如 2009 09 15 19 43 43 910 但是当我将该值转换为 DateTime 毫秒值时结果 DateTime 值是 0 reader Timestamp 15 09 2009 19
类型提示闭包参数

通过 PHP 中的类型提示是否可以对闭包的参数进行类型提示例如 function some function Closure
23,148,855,308,184,500 是一个神奇的数字，还是纯粹的偶然？

Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动新闻报道如this one http news bbc co uk 1 hi world am
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
如何在 Recompose 中使用 withHandlers 将引用添加到功能组件并在 ScrollView 上调用 ScrollTo？

我的具体目标是使用滚动到方法 http facebook github io react native docs scrollview html methodsScrollView 的但保持功能组件结构更一般地说这需要获取对当前组件的引
psql：符号查找错误：psql：未定义符号：PQsetErrorContextVisibility

我将 postgres 版本从 9 2 24 切换到 9 6 因为我需要 jsonb 兼容性以及其他最新功能我在 centos 7 上运行虚拟机我决定擦除所有现有的 postgres 实例因为它是临时的所以几乎是空的然后安装了 9
签名者无效错误

我为应用程序商店发行版构建但是当尝试在设备上而不是开发中测试它时它给出以下警告应用程序 myapp 未安装在 iPhone 用户的 iPhone 上因为签名者无效任何解决这个问题的建议此致当您想要测试应用程序的生产版本而
Unity 协程在后台停止

我的问题如下目前我在 Android iOS 游戏中运行了几个协程但是当我将游戏发送到后台以便用手机尝试其他操作时这些协程会停止只有在我返回游戏后才恢复有什么办法可以让协程在游戏在后台时继续运行吗 Android 将按设计暂停您的
官方 Tensorflow 文档有 pdf 格式吗？（运行Windows）

我无法找到 Tensorflow 的 pdf 格式文档 API 或教程我指的是官方文档而不是要求书籍推荐具体为pdf格式供离线本地参考和学习一个问题是我运行的是 Windows 因此用于创建的可用工具集它们动态地受到限制或与通
使用 gradlew 和 gradle 的区别

使用有什么区别gradlew and gradle或者它们是相同的吗不同之处在于 gradlew表明您正在使用 gradle 包装器包装器通常是项目的一部分它有助于 gradle 的安装如果您在没有包装器的情况下使用 gradle
Request.UserHostAddress返回负载均衡器的IP地址

我的网站中有一行关键代码可以在我们的开发环境中运行但不能在生产环境中运行好吧我说它在开发中起作用但事实是它给了 1 这是 IPv6 环回地址无论如何我想要做的是捕获访问该站点的用户的 IP 地址因此我使用Request Us
以编程方式登录网站的技术

我正在尝试自动登录 Photobucket 以供 API 使用用于需要使用存储的凭据自动下载照片的项目 API 生成一个用于登录的 URL 并且使用 Firebug 我可以查看正在发送接收的请求和响应我的问题是如何使用 HttpWe

以编程方式登录网站的技术

以编程方式登录网站的技术 的相关文章

随机推荐

热门标签

以编程方式登录网站的技术的相关文章