有道翻译反反爬虫(python)

2023-05-16

有道翻译反反爬虫(python)

该博客创作于2021/6/30,之后有失效可能

作为一个初学者,花两天时间破解了有道翻译的反爬虫系统,故为之文以记之。

参考文章:博客1博客2
以上博客均已失效但有助于爬虫学习

在写代码的时候遇到了很多困难。
首先是找文件,我一个个找下来,终于发现宝藏藏在https://shared.ydstatic.com/fanyi/newweb/v1.1.6/scripts/newweb/fanyi.min.js
(也就8700多行代码)
然后又找了很久才确定重要的代码是

        i = r + parseInt(10 * Math.random(), 10);
        return {//解释一下,r是时间,e是输入的字符串
            ts: r,
            bv: t,
            //bv与登录的设备有关,照抄即可
            salt: i,
            //salt是时间后随机加了一位
            sign: n.md5("fanyideskweb" + e + i + "Tbh5E8=q6U3EXe+&L[4c@")
            //sign由MD5哈希函数生成
        }

于是用python模拟

import requests
import json
import time
import random
import hashlib
s = input("输入:")
lts = int(time.time()*1000)
salt = str(lts) + str(random.randint(1,10))
sign = hashlib.md5(("fanyideskweb" + s + salt + 'Tbh5E8=q6U3EXe+&L[4c@').encode('utf-8')).hexdigest()
url = 'https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
Form_data = {
    'i': s,'from': 'AUTO','to': 'AUTO',
    'smartresult': 'dict',
    'client': 'fanyideskweb',
    'salt': salt,
    'sign': sign,
    'lts': str(lts),
    'bv': 'aebb3706172bf86d13745c023f705992',
    'doctype': 'json',
    'version': '2.1',
    'keyfrom': 'fanyi.web',
    'action': 'FY_BY_CLICKBUTTION'
}
headers = {
    'Referer': 'https://fanyi.youdao.com/',
    'Cookie': 'OUTFOX_SEARCH_USER_ID=205296444@10.169.0.102; JSESSIONID=aaawhHcNi3nMhhZRNbCPx; OUTFOX_SEARCH_USER_ID_NCOO=565944356.2973771; fanyi-ad-id=112781; fanyi-ad-closed=1; ___rl__test__cookies=1625057652866',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'
}
response = requests.post(url,data = Form_data,headers=headers)
content = json.loads(response.text)
print(content)
print(content['translateResult'][0][0]['tgt'])

有个注意点,headers的三项不可省略

后记:做这种事最重要的是耐心,不断搜寻——模拟——找错。
不知道我这篇博客有效期多久,估计很快又会有新的系统上线。
要相信:魔高一尺,道高一丈(doge)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

有道翻译反反爬虫(python) 的相关文章

  • 用于将 cython 中的许多 C++ 类包装到单个共享对象的项目结构

    我在文档 邮件列表和这个问题在这里 https stackoverflow com questions 10300660 cython and distutils 但我想得到一个更直接的答案来解决我的具体情况 我正在通过尝试一点一点地包装我
  • 在 python 程序中合并第三方库的最佳实践是什么?

    下午好 我正在为我的工作编写一个中小型Python程序 该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库 称为CX Oracle 我正在通过版本控制系统 即CVS 开发该项目 我想知道围
  • Python 的键盘中断不会中止 Rust 函数 (PyO3)

    我有一个使用 PyO3 用 Rust 编写的 Python 库 它涉及一些昂贵的计算 单个函数调用最多需要 10 分钟 从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理 所以本质上没什么用 最小可重现示例 Ca
  • 如何在flask中使用g.user全局

    据我了解 Flask 中的 g 变量 它应该为我提供一个全局位置来存储数据 例如登录后保存当前用户 它是否正确 我希望我的导航在登录后在整个网站上显示我的用户名 我的观点包含 from Flask import g among other
  • 通过最小元素比较对 5 个元素进行排序

    我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划 除此之外 复杂性是无关紧要的 结果是一个对的列表 表示在另一时间对列表进行排序所需的比较 我知道有一种算法可以通过 7 次比较 总是在元素之间
  • 使用带有关键字参数的 map() 函数

    这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
  • 使用 matplotlib 绘制时间序列数据并仅在年初显示年份

    rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列 如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份 我怎样才能将其设置为仅在每
  • Python - StatsModels、OLS 置信区间

    在 Statsmodels 中 我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
  • Flask 会话变量

    我正在用 Flask 编写一个小型网络应用程序 当两个用户 在同一网络下 尝试使用应用程序时 我遇到会话变量问题 这是代码 import os from flask import Flask request render template
  • 从字符串中删除识别的日期

    作为输入 我有几个包含不同格式日期的字符串 例如 彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期 在下一步中 我想从字符串中删除
  • PyUSB 1.0:NotImplementedError:此平台不支持或未实现操作

    我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位 并从以下地址下载 z
  • python 相当于 R 中的 get() (= 使用字符串检索符号的值)

    在 R 中 get s 函数检索名称存储在字符变量 向量 中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数 尽管花了一些时间翻
  • 基于代理的模拟:性能问题:Python vs NetLogo & Repast

    我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型 我发现我的代码的性能比 NetLogo 慢约 3 倍 这可能是我的代码的问题 还是Python的固有限制 显然 这只是代码的一个片段 但 Python 却花费了三分
  • 从 Flask 访问 Heroku 变量

    我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
  • 如何在ipywidget按钮中显示全文?

    我正在创建一个ipywidget带有一些文本的按钮 但按钮中未显示全文 我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
  • Flask如何获取请求的HTTP_ORIGIN

    我想用我自己设置的 Access Control Allow Origin 标头做出响应 而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱 我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
  • IO 密集型任务中的 Python 多线程

    建议仅在 IO 密集型任务中使用 Python 多线程 因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权 然而 多线程对于 IO 密集型操作有意义吗 https stackoverflow c
  • 在f字符串中转义字符[重复]

    这个问题在这里已经有答案了 我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
  • Jupyter Notebook 内核一直很忙

    我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常 但是我无法运行 python 笔记本 内核被创建 它也连接 但它始终显示黑圈忙碌符号 防火墙或防病毒软件没有问题 我尝试过禁用两者 我也无法
  • 使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

    我想用Python创建不同的图形matplotlib pyplot 然后 我想将其中一些保存到文件中 而另一些则应使用show 命令 然而 show 显示all创建的数字 我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图

随机推荐

  • Git 常用命令记录

    文章目录 安装卸载配置管理不常见的使用场景Idea更新项目失败忽略文件的权限变化配置自动换行创建SSH密钥多账号ssh配置免密码登录远程服务器https协议下提交代码免密码文件推向3个git库修改远程仓库地址撤销远程记录放弃本地的文件修改最
  • Docker 学习笔记 | 常用命令

    文章目录 什么是 DockerDocker 理念能做什么Docker 基本组成 Linux 中安装CentOS 6 8 安装 DockerCentOS 7 安装 DockerDocker 中国官方镜像加速使用 registry mirror
  • Debain查看端口占用开放端口

    查看指定端口服务 查看3002被哪些服务占用 xff1a sudo lsof i 3002 关闭指定服务 xff1a kill PID 端口开放 编辑文件 xff1a vi etc nftables conf 修改内容如下 usr sbin
  • pm2命令使用

    文章目录 常用命令示例 常用命令 启动应用程序 pm2 start lt app name gt 停止应用程序 pm2 stop lt app name gt 重启应用程序 pm2 restart lt app name gt 删除应用程序
  • Markdown入门指南

    导语 一 认识Markdown 使用Markdown的优点 二 Markdown 语法 标题列表 嵌套列表 引用图片与链接 自动链接 粗体与斜体表格代码框 其它 分割线索引超链注释 转义字符段落缩进 空格 字体 字号 颜色 导语 Markd
  • Markdown进阶语法

    文章目录 markdown进阶语法内容目录加强代码块脚注流程图时序图LaTeX公式 markdown进阶语法 内容目录 使用 TOC 引用目录 xff0c 将 TOC 放至文本的首行 xff0c 编辑器将自动生成目录 有一些编辑器不支持 T
  • Maven 变量及常见插件配置详解

    一 变量 自定义变量及内置变量 1 自定义变量2 内置变量 二 常见插件配置 1 编译插件2 设置资源文件的编码方式3 自动拷贝 jar 包到 target 目录4 生成源代码 jar 包5 将项目打成 jar 包 assembly xml
  • Dos命令讲解

    一 什么是DOS二 启动DOS的多种方法 三 DOS的内部命令与外部命令四 系统环境变量讲解 增加Path环境变量路径常见的系统环境变量 五 常用的运行命令六 DOS使用技巧 设置CMD的默认路径设置CMD的字体 背景颜色设置快捷键启动CM
  • 题解:luogu P5568 [SDOI2008]校门外的区间

    题解 xff1a luogu P5568 SDOI2008 校门外的区间 luogu P5568 SDOI2008 校门外的区间 前置知识 xff1a 珂朵莉树 问题一 xff1a 开闭区间 区间端点均为整数 xff0c 不妨认为 xff0
  • 常用DOS命令之通俗易懂篇

    摘要 xff1a 讲解常用的Dos命令 xff0c 如果需要学习更多的命令可以使用cmd的help工具 文章内容较长 xff0c 可以通过搜索来查找对应的命令 常用DOS命令之通俗易懂篇 Arp 命令Assoc 关联At 计划服务Attri
  • 修改/忘记数据库密码

    文章目录 如何修改数据库密码一 用 SET PASSWORD 命令二 用 mysqladmin三 用 UPDATE 直接编辑 user 表四 在忘记 root 密码的时候 xff0c 可以这样windows下修改linux下修改 五 解决5
  • 远程桌面,身份验证错误:要求的函数不正确等解决办法

    问题解决方法具体解决办法windows 家庭版家庭版最终解决方案 问题 windows 版本 10 0 17134 xff0c 安装最新补丁后无法远程 windows server 2008 2013 2016 服务器 报错信息如下 xff
  • Apache的配置详解 带图

    Apache 的配置详解 带图 1 01 ServerRoot 配置1 02 Mutex default logs1 03 Listen 配置1 04 Dynamic Shared Object DSO Support 动态共享对象支持 1
  • IIS 反向代理到 Apache、Tomcat

    环境工具需求教程 反向代理 IIS 反向代理可以将请求的网址重写到其它网址 xff0c 达到转发的目的 一般用于一台服务器只允许开启80端口 xff0c 而80端口又被IIS使用 xff0c 此时需要在IIS中设置URL重写 xff0c 将
  • 使用hexo+github搭建免费个人博客详细教程

    Windows环境下Git安装 配置SSH key 安装node js npm 安装Hexo及配置 发布博客 前言 使用github pages服务搭建博客的好处有 xff1a 全是静态文件 xff0c 访问速度快 xff1b 免费方便 x
  • Hexo使用细节及各种问题

    解决markdown图片不显示 返回403 forbidden 添加本地图片无法显示 修改文章page模板 同时发布同步到多个仓库站点 Github coding 图片不显示 在使用过程中 xff0c 会发现有的引用图片无法显示的问题 但是
  • 实现Github和Coding仓库等Git服务托管更新

    如何使Github Coding Gitee 码云 同时发布更新 xff0c 多个不同Git服务器之间同时管理部署发布提交 缘由 因为在Github上托管的静态页面访问加载速度较为缓慢 xff0c 故想在Coding上再建一个静态页面的项目
  • 渗透测试常用工具

    包括 Burp Suite Acunetix Web Security with Acunetix Vulnerability Scanner Sqlmap Layer PentestBox Struts 2漏洞检测 御剑工具集锦 Kali
  • Jetbrains IntelliJ IDEA PyCharm 注册激活(2018最新)

    AppCode CLion DataGrip GoLand IntelliJ IDEA PhpStorm PyCharm Rider RubyMine WebStorm下载注册激活 官方下载地址 AppCode CLion DataGrip
  • 有道翻译反反爬虫(python)

    有道翻译反反爬虫 xff08 python xff09 该博客创作于2021 6 30 xff0c 之后有失效可能 作为一个初学者 xff0c 花两天时间破解了有道翻译的反爬虫系统 xff0c 故为之文以记之 参考文章 xff1a 博客1博