Python 调用免费的百度翻译接口翻译excel文档中的英文成中文

2023-12-04

# !/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: JHC
@license: None
@contact: JHC000abc@gmail.com
@file: get_coogle_translate_results.py
@time: 2022/11/12/ 22:12
@desc:
"""
import os
import requests
import json
import xlsxwriter
import xlrd
import time
import random


class Translation():
    """

    """

    def parse_streaming_data(self, data, question):
        for line in data.split('\n'):
            if line.strip():
                if line.startswith("data: "):
                    message = json.loads(line.replace("data: ", ""))
                    event = message["data"]["event"]
                    if event == "Translating":
                        question = message["data"]["list"][0]["src"]
                        answer = message["data"]["list"][0]["dst"]
                        # print("{} : {}".format(question,answer))
                        return {
                            "question": question,
                            "answer": answer
                        }

        return {
            "question": question,
            "answer": "翻译失败"
        }

    def translate(self, question):
        tran_result = {
            "question": question,
            "answer": "翻译失败"
        }
        headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36",
        }

        url = "https://fanyi.baidu.com/ait/text/translate"
        data = {
            "query": "{}".format(question),
            "from": "en",
            "to": "zh",

        }
        try:
            response = requests.post(url, headers=headers, json=data)
            # print(response.text)
            tran_result = self.parse_streaming_data(response.text, question)
        except BaseException:
            pass

        time.sleep(random.randint(10, 20))
        return tran_result

    def read_yield(self, file: str, headers: list = None, sheets: list = None):
        """
        按行读取excel
        :param file:
        :param headers:[[],[]]每个sheet对应一个header
        :param encoding:
        :param spliter:
        :param sheets:
        :return:
        """
        data = xlrd.open_workbook(file)
        if not sheets:
            sheets = data.sheet_names()
        for index, sheet in enumerate(sheets):
            table = data.sheet_by_name(sheet)
            nrows = table.nrows
            # 传headers进来从第1行开始算，不传从第2行开始算
            if not headers:
                header = table.row_values(0)
                start = 1
            else:
                header = headers[index]
                start = 0
            num = 0
            for row in range(start, nrows):
                info = []
                for i in table.row_values(row):
                    if isinstance(i, str):
                        info.append(i)
                    else:
                        if str(i).endswith(".0"):
                            info.append(str(int(i)))
                        else:
                            info.append(str(i))
                num += 1

                yield {
                    "sheet": sheet,
                    "headers": header,
                    "num": num,
                    "line": info,
                }

    def write(self, file: str, data, headers, sheets):
        workbook = xlsxwriter.Workbook(file)
        for index, sheet in enumerate(sheets):
            worksheet = workbook.add_worksheet(sheet)
            data.insert(0, headers[0])
            for row, lis in enumerate(data):
                for col, val in enumerate(lis):
                    # header 样式
                    worksheet.write_string(
                        row=row,
                        col=col,
                        string=str(val)
                    )
        workbook.close()

    def process(self, **kwargs):
        in_file = kwargs["in_file"]
        name = in_file.split(os.sep)[-1].split(".")[0]
        out_lis = []
        headers = [["内容", "序号", "翻译"]]
        num = 0
        for args in self.read_yield(in_file):
            chinese_col = args["line"][args["headers"].index("内容")]
            if chinese_col:
                num += 1
                tran_result = self.translate(chinese_col)
                question = tran_result["question"]
                answer = tran_result["answer"]
                print(question, answer)
                out_lis.append([question, str(num), answer])

        self.write("{}_result.xlsx".format(name), data=out_lis, headers=headers, sheets=["Sheet1"])


if __name__ == '__main__':
    t = Translation()
    # in_file = R"D:\Desktop\4\图片映射表 .xlsx"
    in_file = input("输入待处理文件路径:")
    t.process(in_file=in_file)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Excel

开发语言

Python 调用免费的百度翻译接口翻译excel文档中的英文成中文的相关文章

如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
有什么办法可以加快这个 VBA 算法的速度吗？

我正在寻找实现 VBAtrie http en wikipedia org wiki Trie 构建能够在相对较短的时间内少于 15 20 秒处理大量英语词典约 50 000 个单词的算法由于我实际上是一名 C 程序员这是我第一
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
Excel VSTO 工作簿新活动

在 Excel 2007 的一个 Excel 插件项目中我需要检查创建新工作簿的事件我还需要捕捉 Workbook Open 事件我很容易做到这一点在我在互联网上的研究中我发现了以下内容打开任何工作簿时都会引发 Applicat
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的

随机推荐

全网最详细的Python安装教程，超级详细·小白秒懂！！！

目录 1 安装版本说明 2 准备工作确定操作系统及位数 2 1 确定方法1 2 2 确定方法2 3 下载Python安装包 4 安装Python 5 测试Python是否安装成功 6 Python安装成功后找不到编写代码的桌面快捷方式 7
《开箱元宇宙》：Madballs 解锁炫酷新境界，人物化身系列大卖

你是否曾想过元宇宙是如何融入世界上最具代表性的品牌和名人的战略中的在本期的开箱元宇宙系列中我们与 Madballs 的战略顾问 Derek Roberto 一起聊聊 Madballs 如何在 90 分钟内售罄 2 000 个人物化
如何利用场追迹控制衍射的包含

1 摘要 VirtualLab Fusion包括一系列建模方法便于用户可以地调整光学仿真的精度级别和时间不仅如此这种功能还有助于隔离物理原因产生的不同影响在本示例中我们提出了一个清晰的工作流程配置一个仿真以便在物理光学模拟中考虑或
盘点最近超火的AI小红书商单玩法，7天快速涨粉1000+

hi 同学们今年是AI迎来爆发的一年生成式AIGC技术大量涌现正在加速为各行各业赋能像大家熟悉的AI绘画和AI数字人等商业应用领域基本先行的那波人都尝到了甜头老粉都知道我做AI变现项目拆解也有大半年了我们自有团队也在日常中不断
vue3新特性 compositionAPi与React.js中Hooks的异同点

1 React js中的Hooks基本使用 React Hooks允许你勾入诸如组件状态和副作用处理等React功能中 Hooks只能用在函数组件中并允许我们在不需要创建类的情况下将状态副作用处理和更多东西带入组件中 Rea
光学标准具的建模

光学标准具在具有简单结构的透明板中可以形成法布里珀罗谐振器 Fabry P rot resonators 并用于光谱和或角谱选择 VirtualLab Fusion中的非序列场追迹技术可以对不同类型的标准具进行精确建模其中包括平面或曲
Redis基础系列-安装Redis

Redis基础系列安装Redis 文章目录 Redis基础系列安装Redis 1 环境要求 2 下载redis 3 安装 4 配置 5 参考与感谢 1 环境要求安装C语言编译环境 r
乘数而启，向数而行|2023数字金融创新发展论坛成功举办

订阅制 C端消费者早已耳熟能详如今也凭借灵活服务更新稳定的特点逐渐成为B端企业服务的新热点比如对中小企业而言办公IT设备等配套支出都必不可少但收入栗栗在线招人啦哇各位招人好难啊你们赶紧来找栗栗啊不限经验不限地域不
杂散光好书分享《FRED操作手册上、下》

目录第一章 FRED概述 1 1 1 WHAT IS FRED 1 1 2 FRED与传统软件之间有什么不同 1 1 3 FRED名词术语 2 1 4 FRED用户界面 7 第二章光源 16 2 1 简易光源 16 2 1 1 简易光
用Czerny-Turner系统检测钠灯双线

1 摘要 Czerny Turner系统被广泛用于分析光源的光谱信息通常首先用抛物面反射镜对光源进行准直然后用衍射光栅对颜色进行空间分离在这个例子中我们提出了一种由反射镜和衍射光栅组成的Czerny Turner系统用于检测钠双
Python 多线程装饰器基于线程池实现

usr bin env python3 coding UTF 8 author v jiaohaicheng baidu com des 多线程装饰器基于cup包内置线程池实现默认内置最大线程数10 from functools imp
开环端到端自动驾驶：从入门到放弃

作者木子士心王大可编辑汽车人原文链接 https zhuanlan zhihu com p 669454065 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心端到端自动驾驶技术交流
初学者必看 | Python及PyCharm安装教程

本期给大家推荐Python的安装教程 Python作为深度学习的必备工具也是PHM初学者的必备技能之前发表了基于Anaconda的Python及jupyter notebook编辑器的安装教程这期主要是Python及PyCharm编辑
【腾讯云云上实验室】个人对腾讯云向量数据库的体验心得

目录前言 Tencent Cloud VectorDB概念使用初体验腾讯云向量数据库的优势应用场景有哪些未来展望番外篇腾讯云向量数据库的设计核心结语前言还是那句话不用多说想必大家都能猜到现在技术圈最火的是什么非人工
共赴新型工业化之“山海”，华为云生态的追求与远见

统计数据显示 2022年全国工业用电量达5 6万亿度其中公辅能源耗电量约占40 所谓公辅能源是指工业企业在生产制造环节所需的水电气冷热等公共辅助能源研究显示公辅能源的节能空间巨大以10 的节能空间计算一年可节省2000
MySQL：找回root密码

一情景描述我们在日常学习中经常会忘记自己的虚拟机中 MySQL 的 root 密码这个时候我们要想办法重置 root 密码从而解决 root 登陆问题二解决办法 1 修改 my cnf 配置文件并重启 MySQL 通过修改
Python下载与安装教程（很详细）|||

一打开python官网点击下载搜索并打开官网进入页面后点击导航中的Downloads进入下载页面二选择要下载的python版本最新版本的python不能在Windows7的电脑上使用如果你的系统是win10及以上可以直接下载3
Python常用基础语法知识点大全合集，看完这一篇文章就够了

介绍 Python 是一门独特的语言快速浏览一下他的要点面向对象每一个变量都是一个类有其自己的属性 attribute 与方法 method 语法块用缩进四个空格而不是分号花括号等符号来标记因此行首的空格不能随意书写注
惊！Python爬虫只需10行代码，海量公众号文章任你爬！

前言自从chatGPT出现后对于文本处理的能力直接上升了一个维度在这之前我们爬取到网络上的文本内容之后都需要写一个文本清理的程序对文本进行清洗而现在有了chatGPT的加持我们只需要几秒就可以很方便对所有类型所有格式的
Python 调用免费的百度翻译接口翻译excel文档中的英文成中文

usr bin env python3 coding UTF 8 author JHC license None contact JHC000abc gmail com file get coogle translate results p

Python 调用免费的百度翻译接口 翻译excel文档中的英文成中文

Python 调用免费的百度翻译接口 翻译excel文档中的英文成中文 的相关文章

随机推荐

热门标签

Python 调用免费的百度翻译接口翻译excel文档中的英文成中文

Python 调用免费的百度翻译接口翻译excel文档中的英文成中文的相关文章