如何在 Windows 上为 python 3.7 正确设置 pyarrow

2024-01-10

我一直在尝试通过 pip 安装 pyarrow (pip install pyarrow，并且，正如 Yagav 所建议的：py -3.7 -m pip install --user pyarrow）和康达（conda install -c conda-forge pyarrow，还使用了conda install pyarrow），从 src 构建 lib （使用 conda 环境和一些魔法，我不太明白），但总是在安装后（没有错误），当我调用时，它会以一个相同的问题结束：

import pyarrow as pa
fs = pa.hdfs.connect(host='my_host', user='my_user@my_host', kerb_ticket='path_to_kerb_ticket')

它失败并显示下一条消息：



Traceback (most recent call last):
  File "", line 1, in 
  File "C:\ProgramData\Anaconda3\lib\site-packages\pyarrow\hdfs.py", line 209, in connect
    extra_conf=extra_conf)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pyarrow\hdfs.py", line 37, in __init__
    _maybe_set_hadoop_classpath()
  File "C:\ProgramData\Anaconda3\lib\site-packages\pyarrow\hdfs.py", line 135, in _maybe_set_hadoop_classpath
    classpath = _hadoop_classpath_glob(hadoop_bin)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pyarrow\hdfs.py", line 162, in _hadoop_classpath_glob
    return subprocess.check_output(hadoop_classpath_args)
  File "C:\ProgramData\Anaconda3\lib\subprocess.py", line 395, in check_output
    **kwargs).stdout
  File "C:\ProgramData\Anaconda3\lib\subprocess.py", line 472, in run
    with Popen(*popenargs, **kwargs) as process:
  File "C:\ProgramData\Anaconda3\lib\subprocess.py", line 775, in __init__
    restore_signals, start_new_session)
  File "C:\ProgramData\Anaconda3\lib\subprocess.py", line 1178, in _execute_child
    startupinfo)
OSError: [WinError 193] %1 is not a valid win32 application

起初我以为 Hadoop 2.5.6 中的 libhdfs.so 有问题，但看来我错了。我猜想，问题不在于 pyarrow 或子进程，而在于某些系统变量或依赖项。

我还手动将系统变量定义为HADOOP_HOME, JAVA_HOME and KRB5CCNAME

好吧，我自己找到的。正如我一直在想的那样，问题出在系统环境变量中，它需要有CLASSPATH变量，其中包含hadoop客户端的所有.jar文件的路径，您可以使用以下命令获取它们hadoop classpath or hadoop classpath --glob in cmd.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Windows 上为 python 3.7 正确设置 pyarrow 的相关文章

如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
访问图像的 Windows“标签”元数据字段

我正在尝试进行一些图像处理所以现在我正在尝试读取图像 exif 数据有 2 个内置函数可用于读取图像的 exif 数据问题是我想读取图像标签 exifread and imfinfo这两个函数都不显示图像标签 Is there any
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
自定义波特率，redux

我遇到的问题详述如下自定义波特率 https stackoverflow com questions 7714060 custom baud rate SetCommState 波特率 921600 失败但波特率 115200 成功尽管
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
如何从Windows阻止社交媒体[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我想根据时间阻止我的电脑上的社交媒体晚上 9 点后屏蔽上午 11 点后解锁如家长控制我尝试过关注但失败了创建了

随机推荐

可索引类型 - TypeScript

下面的语法 interface StringArray index number string 指出当StringArray索引为number 它将返回一个string 例如 let myArray StringArray myArray
获取 JSON 格式的 JSDoc 输出

有没有办法配置 JSDoc 使输出采用 JSON 格式而不是通常的 HMTL 格式有一个选项 X 解释它使用已解析的 AST 创建 JSON 文件 jsdoc X mylib gt jsdoc ast json 要理解此 JSON 您可
如何更改引导程序中面板的折叠方向

我有一个众所周知的基本可折叠面板其代码如下所述我通过 css 设置更改了一些属性例如折叠和折叠高度和宽度但无法更改折叠方向我想将其更改为与默认位置相反的顶部我怎样才能做到这一点我向你保证我尝试了多种方法但无法解决问题 di
在 numpy 中加速矢量化眼球追踪算法

我正在尝试实现 Fabian Timm 的眼球追踪算法 http www inb uni luebeck de publikationen pdfs TiBa11b pdf http www inb uni luebeck de publi
如何读取 Perl 变量的根标签和根结束标签？

我是 Perl 新手我想将 xml 根标记和根结束标记读取到 perl 变量我尝试了正常的文件读取有效我正在得到第一行和最后一行但有时如果没有新的线路您就不能相信第一条线路使用正则表达式读取第一行就完成了但我在 googl
为 go.mod 文件指定 Go 版本

我正在通过 Heroku 部署应用程序我愿意git push heroku master 我收到此错误 remote Compressing source files done remote Building source remote
Android 的 FragmentTabs 示例中的两个框架布局 Support4Demos

我对 Android 中的片段不熟悉我指的是为 supportv4 兼容性库提供的片段演示示例谁能解释一下为什么有两种框架布局 android id realtabcontent android id tabcontent Androi
iPad Safari 视口的高度

iPad 的视口宽度为 980 像素高度是多少在 Safari 中我们必须添加地址和新的水龙头 Safari 横向模式下的高度是多少有一个媒体查询可以使网页适合宽度有没有办法使网页适合高度以下是答案你是对的 iPhone iP
PostgreSQL 权限授予不可见

在 PostgreSQL 10 上我有一个名为tn schema和一个名为tn beta db 我认为是的尽管我确实必须连接到相关数据库才能查看架构 T jeff nantes 4 sudo su postgres c psql psq
lombok对jpa有副作用吗

我正在努力将 jpa 实体转换为使用 lombok 结果代码如下 Entity Table name TEST Data NoArgsConstructor AllArgsConstructor class Test Column name
如何在javascript中禁用输入文本框上的键盘事件

我有一个图像我使用键盘对其进行一些操作翻译缩放在图像上方我有一个输入文本框显示数据集中图像的编号当光标位于文本框上时如何禁用图像操作即禁用我分配给每个键盘的行为我还希望仍然能够编辑文本框例如移动到图像编号 xx 从我在这
如何在WPF中正确刷新自定义形状？

我创建了一条自定义行旁边有一些文本形状是一个子类System Windows Shapes Shape 由于某种原因当我更改线的坐标时文本不会刷新我知道关于InvalidateVisual 方法但每次我移动元素时我都必须调用它
Xcode 调试：查看 NSNumber 的值？

是否可以在变量监视窗口中的调试器数据提示中看到 NSNumber 的数值我在 NSNumber 中存储一个整数值并希望在调试期间看到该值我已经在调试器中尝试了一些数据格式化程序但没有太大帮助打开调试器视图并在摘要列中输入 int
尝试在 python 中创建 virtualenv 并激活它

我很难在 Python 中创建 virtualenv 并激活它我正在研究Windows操作系统在命令提示符下我通过输入以下命令安装了 virtualenv pip install virtualenv 然后为了在其中创建虚拟环境我
从 Javascript 中的对象列表中提取对象属性

我从 API 接收到以下对象 2012 12 12 id 1234 type A id 1235 type A id 1236 type B 2012 12 13 id 1237 type A id 1238 type C id 1239
需要一个策略将 Intellij IDEA 项目文件放入 Git 中

需要一个将 Intellij IDEA 项目文件放入 Git 的策略主要问题是如果idea项目文件在git中如何避免分支之间的合并冲突另一个问题是把它们保存在git中方便吗如何避免合并您可以保护某些文件不被合并合并管理器 http
SQL Server中的SQL group_concat函数[重复]

这个问题在这里已经有答案了如果有一张名为employee的表 EmpID EmpName 1 Mary 1 John 1 Sam 2 Alaina 2 Edward 我需要这种格式的结果 EmpID EmpName 1 Mary John
如何使用 Alpaca 创建必需的条件字段？

有谁知道如何定义依赖于另一个字段的必填字段例如如果field1被标记true then field2必须为必填项否则不应填写字段 2 这是我目前的尝试 field1 title Field1 type string enum true
Google Play 商店中的 Android 版本：选择加入 URL 在哪里？

我正在努力在 Google Play 商店中发布我们的应用程序的私人内部版本我收到一条消息显示当您发布应用程序时此处将提供选择加入链接但我不知道还需要做什么来发布我的 alpha 测试 apk 发布状态显示全面推出这向我表明一
如何在 Windows 上为 python 3.7 正确设置 pyarrow

我一直在尝试通过 pip 安装 pyarrow pip install pyarrow 并且正如 Yagav 所建议的 py 3 7 m pip install user pyarrow 和康达 conda install c conda

如何在 Windows 上为 python 3.7 正确设置 pyarrow

如何在 Windows 上为 python 3.7 正确设置 pyarrow 的相关文章

随机推荐

热门标签