Python3链接HIVE

2023-10-31

几个必要的pip,如果用anaconda 安装pyhive的时候会附带都给安装上 

pip install pyhive

pip install thrift
pip install sasl
pip install thrift-compiler
pip install thrift-sasl
from pyhive import hive
import pandas as pd

#通过HIVE链接
cursor = hive.connect(host=' ',port=10000, auth='LDAP', database=' ', username=' ', password=' ').cursor()
cursor.execute('select * from table')

#fetchall()返回查询结果的余下的所有数据,使用此函数要评估数据量,可能会因为数据量太大,导致本地程序内存问题。
#cursor.description 查询结果集的元数据,返回结果集有多少列,每个列的列名,数据类型等数据。dataframe引用结果集为列名

data = cursor.fetchall()
columns = [col[0].split('.')[-1] for col in cursor.description]
data = pd.DataFrame(data=data, columns=columns)
 
print(data)

cursor.execute(operation, params)

可以直接是执行sql查询语句

cursor.next()

返回当前查询结果集中的下一条数据

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python3链接HIVE 的相关文章

随机推荐

  • oracle 删除所有外键

    1 执行语句 select alter table table name drop constraint constraint name from user constraints where constraint type R 2 执行第
  • 跨品种套利 - 期货

    1 原理 什么是套利 套利是指在买入或卖出一种金融资产的同时卖出或买入另一种相关的金融资产从中利用价差获得套利的过程 什么是跨品种套利 当两个合约有很强的相关性时 可能存在相似的变动关系 两种合约之间的价差会维持在一定的水平上 当市场出现变
  • 【burpsuite安全练兵场-客户端14】点击劫持-5个实验(全)

    前言 介绍 博主 网络安全领域狂热爱好者 承诺在CSDN永久无偿分享文章 殊荣 CSDN网络安全领域优质创作者 2022年双十一业务安全保卫战 某厂第一名 某厂特邀数字业务安全研究员 edusrc高白帽 vulfocus 攻防世界等平台排名
  • IDEA test程序无法输入 This view is read-only 解决办法

    问题 test程序无法输入 按回车键显示如下 解决办法 在IDEA Help gt Edit Custom VM Options 中添加如下代码 然后重启IDEA即可 Deditable java test console true
  • 5-7 12-24小时制

    编写一个程序 要求用户输入24小时制的时间 然后显示12小时制的时间 输入格式 输入在一行中给出带有中间的 符号 半角的冒号 的24小时制的时间 如12 34表示12点34分 当小时或分钟数小于10时 均没有前导的零 如5 6表示5点零6分
  • python输入10个数求偶数奇数之和_从键盘上输入十个整数,并求出这十个数所有奇数之和及偶数之和。C++编程,要求有do while,w...

    展开全部 include int main int i int num int jishu oushu do while i 0 jishu oushu 0 do scanf d num if num 2 0 oushu num else
  • mysql grouping sets_mysql – PostgreSQL:如何使用GROUPING SETS,CUBE...

    我有以下在MySQL 5 6中编写的代码块 INSERT INTO Totals SELECT Zone State COUNT Sponsored COUNT Enrolled COUNT PickedUp FROM MasterData
  • HTTP头的Expires与Cache-control

    HTTP头的Expires与Cache control HTTP头的Expires与Cache control 1 概念 Cache control用于控制HTTP缓存 在HTTP 1 0中可能部分没实现 仅仅实现了Pragma no ca
  • 零基础学SQL(1):初识数据库与SQL

    零基础学SQL 1 初识数据库与SQL 一 初识数据库 数据库是将大量数据保存起来 通过计算机加工而成的可以 进行高效访问的数据集合 该数据集合称为数据库 Database DB 用来管理数据库的计算机系统称为数据库管理系统 Databas
  • ionic3+angular4 HttpClient封装优化

    背景 众所周知 angular4以后引入的HTTPClient为前端http请求带来了非常大的改进 它支持了与java类似的拦截器机制 通过拦截器 可以方便的对请求进行前置 后置及异常处理 但如果我们需要在不同的项目中使用这个拦截器 且有不
  • pt-online-schema-change添加索引没有反应

    之前使用 pt online schema change添加索引没有问题 如下语句 root ixxxxxx pt online schema change no version check execute alter foreign ke
  • WSL使用技巧 / 虚拟机对比

    WSL使用技巧 虚拟机对比 前言 虚拟机比较 VMware使用技巧 WSL使用技巧 官方文档 工具 安装WSL 基本命令 运行命令 关闭卸载 磁盘管理 导入导出 指定安装路径 前言 本文介绍了VMware和WSL的区别 并详细介绍了WSL的
  • C++中的栈和堆

    由C C 编译的程序占用的内存分为以下几个部分 1 栈区 stack 又编译器自动分配释放 存放函数的参数值 局部变量的值等 其操作方式类似于数据结构的栈 2 堆区 heap 一般是由程序员分配释放 若程序员不释放的话 程序结束时可能由OS
  • linux服务器监控谁改了文件,linux服务器文件监控

    linux服务器文件监控 内容精选 换一换 cd opt dis agent X X X logstail 100f dis agent log显示如下信息 表示Agent正常运行 Agent Startup completed in xx
  • Django简介(二)

    Models 通常 一个model对应数据库的一张数据表 Django中Models以类的形式表现 它包含了一些基本字段以及数据的一些行为 Django将与数据库交互的SQL语句封装起来 而无需开发人员再次编写 ORM object rel
  • vite创建vue3项目方式

    快速创建方式 终端输入 npm init vite latest 然后输入项目名称 选择要创建的框架版本 然后选择需要的脚本语言 最后 npm i初始化 npm run dev启动项目 项目目录如下 页面展示
  • Vue 保存cookie信息 ,用Vue开发完成后使用Hbuilder打包apk 保存登录信息到cookie中

    以下是在vue2开发过程中 保存登录信息时 使用电脑浏览器能获取cookie 但使用Hbuilder打包apk文件时获取不到cookie值的解决办法 第一步 安装 npm install js cookie 如已安装直接忽略 第二步 使用
  • vue.js执行if语句后程序终止甚至后面的else语句也不会执行

    今天因为前端 vue 的一个问题 耽误了几个小时 本想使用if this sciEngineeringChartData 0 0 id null 进行条件判断 但是程序执行到这里后就不再执行了 本来预想着if语句里面的条件不成立会执行els
  • Java解析zip文件,并识别压缩包里面的文件转换成可操作的IO流

    前几天项目遇到一个棘手的问题 批量上传人员的证件照 因为java操作文件夹不好操作 最后决定把存放人员证件照的文件夹压缩成zip文件 通过java去解析 然后把里面的文件转成list集合 这里使用的jdk提供的 java util zip包
  • Python3链接HIVE

    几个必要的pip 如果用anaconda 安装pyhive的时候会附带都给安装上 pip install pyhive pip install thrift pip install sasl pip install thrift compi