如何将SQL数据加载到Hortonworks中？

2024-05-18

我已在我的电脑中安装了 Hortonworks SandBox。还尝试使用 CSV 文件，并以表结构的方式获取它，这是可以的（Hive + Hadoop），nw 我想将当前的 SQL 数据库迁移到沙箱（MS SQL 2008 r2）中。我将如何做到这一点？还想连接到我的项目（VS 2010 C#）。

可以通过ODBC连接吗？

我听说 sqoop 用于将数据从 SQL 传输到 Hadoop，那么我如何使用 sqoop 进行此迁移？

您可以编写自己的作业来迁移数据。但 Sqoop 会更方便。要做到这一点，你必须download http://apache.osuosl.org/sqoop/1.4.3/sqoop-1.4.3.tar.gzSqoop 和适当的连接器，根据您的情况，适用于 Apache Hadoop 的 Microsoft SQL Server 连接器。您可以从以下位置下载：here http://www.microsoft.com/en-us/download/details.aspx?id=27584.请通过Sqoop 用户指南 http://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html。它包含了所有详细信息。

而且 Hive 确实支持 ODBC。您可以在此处找到更多相关信息page https://cwiki.apache.org/Hive/hiveodbc.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将SQL数据加载到Hortonworks中？的相关文章

如何将 SQL 结果存入 STRING 变量？

我正在尝试获取 C 字符串变量或字符串数组中的 SQL 结果是否可以我需要以某种方式使用 SqlDataReader 吗我对 C 函数和所有功能非常陌生曾经在 PHP 中工作所以如果可以的话请给出一个工作示例如果相关我已经可
SQL 用新值替换旧值

我有一个名为tbl Products 其中有一列名为articlenumber并且充满了像这样的数字s401 s402 etc 我生成了一个包含新商品编号的列表它将替换旧的商品编号 s401 I00010 s402 I00020 s403
play20 ebean 生成的 sql 在 postgresql 上抛出语法错误

我正在尝试使用 postgresql 来启动我的 play20 应用程序以便我可以使用并稍后部署到 Heroku 我跟着这个answer https stackoverflow com questions 12195568 errors
将 Apache Zeppelin 连接到 Hive

我尝试将我的 apache zeppelin 与我的 hive 元存储连接起来我使用 zeppelin 0 7 3 所以没有 hive 解释器只有 jdbc 我已将 hive site xml 复制到 zeppelin conf 文件夹
MySql如何通过过滤多列来限制多个数字？

我想从数据库中获取 4 个不同类别的 50 个问题我想要 4 个不同类别中每个类别的不同数量的问题我的结果集必须包含第一类 12 个问题第二类 20 个问题第三类 10 个问题和第四类 8 个问题我的问题表中总共有 50 个问题
SQL：比较不同表中的两个计数

我有 3 张桌子一张桌子上有世界上每个国家及其代币 NAME CODE Afghanistan AFG Albania AL Algeria DZ American Samoa AMSA Andorra AND Angola ANG An
按小时拆分日期/时间数据并将日期/时间范围展开为行

我正在尝试使用 SQL Server 将一系列日期时间数据扩展为多行例如我的数据看起来像 Date StartTime EndTime EmployeeID ShiftType 10 1 2019 8 30 00AM 4 57 00P
Oracle：如何查找模式中上次更新（任何表）的时间戳？

有一个Oracle数据库模式数据很小但仍然有10 15个表左右它包含一种配置路由表有一个应用程序必须不时轮询此架构不得使用通知如果架构中没有数据更新应用程序应使用其当前的内存版本如果任何表有任何更新应用程序应将所有表重新
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
基于列顺序的查询速度

数据库中列类型的顺序对查询时间有影响吗例如具有混合排序 INT TEXT VARCHAR INT TEXT 的表的查询速度是否会比具有连续类型 INT INT VARCHAR TEXT TEXT 的表慢答案是肯定的这确实很重要而且
Mapreduce shuffle 阶段出现内存不足错误

我在运行时遇到奇怪的错误类似字数统计映射缩减程序我有一个包含 20 个从站的 hadoop 集群每个从站都有 4 GB RAM 我将 Map 任务配置为 300MB 堆 Reduce 任务槽为 1GB 我每个节点有 2 个映射槽和 1
MySQL 子查询返回多行

我正在执行这个查询 SELECT voterfile county Name voterfile precienct PREC ID voterfile precienct Name COUNT SELECT voterfile voter
MySQL 中的断言

我有一个针对大型数据库运行的 SQL 脚本我想在开始时提出几个简单的查询作为健全性检查有没有办法在MySQL中写断言或者任何类型的选择如果它与该值不匹配则中止整个脚本一些疯狂的代码要点是 SET可能会引发 mysql 变量
使用 org.apache.hadoop/* 依赖项离线编译 sbt 时遇到的问题

使用依赖于 org apache hadoop 包的 sbt 进行离线编译时遇到很多麻烦一个简单的build sbt name Test version 1 0 scalaVersion 2 10 4 libraryDependencie
如何检测 Postgres 中持有锁的查询？

我想不断跟踪 postgres 中的互锁我碰到锁具监控 https wiki postgresql org wiki Lock Monitoring文章并尝试运行以下查询 SELECT bl pid AS blocked pid a us
如何将自定义类型数组传递给 Postgres 函数

我有一个自定义类型 CREATE TYPE mytype as id uuid amount numeric 13 4 我想将它传递给具有以下签名的函数 CREATE FUNCTION myschema myfunction id uuid
如何通过循环变量在 dbt 中多次运行 SQL 模型？

我有一个 dbt 模型测试模型接受地理变量 zip state region 在配置中我想通过循环变量来运行模型三次每次使用不同的变量运行它问题是我有一个如下所示的宏它将变量附加到输出表名称的末尾即运行测试模型 with z
更新plpgsql中触发器函数中的多列

给出以下架构 create table account type a id SERIAL UNIQUE PRIMARY KEY some column VARCHAR create table account type b id SERIA
Oracle：如果表存在

我正在为 Oracle 数据库编写一些迁移脚本并希望 Oracle 有类似于 MySQL 的东西IF EXISTS构造具体来说每当我想删除 MySQL 中的表时我都会执行类似的操作 DROP TABLE IF EXISTS tabl
外键引用多个表

我有4张桌子 A ida name B ida B specific stuff C ida C specific stuff D ida D specific stuff 我希望另一个表 E 可以仅引用 B 或 C 而不是 D 我可以在其

随机推荐

maven Surefire 插件不使用 --enable-preview 模式

这是我的 pom xml
* 到底有多慢？

大家都表示选择器非常慢但它到底有多慢呢我总是试图避免它但有时它非常有用例如 h1 margin top 1em 简单来说通用选择器速度只与页面上的元素一样慢 Since 从右到左匹配浏览器获取每个元素并将其与所有候选规则进行匹
CXF/Jetty 相当于以下 Jersey/Jetty 代码

我有一些 Jersey 2 7 和 Jetty 9 2 5 v2014112 的测试代码我正在尝试将其移植到 CXF 3 0 x 和 Jetty 相同版本有一个部分我无法弄清楚相当于rc register resource 下面一行
从 Rust 中的函数返回异步函数

第 1 部分返回异步函数的函数的签名应该是什么 pub async fn some async func arg str What should be sig here pub fn higher order func action st
Alpha 混合红色、蓝色和绿色图像以生成着色为任何 RGB 值的图像？

基本上我有一个上下文我无法以编程方式对图像进行着色尽管我可以更改它的 alpha 值通过一些实验我发现我可以使用特定的 alpha 值对图像的红色蓝色和绿色版本进行分层以产生各种颜色但是我想知道是否可以通过这种方法实现真正
Django模型更新或创建具有唯一约束的对象

有一个模型 class Proxy models Model host models CharField max length 100 port models CharField max length 10 login models Cha
Maven：如何使用本地 lib 目录作为依赖项而不是 Maven 存储库

我在集成测试期间的项目结构如下 Project A conf contains the configuration files lib Contains the all dependencies pom xml target test Co
JSON-LD 构建单个对象数组

有没有办法将单个对象强制放入数组每次都测试对象类型真的很烦人我尝试了这个上下文但它不起作用还有JSON LD Playground 中的示例 http tinyurl com ph7p35v 通过此上下文资源将转换为单个对象而不
Android 中的 Sugar ORM：更新 SQLite 中保存的对象

我是在 Android 上使用 SQLite 和 Sugar ORM 进行应用程序开发的新手并尝试阅读 Sugar ORM 文档但没有找到有关如何更新 SQLite 中保存的对象的任何信息更改对象属性后还可以保存对象吗就像是 Cus
如何解决 CoreData mogenerator 未找到问题

我收到如下所示的错误我不知道我错过了什么我该如何解决这个问题如下图所示 Users nischalhada Documents XcodePro mnepalnews revisited 2 0 CoreData mogenerato
Grafana：警报查询不支持模板变量

您好我想在 grafana 中创建一个简单的警报以检查过去 5 分钟是否没有数据但我收到一个错误警报查询不支持模板变量嗯根据这个issue https github com grafana grafana issues 6230
Browserify - 如何在浏览器中调用通过 browserify 生成的文件中捆绑的函数

我是 Nodejs 和 browserify 的新手我从这个开始link http browserify org 我有文件 main js 其中包含此代码 var unique require uniq var data 1 2 2 3
如何删除 Material React Modal 中的蓝色边框？

我正在用这个反应材料模态 https material ui com pt components modal 在演示示例中您可以看到当您打开模式时有一个蓝色边框有办法去掉吗我在 Modal Api 中看到具有该属性disableAu
从 Python 调用 PARI/GP

我想打电话PARI GP http pari math u bordeaux fr dochtml gpman html仅从Python计算函数nextprime n 对于不同的n是我定义的不幸的是我无法得到帕里蟒蛇 http code
`git Reset HEAD file` 是否也检查该文件？

我错误地向 git 添加了一个目录当我按照提示操作时here https stackoverflow com questions 348170 undo git add通过执行以下操作来撤消添加git reset HEAD
Scala 中的随机列表[重复]

这个问题在这里已经有答案了我对 scala 中的随机播放列表有疑问使用scala util Random 例如我有 val a cyan val b magenta val c yellow val d key val color Ra
禁止 MATLAB 自动获取焦点[重复]

这个问题在这里已经有答案了我有以下问题在我的 MATLAB 代码中我使用如下语句 figure 1 更改某些数据的目标数字问题是在此 MATLAB 之后系统将焦点集中在具有该图形的窗口上当我在后台运行一个大脚本并尝试在计算机上
pip：需要将包名称tensorflow-gpu更改为tensorflow

我正在尝试将具有 GPU 支持的张量流安装到 conda 环境中我使用命令 pip install ignore installed upgrade https storage googleapis com tensorflow linu
解开 Knuth 的结：如何重构意大利面条式代码？

这个问题的灵感来自如何将流程图转化为实施 https stackoverflow com questions 36647765它询问如何通过算法消除goto代码中的语句这answer https stackoverflow com a 3
如何将SQL数据加载到Hortonworks中？

我已在我的电脑中安装了 Hortonworks SandBox 还尝试使用 CSV 文件并以表结构的方式获取它这是可以的 Hive Hadoop nw 我想将当前的 SQL 数据库迁移到沙箱 MS SQL 2008 r2 中我将如何做

如何将SQL数据加载到Hortonworks中？

如何将SQL数据加载到Hortonworks中？ 的相关文章

随机推荐

热门标签

如何将SQL数据加载到Hortonworks中？的相关文章