我已在我的电脑中安装了 Hortonworks SandBox。还尝试使用 CSV 文件,并以表结构的方式获取它,这是可以的(Hive + Hadoop),nw 我想将当前的 SQL 数据库迁移到沙箱(MS SQL 2008 r2)中。我将如何做到这一点?还想连接到我的项目(VS 2010 C#)。
可以通过ODBC连接吗?
我听说 sqoop 用于将数据从 SQL 传输到 Hadoop,那么我如何使用 sqoop 进行此迁移?
您可以编写自己的作业来迁移数据。但 Sqoop 会更方便。要做到这一点,你必须download http://apache.osuosl.org/sqoop/1.4.3/sqoop-1.4.3.tar.gzSqoop 和适当的连接器,根据您的情况,适用于 Apache Hadoop 的 Microsoft SQL Server 连接器。您可以从以下位置下载:here http://www.microsoft.com/en-us/download/details.aspx?id=27584.请通过Sqoop 用户指南 http://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html。它包含了所有详细信息。
而且 Hive 确实支持 ODBC。您可以在此处找到更多相关信息page https://cwiki.apache.org/Hive/hiveodbc.html.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)