Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Kubernetes入门
Kubernetes入门 一 Kubernetes是什么 首先 它是一个全新的基于容器技术的分布式架构领先方案 这个方案虽然还很新 但是它是谷歌十几年依赖大规模应用容器技术的经验积累和升华的一个重要成果 实现资源管理的自动化 以及跨多个数据
软件使用教程
Hadoop
HDFS
big data
Hive常用操作以及java.io.IOException: java.lang.RuntimeException: ORC split generation failed问题处理
使用datagrip连接hive 切换数据库 use testdb create database testdb 创建表 create table t user id int name varchar 100 age int create
大数据
数据库
hive
Hadoop
数据仓库
Pig-使用PigLatin操作员工表和部门表
前提条件 安装好hadoop2 7 3 Linux系统下 安装好pig Linux系统下 准备源数据 打开终端 新建emp csv文件 nano emp csv 输入内容如下 保存退出 7369 SMITH CLERK 7902 1980
Hadoop
大数据
Java
HDFS
自回归滑动平均模型
【珍藏版】 2012Java开发工程师必备精品资料(115个)
Java应用广泛 涉及个人PC 数据中心 游戏控制台 科学超级计算机 移动电话和互联网等领域 同时拥有全球最大的开发者专业社群 小弟精心整理了115个精品资料 包括11个Java开发专题和104个热门资源 网上的资料众多 参差不齐 然而这批
Hadoop
大数据--Hadoop环境部署(3)JDK和ZooKeeper环境配置
Linux环境搭建 https www cnblogs com Studywith p 16946297 html 免密连接 https www cnblogs com Studywith p 16946310 html 在完成了Linux
大数据
Java
javazookeeper
Hadoop
Zookeeper
Hadoop从零开始教程第一篇(在linux上安装hadoop集群centos7+hadopp3.2)
Hadoop简介 Hadoop是Apache旗下的一套开源分布式计算平台 应用范围 利用服务器集群 根据用户的自定义业务逻辑 对海量数据进行分布式处理 核心组件 HDFS 分布式文件系统 高容错性 高伸缩性等允许用户将Hadoop部署在低廉
大数据
Hadoop
从零开始
基于Hadoop的Knn算法实现
Knn算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别 则该样本也属于这个类别 并具有这个类别上样本的特性 该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别 Knn方法在类
Hadoop
MapReduce
KNN
Hadoop中Mapreduce的Job任务提交流程源码解析
一 源码解析步骤 1 设置断点 在Driver的job任务提交打上断点进行Debug调试进入其中 F7 进入 F8 下一步 Alt Shift F7 强制进入 Shift F8 退出 进入waitForCompletion 2 submit
Hadoop模块化学习
源码分析
Hadoop
MapReduce
Java
hadoop环境搭建之安装JDK
判断是否安装了jdk 使用java version 和 javac命令判断是否安装了jdk root localhost ssh java version bash java command not found root localhost
Linux
Hadoop
linux安装jdk
centos7安装jdk
hadoop安装jdk
MR应用开发 —— Hadoop权威指南10
1 Configuration Hadoop的配置API 之前 在获取Hadoop文件实例时 经常会创建一个Configuration实例 Configuration是Hadoop用于配置的API 是property和value的集合 ad
《Hadoop权威指南2》
Hadoop
mr
基于Docker的Hadoop集群搭建
基于Docker的Hadoop集群搭建 本文为在阿里云服务器上基于docker的Hadoop集群搭建 安装思路为 安装docker gt 运行docker导入ubuntu镜像 gt 运行ubuntu系统 gt 在系统中配置好单个节点 gt
大数据
Hadoop
Docker
阿里云
Apache Hudi简介、与Kudu、Hive、 HBase对比
一 Apache Hudi 数据实时处理和实时的数据 实时分为处理的实时和数据的实时 即席分析是要求对数据实时的处理 马上要得到对应的结果 Flink Spark Streaming是用来对实时数据的实时处理 数据要求实时 处理也要迅速 数
湖仓一体(DeltaHudiIceberg)
hive
Hadoop
big data
hadoop集群搭建(基于docker-compose)
1 创建工作目录 比如 home hadoop 需要配置2个文件 data是挂载目录 会自动创建 2 hadoop env 内容不用改 基本是默认配置 后续修改配置在这修改就行了 配置详情自己百度下 CORE CONF fs default
大数据
Hadoop
Docker
big data
Hive的介绍及部署搭建
文章目录 Hive的介绍 Hive与Hadoop之间的关系 Hive功能实现图 Hive架构图 Hive组件 Hive中的元数据 Hive的安装部署 安装部署的前提 Mysql的安装 Hive安装 启动Hive 客户端连接Hive Hive
Hadoop
hive
大数据
一种HBase的表region切分和rowkey设计方案
一种HBase的表region切分和rowkey设计方案 2014 05 14 14 21 56 转载 分类 MYSQL ORACLE DB2 sybase info 一种HBase的表region切分和rowkey设计方案 场景 HBas
Hadoop
Haystack 太强了!存 2600 亿图片
作者 奇伢 来源 奇伢云存储 小文件存储 小文件存储 老生常谈的问题 先聊聊小文件存储重点关注的是什么 以前我们提过 对于磁盘来说 小 io 吃 iops 大块 io 吃吞吐 划重点 小文件的重点是 io 次数 为什么每次提到海量小文件的时
Java
Hadoop
大数据
分布式
数据库
分布式系统详解--框架(Hadoop-Ssh免密登陆配置)
分布式系统详解 框架 Hadoop Ssh免密登陆配置 配置Ssh非常简单 其实就是为了避免将来集群机器变得很多导致操作本机 后者操作其它服务器输入密码的次数太多而浪费了太多的时间 在这儿我们配置了这个Ssh免登录将会节省一大部分时间 我们
Hadoop
分布式
ssh免密登录
«
1 ...
94
95
96
97
98
99
100