`

HIVE体系架构

 
阅读更多

架构图:


 一、   service
1、       hive有三种service,分别是cli,hiveserver和hwi。
2、       cli是命令行工具,为默认服务,启动方式$HIVE_HOME/bin/hive 或 $HIVE_HOME/bin/hive --service cli。
3、       hiverserver通过thrift对外提供服务,默认端口10000,启动方式为$HIVE_HOME/bin/hive--service hiveserver。
4、       hwi为web接口,可以通过浏览器访问hive,默认端口9999,启动方式为$HIVE_HOME/bin/hive--service hwi。
5、       每个服务间互相独立,有各自的配置文件(配置metasotre/namenode/jobtracker等),如果metasotre的配置一样则物理上对应同一hive库。
6、       Driver用于解释、编译、优化、执行HQL,每个service的Driver相互独立。
7、       CLI为用户提供命令行接口,每个CLI独享配置,即在一个CLI里修改配置不影响别的CLI。
8、       多个JDBC可同时连到同一HiveServer上,所有会话共享一份配置。(注:从0.9.0起hiveserver配置已经从global降为session,即每个session的配置相互独立,见 [HIVE-2503])
9、       多个浏览器可同时连到同一HWI上,所有会话共享一份配置。

二、MetaStore
MetaStore位置通过参数javax.jdo.option.ConnectionURL来指定,可在会话中自由修改。相关的参数包括:
javax.jdo.option.ConnectionDriverName#数据库驱动
javax.jdo.option.ConnectionURL          #数据库ip端口库名等
javax.jdo.option.ConnectionUserName   #用户名
javax.jdo.option.ConnectionPassword    #密码
通过修改这些参数可以在多个MetaStore间热切换,可用于HA。

三、NameNode与JobTracker
NameNode由fs.default.name指定,JobTracker由mapred.job.tracker指定,这两个参数都可以在会话中自由修改来指向不同的NameNode和JobTracker。
配合MetaStore可以有多种组合出现,例如在同一个MetaStore里让table1的数据存在HDFS1,用JobTracker1计算,table2的数据存在HDFS2,用JobTracker2计算,或者让两个表都在JobTracker3上计算。

四、注意事项
1、       NameNode和JobTracker最好指向同一个集群,否则计算的时候需要跨集群复制数据。
2、       在MetaStore存储的是表数据文件的绝对路径,当心其与NameNode/JobTracker不再同一个集群里导致夸集群复制。
3、       对hiveserver与hwi配置的修改会作用到同一service上的所有会话。 (注:从0.9.0起hiveserver配置已经从global降为session,即每个session的配置相互独立,见 [HIVE-2503])

 


 

  • 大小: 69.8 KB
分享到:
评论

相关推荐

    Hive体系架构、安装与HiveQL

    Hive体系架构、安装与HiveQL,Hive体系架构、安装与HiveQL,Hive体系架构、安装与HiveQL

    Hive体系架构安装与HiveQL,应用案例.pdf

    Hive体系架构安装与HiveQL,应用案例

    云计算大数据全套

    6.Hive体系架构安装与HiveQL应用案例 7.HBase体系架构与安装 8.HBase数据分析与建模,实战案例剖析 9.Map-Reduce数据分析,Hadoop流,应用案例 10.Map-Reduce数据分析之一,API实战 11.Map-Reduce体系架构 12.等等

    炼数成金 Hadoop 视频教程

    27.Hive体系架构安装与HiveQL,应用案例1 28.Hive体系架构安装与HiveQL,应用案例2 29.Pig安装与Pig Latin语言,应用案例1 30.Pig安装与Pig Latin语言,应用案例2 31.Pig安装与Pig Latin语言,应用案例3 32.Pig安装...

    Hive体系结构介绍

    图1.1Hive体系结构(1)用户接口主要有三个:CLI,Client和WUI。其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端,用户连接至HiveServer。在启动Client模式的时候,需要指出...

    Hive数据仓库工具

    一、Hive的概述; 二、Hive的体系架构; 三、探讨Hadoop全家(生态圈); 四、Hive与传统数据库相比; 五、Hive的数据模型(自主学习); 六、搭建Haoop 2.7.6结合hive2.3.3实现数据仓库管理;

    详解Hadoop核心架构HDFS+MapReduce+Hbase+Hive

    通过对Hadoop分布式计算平台最...整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务处理的程序支持。HDFS采用主从(Master/Slave)结构模型,一个HDFS集群是由一个Nam

    学习数据仓库Hive

    1,hadoop的体系架构中:  两个数据分析引擎:(*)Hive:支持sql  (*)Pig:支持PigLatin  一,什么是hive? 1,hive是一个基于hdfs之上的数据仓库  hive hdfs  表 目录  数据 文件  分区表 目录  分桶...

    数据仓库实战:Hive、HBase、Kylin、ClickHouse

    数据仓库实战:Hive、HBase、Kylin、ClickHouse 包含 01~大数据体系 02~数据集成 03~数仓建模 04~数据可视化 等等 在学习与实践软件分布式架构过程中的,笔记与代码的仓库;主要包含分布式计算、分布式系统、数据...

    HCIA-Big Data V2.0视频.zip

    6.2 Hive功能与架构-Hive基本操作 7.1 Streaming的概述和架构 7.2 Streaming特性和StreamCQL介绍 8.1 Flink概述-Flink原理与技术架构 8.2 Flink的底层原理和集成情况 9.1 Loader数据转换 10.1 Flume的关键流程和...

    华为HCIA-Big Data V2.0 LVC公开课培训视频教程【共25集】.rar

    6.2.1 Hive功能与架构-Hive基本操作 7.1.1 Streaming的概述和架构 7.2.1 Streaming特性和StreamCQL介绍 8.1.1 Flink概述-Flink原理与技术架构 8.2.1 Flink的底层原理和集成情况 9.1.1 Loader数据转换 10.1.1 ...

    大数据面试题,从0到1走向架构师之路。Flink、Spark、Hive、HBase

    一线互联网大厂大数据面试题库,大数据全栈学习【生态组件,技术栈,数据流,数据仓库,数据库,指标体系,血缘关系,元数据管理,数据质量,DataWorks,Hadoop,Spark,Flink,面试,笔记文档,实战练习、采集、存储...

    大数据之运维.pptx

    Hive 体系结构 用户接口 用户接口主要有三个:CLI,Client 和 WUI。 元数据存储 Hive 将元数据存储在数据库中,如 mysql、derby。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等)...

    Datawarehouse-Series:数据仓库实战:Hive、HBase、Kylin、ClickHouse

    · · · 数据仓库 在《》中我们讨论了数据仓库的基础理论...您还可以前往 NGTE Books 主页浏览包含知识体系、编程语言、软件工程、模式与架构、Web 与大前端、服务端开发实践与工程架构、分布式基础架构、人工

    2017最新大数据架构师精英课程

    7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S 9_多线程-yield-join-daemon-synchronized; o, E; \* I: E2 W 10_多线程-同步代码块-同步方法 11_多线程-生产消费问题 12_多线程-死锁问题 13_字符集...

    【推荐】最强大数据学习与最佳实践资料合集(基础+架构+数仓+治理+案例)(100份).zip

    推荐,最强大数据学习与最佳实践资料合集,基础+架构+治理+案例,共100份。 一、基础篇 快手EB级HDFS挑战与实践 Hive任务开发规范 一文看懂Hadoop生态圈 资料-CentOS7搭建Hadoop-2.7.7集群 ClickHouse官方中文文档 ...

    大纲及下载地址.doc

    11 - Kafka客户端容错体系源 12 - Kafka服务端高性能架构设计源码剖析 13 - Kafka数据管理源码剖析 14 - 大数据集群资源如何评估 15 - DT时代转型中的数据中台建设 16 - 数据中台建设数据治理篇 17 - Scala视频

    大型分布式网站架构与实践

    第1章 面向服务的体系架构(SOA) 1  本章主要介绍和解决以下问题,这些也是全书的基础:  HTTP协议的工作方式与HTTP网络协议栈的结构。  如何实现基于HTTP协议和TCP协议的RPC调用,它们之间有何差别,分别适应...

Global site tag (gtag.js) - Google Analytics