Hive的安装及使用方法


这篇文章主要介绍“ Hive的安装及使用方法”,在日常操作中,相信很多人在 Hive的安装及使用方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答” Hive的安装及使用方法”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!前言Hive是Hadoop一个程序接口,Hive让数据分析人员快速上手,Hive使用了类SQL的语法,Hive让JAVA的世界变得简单而轻巧,Hive让Hadoop普及到了程序员以外的人。从Hive开始,让分析师们也能玩转大数据目录Hive的安装Hive的基本使用:CRUDHive交互式模式数据导入数据导出Hive查询HiveQLHive视图Hive分区表系统环境
装好hadoop的环境后,我们可以把Hive装在namenode机器上(c1)。
hadoop的环境,请参考:让Hadoop跑在云端系列文章,RHadoop实践系列之一:Hadoop环境搭建下载: hive-0.9.0.tar.gz
解压到: /home/cos/toolkit/hive-0.9.0hive配置修改hive-site.xml配置文件
把Hive的元数据存储到MySQL中修改hive-log4j.properties设置环境变量在hdfs上面,创建目录在MySQL中创建数据库手动上传mysql的jdbc库到hive/lib启动hive查询MySQL数据库中的元数据Hive已经成功安装,下面是hive的使用攻略。1. 进入hive控制台新建表查看表和数据修改表删除表quit,exit: 退出交互式shellreset: 重置配置为默认值set = : 修改特定变量的值(如果变量名拼写错误,不会报错)set: 输出用户覆盖的hive配置变量set -v : 输出所有Hadoop和Hive的配置变量add FILE[S] *,add JAR[S] *,add ARCHIVE[S] * : 添加 一个或多个 file, jar, archives到分布式缓存list FILE[S],list JAR[S],list ARCHIVE[S] : 输出已经添加到分布式缓存的资源。list FILE[S] *,list JAR[S] *,list ARCHIVE[S] * : 检查给定的资源是否添加到分布式缓存delete FILE[S] *,delete JAR[S] *,delete ARCHIVE[S] * : 从分布式缓存删除指定的资源! :dfs : 从Hive shell执行一个dfs命令 : 执行一个Hive 查询,然后输出结果到标准输出source FILE : 在CLI里执行一个hive脚本文件还以刚才的t_hive为例。从操作本地文件系统加载数据(LOCAL)从HDFS加载数据从其他表导入数据创建表并从其他表导入数据仅复制开发云主机域名表结构不导数据从MySQL数据库导入数据
我们将在介绍Sqoop时讲。从HDFS复制到HDFS其他位置通过Hive导出到本地文件系统注:以下代码将去掉map,reduce的日志输出部分。普通查询:排序,列别名,嵌套子查询连接查询:JOIN聚合查询1:count, avg聚合查询2:count, distinct聚合查询3:GROUP BY, HAVINGHive视图和数据库视图的概念是一样的,我们还以t_hive为例。删除视图分区表是数据库的基本概念,但很多时候数据量不大,我们完全用不到分区表。Hive是一种OLAP数据仓库软件,涉及的数据量是非常大的,所以分区表在这个场景就显得非常重要!!下面我们重新定义一个数据表结构:t_hft创建数据创建数据表创建分区数据表
根据业务:按天和股票ID进行分区设计导入数据查看分区表查询数据到此,关于“ Hive的安装及使用方法”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注开发云网站,小编会继续努力为大家带来更多实用的文章!

相关推荐: 虚拟主机为什么可以不备案

虚拟主机为什么可以不备案?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面开发云主机域名小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。免备案的虚拟主机是指香港、澳门、台湾特别行政区和国外的虚拟主机,因为网站备案要求是我国工信部的规…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 05/19 21:59
下一篇 05/19 21:59

相关推荐