Atlas如何集成HIve


这篇文章主要为大家展示了“Atlas如何集成HIve”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Atlas如何集成HIve”这篇文章吧。在安装好Atlas以后,如果想要使用起来,还要让Atlas与其他组件建立联系。其中最常用的就是Hive。通过Atlas的架构,只要配置好Hive Hook ,那么每次Hive做任何操作就会写入Kafka从而被atlas接收。并在Atlas中已图的形式展示出来。都会记录Hive哪些操作信息呢?Altas对Hive Model进行了定义。包含以下内容:类型:Asset属性:qualifiedName, name, description, owner, clusterName, location, parameters, ownerName类型:DataSet属性:qualifiedName, name, description, owner, db, createTime, lastAccessTime, comment, retention, sd, partitionKeys, columns, aliases, parameters, viewOriginalText, viewExpandedText, tableType, temporaryhive_column类型:DataSet属性:qualifiedName, name, description, owner, type, comment, tablehive_storagedesc类型:Referenceable属性:qualifiedName, table, location, inputFormat, outputFormat, compressed, numBuckets, serdeInfo, bucketCols, sortCols, parameter 香港云主机s, storedAsSubDirectorieshive_process类型:Process属性:qualifiedName, name, description, owner, inputs, outputs, startTime, endTime, userName, operationType, queryText, queryPlan, queryId, clusterNamehive_column_lineage类型:Process属性:qualifiedName, name, description, owner, inputs, outputs, query, depenendencyType, expressionhive_principal_type 值:USER, ROLE, GROUP
hive_order 属性:col, orderhive_serde 属性:name, serializationLib, parametersHIve实体的结构:hive hook会监听hive的 create/update/delete 操作,下面是配置步骤:1、修改hive-env.sh(指定包地址)2、修改hive-site.xml(配置完需要重启hive)注意,这里其实是执行后的监控,可以有执行前,执行中的监控。3、同步配置 拷贝atlas配置文件atlas-application.properties到hive配置目录 添加配置:bin/import-hive.shUsing Hive configuration directory [/opt/module/hive/conf]Log file for import is /opt/module/atlas/logs/import-hive.loglog4j:WARN No such property [maxFileSize] in org.apache.log4j.PatternLayout.log4j:WARN No such property [maxBackupIndex] in org.apache.log4j.PatternLayout.输入用户名:admin;输入密码:adminEnter username for atlas :- adminEnter password for atlas :-Hive Meta Data import was successful!!!hive第三方jar包没加进去小技巧 使用hive-shell 看一下jar包加进去没有 set这将打印由用户或配置单元覆盖的配置变量列表。以加入elsaticsearch-hadoop-2.1.2.jar为例,讲述在Hive中加入第三方jar的几种方式。1,在hive shell中加入hive> add jar /home/hadoop/elasticsearch-hadoop-hive-2.1.2.jar;2,Jar放入${HIVE_HOME}/auxlib目录在${HIVE_HOME}中创建文件夹auxlib,然后将自定义jar文件放入该文件夹中。此方法添加不需要重启Hive。而且比较便捷。3,HIVE.AUX.JARS.PATH和hive.aux.jars.pathhive-env.sh中的HIVE.AUX.JARS.PATH和hive-site.xml的hive.aux.jars.path配置对服务器无效,仅对当前hive shell有效,不同的hive shell相互不影响,每个hive shell都需要配置,可以配置成文件夹形式。HIVE.AUX.JARS.PATH和hive.aux.jars.path仅支持本地文件。可配置成文件,也可配置为文件夹。HIVE.AUX.JARS.PATH配置不对hive-env.sh脚本中有一段如果给HIVE_AUX_JARS_PATH设值,则/usr/hdp/current/hive-webhcat/share/hcatalog就会被忽略掉。hive只能读取一个HIVE_AUX_JARS_PATH在一个地方集中放置我们的共享jar包,然后在/usr/hdp/current/hive-webhcat/share/hcatalog下面建立一相应的软连接就可以以上是“Atlas如何集成HIve”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注开发云行业资讯频道!

相关推荐: 如何进行Bazel中的自定义工具链分析

如何进行Bazel中的自定义工具链分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。小编讲述 Bazel 自定义工具链的两种方式,Platform 和 Non-Platform 方式。会存在这两种…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 09/13 12:03
下一篇 09/13 12:03

相关推荐