大道至简,知易行难
广阔天地,大有作为

分布式基础设施

Centos 7.4上Grafana的安装及与InfluxDB搭配的简单使用

mlkui阅读(90)评论(0)

Grafana是在互联网架构和应用分析中最流行的时序数据可视化工具,并且也在工业监控、气象监控、家居自动化和过程管理等领域有着广泛的应用。 我们可以访问Grafana官方网站的下载地址https://grafana.com/grafana/...

HBASE查看表行数及表大小

mlkui阅读(131)评论(0)

1、查看表行数 将运行一个MR任务: [crayon-5e515e162811d598500325/] 2、查看表占用空间 实际是查看HDFS文件系统占用空间: [crayon-5e515e162811d520101948/]  ...

Hive针对HDFS中Parquet格式文件建表及查询

mlkui阅读(200)评论(0)

一、Parquet基础 Parquet是Apache的顶级项目,Parquet是一种面向分析的、平台/语言无关的、支持嵌套数据的列式存储格式,兼容Spark、Hive、Impala等,Parquet作为HDFS存储格式的事实标准之一(其他常...

合并多个parquet文件

mlkui阅读(173)评论(0)

一、parquet-tools 首先考虑使用parquet-tools。根据参考文档0和参考文档1中的说法: parquet-tools version 1.8.2 supports merge command. 其使用的命令为: [cra...

Hive导入数据的四种方式

mlkui阅读(130)评论(0)

Hive导入数据有四种方式: 1、从本地文件系统导入数据 2、从HDFS中导入数据 3、从其他的Hive表中导入数据 4、创建表的同时导入数据(CTAS结构) 在使用导入数据时,通常会用到INTO和OVERWRITE INTO两个关键字。其...

Hive中列类型修改规则

mlkui阅读(132)评论(0)

在Hive中使用ALTER修改列类型时长餐刚看到如下的错误: [crayon-5e515e162be26705270148/] 问题在于在Hive中执行ALTER列操作时只能按照如下的强制类型转换规则进行: 转载时请保留出处,违法转载追究到...