Hive - 博豪信息 - 第15页

Linux 拨号vps windows公众号手机端

hive性能调优的技巧有哪些

增加硬件资源：通过增加节点、内存、CPU等硬件资源来提升Hive的性能。数据分区和分桶：合理使用数据分区和数据分桶可以减少数据扫描的数量，提升查询性能。建立索引：在需要...

Hive

6年前 (2020-02-03) 19 阅读 #网络运维
hive导出数据到本地的方法是什么

要将Hive中的数据导出到本地，可以使用以下方法：使用INSERT OVERWRITE LOCAL DIRECTORY命令将数据导出到本地文件系统。例如，可以使用以下命令将数据导出...

Hive

6年前 (2020-02-03) 18 阅读 #网络运维
hive无法查询flink创建的表怎么解决

要查询Flink创建的表，可以使用Flink的REST API来查询表的元数据信息。首先需要启动Flink的REST API服务，然后可以通过发送HTTP请求来获取表的元数据信息。以...

Hive

6年前 (2020-02-03) 17 阅读 #大数据
hive如何给表添加一个字段

要给Hive表添加一个字段，需要使用ALTER TABLE语句。以下是一个示例： ALTER TABLE table_name ADD COLUMN new_column_name...

Hive

6年前 (2020-02-03) 18 阅读 #网络运维
hive怎么查看每个分区的数据量

可以通过以下方式查看每个分区的数据量：使用Hive命令行界面，输入以下命令： SHOW PARTITIONS table_name; 其中table_name是你要查看分区数据量...

Hive

6年前 (2020-02-02) 17 阅读 #大数据
Hive中的partitioning和bucketing是什么

Hive中的partitioning和bucketing是一种数据分区和数据分桶的技术，用于提高查询性能和管理数据。 Partitioning（分区）：将数据根据某个列的值分成多个...

Hive

6年前 (2020-02-02) 17 阅读 #网络运维
spark与hive的优缺点是什么

Spark优点：高性能：Spark采用内存计算，比Hive更快速。处理实时数据：Spark可以处理实时数据流，支持流式计算。处理复杂计算：Spark支持复杂的计算操作，如图计算...

Hive spark

6年前 (2020-02-02) 18 阅读 #网络运维
Hive中怎么定义和使用表分区

在Hive中，表分区是按照表的某个列的值进行分割和存储数据的方式，可以提高查询效率和管理数据。以下是在Hive中定义和使用表分区的步骤：定义表分区：在创建表的时候，使用PARTIT...

Hive

6年前 (2020-02-02) 16 阅读 #网络运维
hive lag函数的作用是什么

Hive lag函数用于获取某一行在当前分区中指定偏移量前的行数据。这个函数主要用于在Hive中进行时间序列数据处理时，可以用来获取前一行或前几行的数据，用于计算差值或比较数据。通过...

Hive

6年前 (2020-02-02) 17 阅读 #网络运维
hive中join和where的执行顺序是什么

在Hive中，join和where的执行顺序是由查询优化器决定的，通常不是固定的。查询优化器会根据表的大小、数据倾斜度、索引信息等多方面考虑，选择最优的执行顺序。一般来说，Hive...

Hive

6年前 (2020-02-02) 19 阅读 #大数据
hive中如何添加二级分区

要添加二级分区，首先需要确保已经创建了一级分区。然后按照以下步骤添加二级分区：使用ALTER TABLE命令来添加二级分区。例如，如果要在分区date=2020-01-01下添加二...

Hive

6年前 (2020-02-02) 18 阅读 #网络运维
如何查看hive运行日志

要查看Hive运行日志，可以按照以下步骤进行操作：登录到运行Hive的服务器上。打开终端或命令提示符。使用以下命令进入到Hive的日志目录： cd /var/log...

Hive

6年前 (2020-02-02) 18 阅读 #大数据
hive join优化的方法是什么

Hive是一个建立在Hadoop上的数据仓库基础架构，用于处理大规模数据集并支持SQL查询。在Hive中，可以使用优化方法来改善JOIN操作的性能。以下是一些常用的Hive JOIN...

Hive

6年前 (2020-02-02) 17 阅读 #大数据
hive中lead函数的作用是什么

Hive中的lead函数用于获取指定列的下一个值。通过指定偏移量来获取下一个值，可以在查询中使用lead函数来实现对比相邻行的操作。lead函数的语法如下： LEAD(col, of...

Hive

6年前 (2020-02-02) 17 阅读 #大数据
hive创建表的方式有哪几种

Hive创建表的方式有以下几种：使用HiveQL语句创建表：可以使用HiveQL语句创建表，类似于SQL语句。可以指定表的名称、列名、数据类型、分区等信息。使用外部表创建表...

Hive

6年前 (2020-02-01) 15 阅读 #大数据

‹‹ ‹ 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 › ››

文章归档