Hive

hive架构

  1. 数据存储位置

    Hive的数据存储在hdfs上元数据可以存储在指定的地方比如mysql,PostgreSQL等。

  2. 数据更新

    Hive处理数据时一般不对数据进行改写,因为它不支持行级别的增删操作,如果要进行更新数据,一般可以通过分区或者表直接覆盖。

  3. 执行效率

    Hive 执行延迟较高。虽然在小数据量时传统数据库延迟更低,但是当数据规模大到超过传统数据库的处理能力的时候,Hive 的并行计算显然能体现出优势。

  4. 数据规模

    Hive 支持大规模的数据计算,通常是PB级别的数据。