先来看更常使用的大数据分析工具Hadoop。Hadoop作为大数据分析的领军代表,提供可靠存储HDFS以及MapReduce编程范式以便大规模并行处理数据。TSDB作为存储海量数据的数据源,自然更需要Hadoop的帮助来做数据分析啦。我们都知道,Hadoop提供了基于廉价硬件实现大规模并行处理的能力,不过,简单的查询都要写MapReduce代码,对于商业用户实在不怎么友好。所以TSDB采用了更友好的方式,直接提供基于TSDB的HiveSQL。Hive是一个关系数据仓库,用户可以方便的利用类似SQL语言查询数据,而Hive会自动把SQL语言转换成MapReduce代码交给Hadoop处理。
分享文章:TSDB的数据如何利用Hadoop/spark集群做数据分析
文章起源:
http://jkwzsj.com/article/eegjge.html