HIVE 的安装其实没那么复杂,前提是你已经搭建好了 HDFS 集群。HIVE 就像是一个工具,能根据 SQL 语义将任务转化为 MapReduce 作业,在 HDFS 集群上跑,把结果返回给你。这里的手册重点是告诉你如何使用 HIVE,而不是讲架构。所以,如果你已经有了 HDFS 集群,接下来只需要按步骤安装 HIVE 就好啦。
你可以从 Apache 的历史版本下载 HIVE,像我当时用的是 HIVE 0.12.0,适配 JDK6 的环境。至于 HIVE 能干啥,简单来说,它就是做数据挖掘的,像日志、统计这些,应用还是挺广的。比如,你有个日志文件text.log
,就能用 HIVE 快速挖掘里面的信息。
这篇文章更多是告诉你如何操作和使用 HIVE,而不是理论。如果你对 HDFS 集群的搭建已经有经验,按照步骤来安装和配置 HIVE 是比较事,嗯,搞定之后你就能开始进行数据了。