Hive查询统计与二相编码信号性能分析

查询条数的统计，算是 Hive 入门里最常用的一招了，简单粗暴但效果还挺不错。你只要在 select 后面加个 count(*)，像这样：select count(*) from bigdata_user，就能看到整张表到底有多少行。适合那种想先摸清表结构再继续深入的场景。

不过呢，这条命令背后可是要跑一整个 MapReduce 的，执行时间 10 秒左右。如果你发现卡在 map 阶段不动，那多半是集群有点问题，建议先看看节点状态是不是都正常，是 Hadoop 和 Hive 的进程。

如果你是初学者，又正好在做类似信号的活儿，那这部分内容还挺实用的。下面这几个资源我自己用下来还不错，顺带推荐给你：

如果你也在折腾 Hive 查询，不妨先跑跑 count(*) 练练手，顺带看看 MapReduce 的执行流程。有问题，八成是集群没跑好，记得先排查下环境再说。