查询条数的统计,算是 Hive 入门里最常用的一招了,简单粗暴但效果还挺不错。你只要在 select 后面加个 count(*),像这样:select count(*) from bigdata_user,就能看到整张表到底有多少行。适合那种想先摸清表结构再继续深入的场景。

不过呢,这条命令背后可是要跑一整个 MapReduce 的,执行时间 10 秒左右。如果你发现卡在 map 阶段不动,那多半是集群有点问题,建议先看看节点状态是不是都正常,是 HadoopHive 的进程。

如果你是初学者,又正好在做类似信号的活儿,那这部分内容还挺实用的。下面这几个资源我自己用下来还不错,顺带推荐给你:

如果你也在折腾 Hive 查询,不妨先跑跑 count(*) 练练手,顺带看看 MapReduce 的执行流程。有问题,八成是集群没跑好,记得先排查下环境再说。