大数据技术体系里,涵盖的技术其实挺广泛的,涉及从数据采集到、存储再到可视化等各个层面。像Sqoop负责数据的导入导出,HDFS和各种 NoSQL 数据库像CassandraMongoDB,则是大数据的存储利器。对于流,你可以看看FlinkSpark Streaming,而HiveSpark SQL等 SQL 引擎也都给力。再说到可视化,EChartsD3这类工具能够让数据展示更加生动直观。如果你还需要高性能计算框架,Spark CoreMapReduce无疑是首选。整体来看,整个大数据体系从采集、存储、计算到都全面,如果你正在做类似项目,了解这些工具有。