64 位 Linux 系统下的 Scala 和 Spark 组合包,挺适合搞大数据开发的朋友。Scala是运行在 JVM 上的静态类型语言,语法清爽,还能写函数式代码,开发起来省事。配合Spark,分布式计算效率嘎嘎高,内存快、延迟低,批、流、机器学习都能搞。安装完,直接跑bin/spark-shell或者bin/pyspark就能开干。记得 Java 8 要装好,少不了的依赖。文件里工具目录齐全,像binconflib都有,动手之前可以先瞄一眼配置。嗯,如果你正好在整 PB 级别数据,或者打算上手分布式框架,这压缩包还挺值得试试。