使用Azure HDInsight处理大数据-2017

《使用Azure HDInsight处理大数据-2017》专注于如何利用Azure HDInsight进行大数据处理。在深入讨论之前，需要理解几个关键概念和组件。Azure HDInsight是微软Azure云平台上的一项服务，用于在云中部署和管理Hadoop集群。Hadoop基于HDFS分布式文件系统和MapReduce编程模型，允许存储和处理大数据。该书探讨了Hadoop生态系统中的各种工具和库，如Hive、Pig、HBase等，以及Azure HDInsight的优势，如高度可扩展性和与Azure生态的集成。