最新实例
Hadoop入门学习路线文档
大数据时代,想搞懂 Hadoop,其实也没你想的那么难。整理了一份比较系统的Hadoop 入门学习文档,内容覆盖面挺广,从大数据基础聊到 Hadoop 架构,再到搭环境、跑模式,还带你玩源码编译,算是一步步带你入门的路线图。尤其对还没怎么接触过大数据开发的前端或者后端朋友,蛮友好的。 大数据的四大特点讲得比较接地气,什么数据量大、更新快、格式多、信息杂,配了应用场景,比如广告推荐、个性化零售服务,挺容易理解的。如果你是那种边学边看案例的类型,会觉得挺顺手。 Hadoop 的三大件——HDFS、MapReduce、YARN,也都有。每个部分都有例子,比如怎么在本地跑个小测试,怎么搭伪分布式,怎么
Hadoop 2.9.0core-default.xml配置属性集
Hadoop 2.9.0 版本的core-default.xml配置文件,对于搭建和管理大数据集群来说相当重要。它包含了一些核心属性,可以你调整 Hadoop 集群的各种设置。比如,hadoop.tmp.dir指定了临时目录的路径,io.native.lib.available控制是否启用本地库来压缩数据。还有hadoop.security.authorization等安全属性,你提高系统的安全性。配置这些属性时要小心,不当的设置会影响系统稳定性和安全性。嗯,如果你对这些属性了解清楚了,就能更好地优化和维护集群了。
Hadoop Windows本地运行环境
Windows 上的 Hadoop 运行环境,挺适合用来做本地测试和学习的。虽然 Hadoop 本来是奔着 Linux 去的,但有了这个环境,Windows 用户也能轻松体验分布式大数据的乐趣。整个包配置得还挺齐,像Winutils.exe这类关键工具都预置好了,少了不少折腾。 Java 环境的配置是第一步,别忘了设好JAVA_HOME。解压包之后,直接把hadooponwindows-master.zip丢到比如C:\Hadoop下面,改改配置文件,指定路径啥的,一般问题不大。 HDFS 的初始化用hadoop namenode -format命令搞定,之后用start-dfs.cmd和st
华为Big Data大数据考试教材合集HCIA 2.0/HCIP 1.0/HCIE
华为的大数据教材,内容挺全的,涵盖了从入门到进阶的整个路线,适合想系统学大数据的前端、后端或者数据工程师。HCIA-BigData_V2.0的教材,主要讲基础概念,比如怎么存数据、怎么数据,还有、这类常见组件。你要是完全没接触过大数据,先过这一关比较稳。而且它的实验手册也不错,能实操搭集群、跑程序,理论结合实践,效率挺高。往上走就是HCIP-Big_Data_Developer_V1.0,这个阶段重点是开发。讲了怎么清洗数据、怎么集成、还讲了不少Spark的实时技巧。动手部分也蛮扎实,有不少Java和Python的开发练习,适合有点编程基础的同学,学完能自己做点像样的项目。再进阶到HCIE-B
Hadoop本地运行支持文件
Hadoop 的 winutils.exe 在 Windows 上蛮重要的,尤其是你在本地开发或者测试 Hadoop、Hive、HBase 之类工具的时候。没有它,程序一跑就报错,像Could not locate executable null \bin\winutils.exe这种,挺烦的。其实 winutils.exe 就是帮你在 Windows 上模拟一些 Linux 的底层操作,比如文件权限、符号链接啥的,Hadoop 原生是跑在 Linux 上的嘛,所以 Windows 下要多做点功课。
Spark开源大数据架构
开源大数据技术架构的内容比较全,适合刚入行或者想快速上手的同学。像Spark、HBase、Scala这些组合在一起,实战价值高,而且讲得蛮细,基本能照着搭建环境。还有些硬件选型建议和实际项目案例,挺接地气,适合企业项目做参考。
Cloudera Impala JDBC 41 2.6.12.1013驱动包
Cloudera 的 Impala JDBC 2.6.12 驱动包,挺适合用在老项目对接大数据查询那块儿的。ClouderaImpalaJDBC41-2.6.12.1013.zip里主要就是那个核心的ImpalaJDBC41.2.6.12.jar,用来跑 JDBC 连接。你要是搞 BI 平台接入或者要用 Java 连 Impala,直接上它,省事还稳定。兼容性比较不错,JDK1.8配着也没啥问题。 ClouderaImpalaJDBC41-2.6.12.1013.zip的核心其实就是那个ImpalaJDBC41.2.6.12.jar,你只要引进去,配置下连接串,就能搞定大部分 Impala 数
Elasticsearch权威指南中文版
深入讲 Elasticsearch 的中文书还挺少的,《Elasticsearch 权威指南中文版》算是里面比较实用的一本。不光把核心概念都讲清楚了,还配了不少场景例子,哪怕你是第一次接触 ES,看完也能明白大致怎么用,怎么调优。分布式的搜索引擎怎么理解?嗯,书里有一段讲得直白:你可以把它想成一个“聪明的图书管理员”,不光能记住你所有书放哪,还能按你说的关键词飞快翻出来。实时性、扩展性都讲得挺细,Shard和Replica怎么配、怎么保数据安全这些也都有。对了,它还专门拆解了每个核心部件,比如Index、Document、Mapping这些的关系,讲得比较顺,你能一边读一边试。像我当时第一次搭
PPT模板华为集团图标库合集
华为集团的胶片图标库,图标样式比较统一,颜色控制得还挺克制,适合做那种偏商务、偏汇报的 PPT。文件整理得比较全,终端类、网络类、系统类的图标一应俱全,懒得自己画图标的时候,这一套真能省不少事。 华为终端类图标的 PPT 模板,也在这套里面,嗯,图标风格跟华为官方那套风格比较接近。做产品、年终总结啥的,直接套就行。省时省力,改颜色改大小也方便,响应也快。 配套的还有一些比较实用的 PPT 模板资源,像年终总结报告 PPT 模板.zip、商务办公数据展示工具 PPT 模板汇总,风格跟图标库挺搭。用起来比较顺手,是做大屏展示或者技术汇报那种场景。 如果你经常做PPT 方案,或者接手华为项目的汇报材
自控2016-2017学年试卷及答案
自控专业的朋友应该都知道,平时复习最头疼的就是题太散,答案不全,复习没头绪。16、17 学年的试卷资料就蛮实用,覆盖面广,题型经典,关键是答案整理得还挺清楚。函数法、滞后校正、劳斯判据这些核心知识点都有涉及,平时准备考试或者回顾知识结构都挺方便。 里面讲的系统稳定性那块还比较细,不只是讲定义,还结合了传递函数、极点位置这些东西,说白了就是教你怎么看系统稳不稳定、怎么调参数让它稳。对于刚开始学控制理论的人来说,这种资料真的是“比书本讲得还明白”。 有些知识点,比如对数幅频特性和相角裕量,多人学的时候会懵,这套卷子搭配解析就挺清楚:哪里要注意增益变化、哪里相位容易出问题,讲得都比较接地气。再比如Z