当今大数据已广泛应用于各行各业,大数据相关的存储和分布式计算等基本知识也成为时下大学生,尤其是计算机相关专业学生应具备的知识。本书在内容上去繁就简,重点介绍大数据的相关基本概念和原理,包括存储原理和分布式处理的原理。本书主要围绕Hadoop大数据处理平台(第2章),介绍其中涉及的HDFS(第3章)、HBase(第4章)等存储技术和Hadoop MapReduce分布式处理技术(第6章);介绍了大数据相关的存储技术NoSQL数据库(第5章)以及数据仓库技术Hive(第7章);并对新兴的大数据平台Spark(第8章)以及其他流行的大数据技术(第9章)进行了介绍。 本书适合计算机专业的低年级学生作为大数据入门课程的教材或者其他专业学生的大数据课程教材。 |
前辅文 |
|
|
|
|
|
|
|
|
|
|