本书聚焦于Hadoop、Spark、Flink 等面向数据密集型应用的分布式计算系统,将原理、架构、编程的知识进行有机结合,统一从设计思想、体系架构、工作原理、容错机制和编程示例5 个维度进行剖析。本书注重通过横向比较阐释该类系统设计的共性原理,帮助读者形成完整、统一的知识体系。 本书概述了分布式计算系统(第1 章),根据应用场景的差异将分布式计算系统划分为批处理系统(第3、4 章)、流计算系统(第7、8 章)、批流融合系统(第9、10 章)、图处理系统(第11 章),并选取了各个类别中的典型代表。由于这些分布式计算系统不可能孤立地存在,因此本书也介绍了面向文件存储(第2 章)、资源管理(第5 章)以及协调服务(第6 章)的系统。 本书可作为高等院校数据科学与大数据技术专业高年级本科生的教学用书,以及计算机科学与技术、软件工程、数据科学与工程等专业研究生的教学用书,也可作为部分业界研发人员的参考用书。 |
前辅文 |
|
|
|
|
|
|
|
|
|
|
云计算是一种新兴的共享基础架构的方法,可以将巨大的系统池连接在一起以提供各种IT服务。云计算被视为“革命性的计算模型”,因为它通过互联网自由流通使超级计算能力成为可能。 本书基于作者团队多年的云计算从业及教学实践编写而成,系统地阐述了云计算、云原生等相关理论,主要内容包括云计算基础、云计算核心技术、云原生应用的开发、云服务的基础设施构建、云服务的编排与管理、云服务的运维、云计算进阶技术。 本书不仅适合作为计算机专业、数据专业、软件专业的课程教材,还可以作为企业专业人员、技术人员的参考资料。本书在附录中提供了实训所需要的相关资源,方便读者参考与使用。 |
前辅文 |
|
|
|
|
|
|
|
|
|
|
本书是大数据新兴领域“十四五”高等教育教材。本书展现了大语言模型技术的整体框架和路线图,内容讲解力求简明、准确、实用,旨在为相关行业提供大模型技术的中文参考资料,推动我国相关人工智能技术的发展。全书共13章,内容涉及大模型的背景与基础知识、预训练、微调与对齐、模型使用、评测与资源等,同时提供了相关代码示例与实验工具包。 本书可供具有深度学习基础的读者阅读与使用,既可作为高等学校人工智能、大数据、计算机类专业教材,也可作为相关从业与研究人员的参考用书。 |
前辅文 |
|
|
|
|
|
|
|
|
|
|
本书是大数据新兴领域“十四五”高等教育教材。本书系统地介绍大数据涵盖的知识,包括数据与大数据、大数据获取、大数据管理、大数据处理、大数据分析、大数据安全、大数据治理等;同时介绍部分行业中大数据的典型应用案例,反映大数据在社会经济生活中的重要价值。本书旨在从技术层面,提供一本全面介绍大数据相关技术的专业教材。各章均设有习题。 本书既可作为高等学校大数据相关专业的教材使用,也可供大数据领域专业技术人员参考。 |
前辅文 |
|
|
|
|
|
|
|
|
|
|
本书是数据科学与工程专业核心教材之一,内容涉及区块链系统的存储、执行、共识、查询、隐私保护等核心技术,旨在帮助读者快速建立理解、使用和研发区块链系统所必备的知识体系——从比特币、以太坊和超级账本Fabric等主流开源区块链架构出发,延伸至基于平台的上层分布式应用开发实践,再到系统底层所涉及的核心理论和关键技术。结合具体实操系统,从感性到理性,由表及里,循序渐进;并在讲解原理的同时,突出其在真实系统中的实现和运行机制,形成从理论到实践、再从实践上升到理论的闭环。 本书为新形态教材,提供配套的讲义、代码、习题及参考答案等数字资源,内容直观翔实,便于教师授课与读者学习。本书适用于学生、计算机领域科研人员和从业人员,以及其他对区块链感兴趣的读者,可作为本科生和研究生学习区块链技术的教材,也可作为从事相关研究、工作的人员以及各类自学人员的学习资源。 |
前辅文 |
|
|
|
|
|
|
|
|
|
|
本书从概率统计、线性代数和组合优化角度出发, 介绍经典的数据科学与工程算法, 内容涉及数据分析处理全流程的算法及其数学基础, 主要包括抽样算法; 尾概率不等式及其应用; 典型的哈希技术, 如布隆过滤器和局部敏感哈希; 数据流模型以及典型 Misra Gries 算法、Count Sketch 算法; 随机游走及其应用; EM 算法; 特征值计算; 奇异值分解和主成分分析;矩阵分解; 整数规划; 子模函数及其应用; 模块度及社区发现等。全书配有大量翔实的应用实例可供参考, 有相当数量的习题可供读者练习。 本书可作为数据科学与大数据技术专业本科生、研究生相关课程的教材或参考书, 也可供相关领域技术人员参考。 |
前辅文 对比栏
|