数据密集型应用系统设计 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
数据密集型应用系统设计电子书下载地址
内容简介:
全书分为三大部分:主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数据源来解决所有问题,那么一种自然的方式就是集成多个不同的数据库、缓存模块以及索引模块等。首先第10章以批处理开始来处理派生数据,紧接着第11章采用流式处理。第12章总结之前介绍的多种技术,并分析讨论未来构建可靠、可扩展和可维护应用系统可能的新方向或方法。
书籍目录:
前言 1第一部分 数据系统基础第1章 可靠、可扩展与可维护的应用系统认识数据系统可靠性可扩展性可维护性小结第2章 数据模型与查询语言关系模型与文档模型 数据查询语言图状数据模型小结第3章 数据存储与检索数据库核心:数据结构事务处理与分析处理 列式存储小结第4章 数据编码与演化数据编码格式数据流模式小结第二部分 分布式数据系统第5章 数据复制主节点与从节点 复制滞后问题多主节点复制 无主节点复制小结第6章 数据分区189数据分区与数据复制键-值数据的分区分区与二级索引分区再平衡请求路由 小结第7章 事务深入理解事务弱隔离级别串行化 小结第8章 分布式系统的挑战故障与部分失效不可靠的网络不可靠的时钟知识,真相与谎言 小结第9章 一致性与共识一致性保证可线性化顺序保证分布式事务与共识小结第三部分 派生数据第10章 批处理系统使用UNIX工具进行批处理MapReduce与分布式文件系统超越MapReduce小结第11章 流处理系统发送事件流数据库与流流处理小结第12章 数据系统的未来461数据集成分拆数据库端到端的正确性 做正确的事情 小结术语表
作者介绍:
作者简介
Martin Kleppmann是英国剑桥大学分布式系统方向的研究员。此前,他曾是LinkedIn和Rapportive等互联网公司的软件工程师,负责大规模数据基础设施建设。在此过程中他遇到过一些困难,因此他希望这本书能够帮助读者避免重蹈覆辙。Martin还是一位活跃的会议演讲者、博主和开源贡献者。他认为,每个人都应该学习深刻的技术理念,对技术的深入理解能帮助我们开发出更好的软件。
译者简介
赵军平, 大数据存储与分析资深开发者与推广者(EMC 10余年),GPU异构计算的亲历者。中国计算机协会专家委员,DELL EMC资深架构师。12年系统研发、创新与团队管理经验,擅长数据存储与保护, 云计算与大数据实时分析,GPU异构加速优化等。相关领域已申请中、美技术专利100余项,并多次在SNIA,LinuxConf,Hadoop Summit, Nvidia GPU Tech Conf等做技术分享,持续关注数据密集和计算密集相关技术的演进、融合与赋能推广。
吕云松,北京大学计算机硕士,硕士及DELL EMC中国研究院实习期间专注于大数据实时流式处理相关的研究。现就职于华为2012中软院黎曼实验室,主要从事深度学习的研发。
耿煜,DELL EMC架构师兼GTM负责人,致力于推广企业级数字化转型方案。深耕分布式架构以及云计算12年,先后任职于ChinaCache,Sun Microsystems以及EMC等公司。
李三平,美国麻省大学计算机工程专业博士,DELL EMC中国研究院首席科学家,研究方向为机器学习、深度学习、智能运维、遥感影像等。已在IEEE Transactions期刊和会议上发表论文数十篇,申请美国专利20余项。推崇简约,热衷机器学习。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
UDP is a good choice in situations where delayed data is worthless. For example, in a VoIP phone call, there probably isn’t enough time to retransmit a lost packet before its data is due to be played over the loudspeakers. In this case, there’s no point in retransmitting the packet—the application must instead fill the missing packet’s time slot with silence (causing a brief interruption in the second) and move on in the stream. The retry happens at the human layer instead. (“Could you repeat that please? The sound just cut out for a moment.”)
For data warehouse queries that need to scan over millions of rows, a big bottleneck is the bandwidth for getting data from disk into memory. However, that is not the only bottleneck. Developers of analytical databases also worry about efficiently using the bandwidth from main memory into the CPU cache, avoiding branch mispredictions and bubbles in the CPU instruction processing pipeline, and making use of single-instruction-multi-data (SIMD) instructions in modern CPUs.
Besides reducing the volume of data that needs to be loaded from disk, columnoriented storage layouts are also good for making efficient use of CPU cycles. For example, the query engine can take a chunk of compressed column data that fits comfortably in the CPU’s L1 cache and iterate through it in a tight loop (that is, w...
Sending a packet over a network or making a request to a network service is normally a transient operation that leaves no permanent trace. Although it is possible to record it permanently (using packet capture and logging), we normally don’t think of it that way. Even message brokers that durably write messages to disk quickly delete them again after they have been delivered to consumers, because they are built around a transient messaging mindset.
Databases and filesystems take the opposite approach: everything that is written to a database or file is normally expected to be permanently recorded, at least until someone explicitly chooses to delete it again.
This difference in mindset has a big impact on how derived data is created. A key feature of batch processes, as discussed in Chapter...
SSI is fairly new: it was first described in 2008 [40] and is the subject of Michael Cahill's PhD thesis. ... it has the possibility of being fast enough to become the enw default in the future.
Detecting writes that affect prior reads (the write occurs after the read).
In the context of two-phased locking we discussed index-range locks. .. Wee can use a similar technique here, except that SSI don't block other transactions.
When a transaction writes to the database, it must look in the indexes for any other transactions that have recently read the affected data. This process is similar to acquiring a write lock on the affected key range, but rather than blocking until the readers have committed, the lock acts s a tripwire: it simply notifies the transactions that the data they read may no longer be up to date.
其它内容:
书籍介绍
全书分为三大部分:
第一部分,主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。
第二部分,我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。
第三部分,主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数据源来解决所有问题,那么一种自然的方式就是集成多个不同的数据库、缓存模块以及索引模块等。首先第10章以批处理开始来处理派生数据,紧接着第11章采用流式处理。第12章总结之前介绍的多种技术,并分析讨论未来构建可靠、可扩展和可维护应用系统可能的新方向或方法。
网站评分
书籍多样性:6分
书籍信息完全性:6分
网站更新速度:9分
使用便利性:7分
书籍清晰度:6分
书籍格式兼容性:3分
是否包含广告:4分
加载速度:4分
安全性:3分
稳定性:7分
搜索功能:4分
下载便捷性:9分
下载点评
- 一般般(359+)
- 内容齐全(132+)
- mobi(287+)
- 无颠倒(393+)
- 在线转格式(61+)
- 三星好评(93+)
- 图文清晰(450+)
下载评价
- 网友 邱***洋:
不错,支持的格式很多
- 网友 通***蕊:
五颗星、五颗星,大赞还觉得不错!~~
- 网友 汪***豪:
太棒了,我想要azw3的都有呀!!!
- 网友 芮***枫:
有点意思的网站,赞一个真心好好好 哈哈
- 网友 宓***莉:
不仅速度快,而且内容无盗版痕迹。
- 网友 冉***兮:
如果满分一百分,我愿意给你99分,剩下一分怕你骄傲
- 网友 陈***秋:
不错,图文清晰,无错版,可以入手。
- 网友 隗***杉:
挺好的,还好看!支持!快下载吧!
- 网友 相***儿:
你要的这里都能找到哦!!!
喜欢"数据密集型应用系统设计"的人也看了
设计你的家就是设计生活 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
影响中国企业的十大商业模式 孔长春 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
肉羊饲养员培训教材 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
辐射固化材料及其应用 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
华图版政法干警考试专用教材考前20天冲刺试卷(本硕类) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
辞源(第三版·合订本) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
【当天发】【官方原版全新塑封当天发货】 Old Is New: 新素研 :新材料研究实验室建筑作品 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
9787562341673 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
现代制革技术与实践 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
【官方直营】新国标英语核心教程 2B 学生用书 外教社正版 上海外语教育出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 中华人民共和国海关进出口税则 2013年中英文对照版 中华人民共和国海关进出口税则编委会 著 经济日报出版社【正版】 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 液压与气动系统装配与调试(高职) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 你好意大利语-【正版书籍 达额立减】 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 隐形笔小侦探:时光里的秘密 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 獾的礼物 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 高效管理的52个关键 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 售楼高手这样说,这样做 范志德 著 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 接待的艺术 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- Iconic Cars Porsche 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 两个小八路 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:3分
主题深度:7分
文字风格:4分
语言运用:3分
文笔流畅:7分
思想传递:9分
知识深度:3分
知识广度:5分
实用性:9分
章节划分:8分
结构布局:3分
新颖与独特:8分
情感共鸣:9分
引人入胜:4分
现实相关:3分
沉浸感:8分
事实准确性:5分
文化贡献:4分