本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
这本书除了上百个案例以外,是配有免费视频的。重要的事情说三遍,配有免费视频的、配有免费视频的、配有免费视频的!!!
地址如下:https://www.imooc.com/learn/1231
第一章是理论基础,它非微观,而是宏观上从方法论上几近全方位的覆盖了监控的方方面面。建议读者朋友们不要略过本章节,相信本章节一定会对大家有所启发。
第一章精心准备了大量的表格,比如Zabbix、Nagios、Ganglia、Open-Falcon、Prometheus等主流监控系统全方位的对比;比如Go语言开发的系统生态,监控系统、微服务框架、WEB框架、WEB工具、容器项目、PAAS工具、数据库工具、存储工具及分布式文件系统、消息系统、服务管理工具、安全工具、网络工具、分布式系统、区块链项目等;以及从功能、性能、数据存储、服务发现、运维管理、开发语言、社区力度及生态发展、误区探讨等九个角度进行监控系统的选型分析思路。
第二章和第三章,手把手带大家搭建基于Spring Boot 2.x的实战监控体系,让大家体会企业项目面向DevOps开发的监控情景。
第八章是第二、三章的升级,大家可以和二、三章以及视频内容结合起来学习。另外,市面上的Prometheus邮件告警内容都没有cc和bcc功能,本书79页针对抄送和密送能力进行了补充。
这是有免费视频的,如果看不懂的同学请结合免费视频学习:
https://www.imooc.com/learn/1231
第四、五章请作为工具书使用
第四章和第五章,用了80多页介绍了PromQL,作者给出了上百个实际案例,这是其他Prometheus书籍和官方文档都没有的。这部分内容,阅读了大量的资料,也做了不少的实践。一个个案例剖析,甚至精确到PromQL的极致优化。
没有深度使用Prometheus的用户,第四章和第五章的实战部分可以直接跳过,看看概念就行。如果需要使用的时候可以当作工具书使用。
第六章请大家一定要围绕这张架构图去理解Prometheus告警机制的原理:
第七章分析了很多Exporter的实现原理,并指导读者如何编写自己的Go语言Exporter。
该章节运用软件工程的知识,通过专业的软件研发流程指导开发者编写Exproter过程中需要注意的方方面面。
第九章介绍了Prometheus集群实战的架构问题,讨论多种集群集解决方案的理念、方法及优化手段,探究如何构建更具有扩展性和可靠性的集群实现。对集群感兴趣的同学可以关注本章节。
本书共分为11章,紧密围绕Prometheus的相关概念和技术展开介绍。
第1章主要介绍了监控系统的相关概念。本章首先介绍了监控的概念、监控的分类、MDD(指标驱动开发)的理念、Google四大黄金指标、USE方法、RED方法等知识;接着介绍了监控中的探针和内省、拉取和推送等常见手法;最后介绍了常见的监控系统Nagios、Zabbix、Ganglia、Open-Falcon、ZMon,以及进行监控系统选型时应该考虑的维度及误区。
第2章介绍了Prometheus的相关概念。从历史、特点、架构、局限性、快速开始这5个方面介绍了Prometheus是什么,它在监控领域有哪些使用场景,以及如何快速安装和启动Prometheus。
第3章介绍了在Spring Boot中如何集成Prometheus。本章通过介绍Micrometer的理论,辅以Spring Boot 2.x应用的案例,一步步教读者将Spring Boot 2.x应用数据传输到Prometheus监控系统中,再以可视化监控大盘的形式展现在Grafana仪表盘中。本章还介绍了当系统出现故障时,读者如何将Spring Boot 2.x应用的故障信息以告警的形式发送到邮箱或者钉钉中。本章内容对于广大开发者来说具有一定的实战指导作用。
第4章介绍了与PromQL相关的知识。PromQL是Prometheus实战的核心,是Prometheus
场景的基础,也是Prometheus的重中之重。本章用很大的篇幅,从时间序列、PromQL数据类型、指标类型、选择器、聚合操作、二元操作符、内置函数、最佳实践、性能优化等方面,通过理论联系实际的方式,全方位介绍了与PromQL相关的概念及其具体用法。
第5章介绍了PromQL的高级用法。首先介绍了39个PromQL内置函数,然后围绕HTTP API、记录规则、告警规则、metric_relabel_configs、relabel_configs等多个知识点,以理论联系实际、知识点结合案例的形式,全方位介绍了PromQL的高级用法和最佳实践。
第6章介绍了Prometheus的告警模块—Alertmanager。本章围绕Alertmanager告警的架构、工作原理、集群、触发的流程等展开介绍,接着拓展了告警分组、抑制、静默、延迟等众多知识点。读完本章,读者可以轻松理解告警是如何触发的,还可以分析、定位、解决告警轰炸、告警不准确等常见问题。
第7章介绍了Prometheus中与Exporter相关的概念。Exporter的来源主要有两个,一个是社区,另一个是用户自定义。本章从数据规范、数据采集方式、案例代码编写等方面一步步指导读者自定义Exporter。为了帮助读者提高编码水平和真正写好Exporter,本章还给出了写好Exporter的建议,并结合Node Exporter、Redis Exporter、MySQL Exporter、RocketMQ Exporter等的原理进行分析讲解。通过对本章的学习,读者可以掌握使用和定制Exporter的方法。
第8章介绍了与Spring Boot相关的高级话题,帮助读者了解Prometheus集成Spring Boot的原理、源码和解决方案。本章针对Prometheus监控RESTful、监控业务、通过注解进行监控、监控Dubbo这4个真实需求给出了源码级的技术指导方案。对Prometheus集成Spring Boot过程中可能产生的问题,如空指针、极大值、内存溢出等,本章也做了补充分析与解答。
第9章介绍了与Prometheus集群相关的实战内容。本章围绕Prometheus集群实战的架构问题,讨论了多种集群解决方案(简单HA、简单HA+远程存储、简单HA+远程存储+联邦集群)的理念、方法及优化手段,探究如何构建具有更高扩展性和可靠性的集群。本章是实战章节,在采集指标、推广Prometheus在企业中的部署等细节问题上都给出了指导。本章还通过搭建一个基于M3DB的简单HA+远程存储Prometheus K8S集群的真实案例,用步骤引导以及配置文件样例的形式,带领读者实际部署Prometheus集群。
第10章介绍了Prometheus的存储原理。Prometheus不仅是一个监控系统,还是一款优秀的时序数据库。本章主要围绕Prometheus 3.0版本的TSDB本地存储,对存储文件的格式、存储的原理、chunk、索引、block、WAL日志、tombstones、Checkpoint等相关知识点进行介绍,让读者清晰地了解Prometheus存储的运行机制。
第11章介绍了Prometheus的相关技术。本章首先介绍了Prometheus的伴侣—Thanos和M3DB,并对使用这些技术的过程中可能出现的一些问题给出了指导和建议;然后介绍了继承Prometheus理念的Loki,详细介绍了Loki、ELK等相关日志技术的原理和架构方案;最后,介绍了Operator模式和Prometheus Operator模式,以及在实战中针对压测、查找中间件(如Redis问题)等场景应该如何灵活运用Prometheus。
朱政科
资深架构师,中间件技术专家,对数据库连接池和Prometheus等监控技术有深入研究。
有10余年IT行业从业经验,现就职于国内某大型世界百强企业。
曾在阿里等一线互联网公司长期从事中间件的研发及团队管理工作。
先后主导和参与了多个重要的与物联网、人工智能等相关的大型项目。
著有《HikariCP数据库连接池实战》。
Prometheus凭借优秀的表现和简单极致的用户体验,在时序数据库领域脱颖而出,并在监控方面表现优异,成为基础设施建设中不可或缺的部分。在CNCF中,其是除Kubernetes之外最早毕业的项目,这见证了它在云原生领域的影响力和声望。
本书系统阐述了Prometheus开发与运维的知识和技巧,并且辅助以大量实战案例,能够帮助读者更加立体地掌握Prometheus这项技术。
很开心看到朱政科将自己的所学所悟集结成书,也很惊讶他如此高效地出版了自己第二本著作。希望他的书籍能够持续给读者提供帮助。
张 亮
京东数科数字技术中心架构专家,Apache ShardingSphere、ElasticJob创始人
Prometheus作为源自Google INFRA的通用开源监控工具,在业界被广泛使用。学习、理解和熟练使用Promehteus,可以帮你快速构建轻量级监控体系。推荐大家通过本书系统学习Prometheus的特性、使用方法和作者的实战经验。
吴 晟
Tetrate.io创始工程师,Apache软件基金会会员,
Apache SkyWalking创始人兼项目VP,
Apache ShardingSphere、APISIX和Incubator PMC成员
一辆好车除了要有好的发动机和变速箱之外,还需要仪表盘和各种显示设备,以显示油量、速度等各种车辆状态数据。同理,互联网在线服务如果没有良好的监控告警系统,就如同一个人闭着眼睛开车,那是非常可怕的。
对于监控系统而言,简单、可配置、可靠、高性能是必要条件,海量数据的采集、存储与可分析是关键。Prometheus 是一套基于时序数据库的、目前最为流行的、较完善的监控解决方案,其可通过监控、告警及性能优化等,帮助企业及时发现问题、定位问题,是不可多得的SRE(网络可靠性工程)利器。
政科在阿里、华为等一线互联网公司长期从事中间件的研发工作,多次经历大促,在实践中积累了丰富的经验。这本书从架构、中间件研发、SRE等多个角度详细介绍了Prometheus,以及PromQL等知识,包括相关原理和实战要点,具有较强实战指导意义,是不可多得的佳作。
徐 巍
恺英网络技术中心总经理
监控是温度计,也是指标仪。在监控、告警、应急处置三部曲中,监控是基础。本书全面介绍了Prometheus的应用方法和产品内核,内容翔实,是该领域的佳作。
于君泽
《深入分布式缓存》《程序员的三门课》联合作者
相较以往的系统监控,监控作为可观察性实践(监控、日志、追踪)中的关键一环,在云原生时代产生了诸多变化:一是微服务和容器化,导致监控对象和指标呈指数级增加;二是监控对象的生命周期更加短暂,导致监控数据量和复杂度成倍增加。所以需要一款统一监控指标和数据查询语言的工具,Prometheus 应运而生。Pemetheus可以很方便地与众多开源项目集成,帮助我们了解系统和服务的运行状态,另外还可收集分析大数据,帮助我们进行系统优化和做出决策。它不仅可以应用在IT领域,还可以应用于任何需要收集指标数据的场景中。本书实用、凝练,是一本云原生时代监控领域难得的好书。
宋净超
云原生社区创始人
Prometheus作为第二个从CNCF毕业的项目,目前已经在全球各大企业中广泛使用,可以说是云原生架构的开源监控工具。作者作为该领域实战派专家,在本书中全方位阐述了Prometheus的系统架构和工作原理。更难能可贵的是,书中还包含大量实际项目落地指引、最佳实践,以及常见问题的解决方案,是学习Prometheus不可多得的好书。
张 乐
京东DevOps与研发效能技术总监
监控系统是DevOps工程师或SRE工程师必须掌握的系统,因为他们80%以上的线上运维事务都与监控密切相关。完美的监控系统,可以大力促进运维向智能化发展,结合业务报警实现故障快速自愈、无人化运维,并可及时定位问题根源,以及依据历史监控数据对指标做出预测。Prometheus几乎是为云原生而生的监控系统,它具有易于管理、可扩展、易集成、易获取服务内部状态、拥有高效灵活的查询语句、支持统计分析数据、生态强大等特点,因此迅速被各大云厂商使用。本书由入门到精通全方位介绍了如何玩转Prometheus,适合关注监控的广大互联网技术从业者阅读。
王 伟
Oracle ACE For MySQL,京东零售数据库运维专家
Prometheus是一款造福广大DevOps、SRE工程师们的分布式监控系统神器。借助愈演愈烈的容器化部署和云原生的浪潮,Prometheus成为CNCF的基石项目。本书作者有深厚的基础中间件研发背景和丰富的实践经验,对Prometheus进行过深入研究和深度应用,他把自己的理解和实战经验总结出来,著成本书。本书文字简洁而不失其味,对技术原理的剖析鞭辟入里,实用性极强,相信能给读者带来不一样的启发。
张 聪
税友软件集团研发中心副总,基础中间件、持续交付工具和大数据平台研发负责人
我本人接触和使用Prometheus已经很久了,很高兴看到国内有Prometheus相关的书籍出版。本书不局限于Prometheus本身,还对比了市面上其他常见的监控系统,可以帮助读者更好地理解Prometheus。本书还介绍了很多常见的方法论。配合这些方法论,以及书中的实战内容,读者可以更好地建设自己的监控体系。
张晋涛
网易有道资深运维开发人员,云原生技术布道师