2022年04月09日
由于业务的多样性,平台和系统也变得异常的复杂。如何对其进行监控和维护是我们 IT 人需要面对的重要问题。就在这样一个纷繁复杂的环境下,监控系统粉墨登场了。
今天,我们会对 IT 监控系统进行介绍,包括其功能,分类,分层;同时也会介绍几款流行的监控平台。
监控系统的功能
在 IT 运维过程中,常遇到这样的情况:
某个业务模块出现问题,运维人员并不知道,发现的时候问题已经很严重了。
系统出现瓶颈了,CPU 占用持续升高,内存不足,磁盘被写满;网络请求突增,超出网关承受的压力。
2022年04月09日
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。
HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。在大数据生态圈中,HDFS是最重要的底层分布式文件系统,它的稳定性关乎整个生态系统的健康。
本文介绍了HDFS相关的重要监控指标,分享指标背后的思考。
一、HDFS监控挑战
HDFS是Hadoop生态的一部分,监控方案不仅需适用HDFS,其他组件如Yarn、Hbase、Hive等,也需适用
HDFS API
2022年04月09日
运维工程师面试者第一个问题是:需要值班吗?笔者自己也曾经历过月入十万的时期,在那个时候,数个系统同时发布下一代版本,而老系统还需要过渡很长时间,工作量直接翻倍。
图片来自 Pexels
大家只能勉强应付一线运维工作,团队成员开始陆续离职,而新人又无法在短时间内上手,整体情况不断恶化,持续半年左右才缓过劲来。
下面两张截图是我挑选的两个团队一周报警数的对比图,前者的单日报警量最高是 55348 条,后者单日的报警量最高为 34 条,两者相差 1600 倍,而前者才是国内很多互联网运维团队的真实
2022年04月09日
本文通过对比分析下两者所做的事情为契机讨论监控系统或许该有的面貌,以及浅谈下监控系统发展的各个阶段。
图片来自 Pexels
饿了么监控系统 EMonitor :是一款服务于饿了么所有技术部门的一站式监控系统,覆盖了系统监控、容器监控、网络监控、中间件监控、业务监控、接入层监控以及前端监控的数据存储与查询。
每日处理总数据量近 PB ,每日写入指标数据量百 T,每日指标查询量几千万,配置图表个数上万,看板个数上千。
CAT:是基于 Java 开发的实时应用监控平台,为美团点评提供了全面的实
2022年04月09日
前言
Docker真的有这么神奇吗,我们平时部署一套系统应用少说得花个个把小时,在部署过程中如果遇到啥问题花费一天估计都很难搞定,那利用Dorcker技术真的可以大大缩短我们的部署时间吗,今天我们就来学习一下这门技术吧!
Docker是什么
当我们需要部署一个应用服务时,我还是以部署Zabbix监控系统为例,我们传统的部署方式是一台物理服务器上首先安装操作系统比如Linux系统,然后在部署Zabbix监控系统所需要的依赖环境如LAMP(Linux+Apache+Mysql+PHP)和Zabb
2022年04月09日
2017 年之前,大家运维管理管理体系的监控关键也是以 Zabbix 做为主要的解决方法。那时候数据库这一部分的监控服务项目也是采用的监控运维管理精英团队带来的服务项目。
照片来源于 Pexels
总的来说,Zabbix 的作用也是十分强有力的,并且应用也非常简单,大部分写写脚本制作就能完成特定运用的监控。
PS:现阶段早已并不是 Zabbix 了,运维管理精英团队根据 Open-Falcon 订制开发设计了一套统一的运维管理监控系统软件,自然这也是后话了。
我们在 2016 年就早已试着 M
2022年04月09日
现阶段99%的平台都是会应用SSL证书完成HTTPS数据加密网站地址,尽管针对有一些非易用性网址应用并没是多少实际意义,可是迫不得已DNS挟持或是是有一些电脑浏览器也强制性应用不然会发生不安全网站提醒。可是,这儿有一个问题,例如大家网址在选购付钱或是免费SSL证书以后,付钱的也许会是1年或是2年,免费的可能是3个月或者6个月,期满以后大家会很有可能忘掉续约。
针对一般的个人网页很有可能觉得不在乎,期满不续订当发觉没法应用大家再去解决续约也不奇怪,可是针对有一些公司或是商务网站,如果我们不立即续
2022年04月09日
【51CTO.com原創文稿】IT 运维管理离不了系统软件监控,就仿佛鱼儿离不开水一样。一款强劲的监控系统软件可以强有力确保设备和业务流程的平稳。
照片来源于 Pexels
在监控系统软件五花八门的今日,做为知名监控系统软件的 Zabbix 仍然矗立在监控系统之林。今日,大家一起来看看 Zabbix 的系统架构图及其运行方法。
Zabbix 系统架构图
大家都知道,Zabbix 是一款出色的监控系统软件,可以对于互联网技术中的设备和使用开展监控。
在详解其完成方法以前,先一起来看看它的框架图: