加入收藏 | 设为首页 | 会员中心 | 我要投稿 甘孜站长网 (https://www.0836zz.com.cn/)- 运维、物联设备、数据计算、智能推荐、云管理!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

讲透 “进程、线程、协程”

发布时间:2021-02-17 15:12:14 所属栏目:外闻 来源:互联网
导读:了解监控对象的工作原理:要做到对监控对象有基本的了解,清楚它的工作原理。比如想对JVM进行监控,你必须清楚JVM的堆内存结构和垃圾回收机制。 确定监控对象的指标:清楚使用哪些指标来刻画监控对象的状态?比如想对某个接口进行监控,可以采用请求量、耗时
  • 了解监控对象的工作原理:要做到对监控对象有基本的了解,清楚它的工作原理。比如想对JVM进行监控,你必须清楚JVM的堆内存结构和垃圾回收机制。
  • 确定监控对象的指标:清楚使用哪些指标来刻画监控对象的状态?比如想对某个接口进行监控,可以采用请求量、耗时、超时量、异常量等指标来衡量。
  • 定义合理的报警阈值和等级:达到什么阈值需要告警?对应的故障等级是多少?不需要处理的告警不是好告警,可见定义合理的阈值有多重要,否则只会降低运维效率或者让监控系统失去它的作用。
  • 建立完善的故障处理流程:收到故障告警后,一定要有相应的处理流程和oncall机制,让故障及时被跟进处理。

3. 监控的对象和指标都有哪些?

监控已然成为了整个产品生命周期非常重要的一环,运维关注硬件和基础监控,研发关注各类中间件和应用层的监控,产品关注核心业务指标的监控。可见,监控的对象已经越来越立体化。这里,我对常用的监控对象以及监控指标做了分类整理,供大家参考。

 

  • 实时采集监控数据:包括硬件、操作系统、中间件、应用程序等各个维度的数据。
  • 实时反馈监控状态:通过对采集的数据进行多维度统计和可视化展示,能实时体现监控对象的状态是正常还是异常。
  • 预知故障和告警:能够提前预知故障风险,并及时发出告警信息。
  • 辅助定位故障:提供故障发生时的各项指标数据,辅助故障分析和定位。
  • 辅助性能调优:为性能调优提供数据支持,比如慢SQL,接口响应时间等。
  • 辅助容量规划:为服务器、中间件以及应用集群的容量规划提供数据支撑。
  • 辅助自动化运维:为自动扩容或者根据配置的SLA进行服务降级等智能运维提供数据支撑。

2. 使用监控系统的正确姿势

“出任何线上事故,先不说其他地方有问题,监控部分一定是有问题的。

听着很甩锅的一句话,仔细思考好像有一定道理。我们在事故复盘时,通常会思考这3个和监控有关的问题:有没有做监控?监控是否及时?监控信息是否有助于快速定位问题?

可见光有一套好的监控系统还不够,还必须知道「如何用好它」。一个成熟的研发团队通常会定一个监控规范,用来统一监控系统的使用方法。

 

网络安全是数字基建的前提和保障

数字基建是顺应全球数字化转型趋势、推动数字经济高质量发展、构建国家竞争新优势的关键支撑,而安全是新型基础设施建设的必然要求,网络安全是数字基建的前提和保障。

随着信息技术的广泛应用,网络攻击行为给金融、能源、制造、交通等重点战略性领域造成威胁、带来隐患。从CNCERT的监测数据看,近年来我国受到的DDoS攻击、APT攻击、漏洞威胁频发高发,网络安全风险面临着严峻的挑战。因此,必须在设计之初,提前谋划和考量技术应用、技术体系、产业推广以及供应链等环节的安全风险,确保数字基建正常稳定运行。

数字基建的赋能性特点,意味着网络安全保障要贯穿始终。随着疫情防控转入常态化,数字基建更是成为助力数字经济发展的增长极和潜力场。5G大规模商用的开启,有力支撑泛在互联、深度交互、智能引领的创新应用。工业互联网进入落地深耕阶段,通过高效对接供给和需求信息,实现跨领域跨行业资源要素的优化配置。人工智能作为最具活力和潜力的创新领域,是驱动社会智能化发展的关键动力。当前,数字基建仍然处在发展初期,网络安全保障必须面向未来、贯穿始终,构建覆盖技术、场景、产业以及生态的全生命周期网络安全保障体系。



 

(编辑:甘孜站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读