I/O优化,单车变摩托

雷义芳(智深)背景从监控来看,大数据离线计算的服务器,在业务计算高峰期,磁盘IOPS只有200多:可以看到这里只有250,这个IOPS偏低。大数据架构师反馈,在平安的时候,离线大数据集群的单机的IOPS可以跑到400多,甚至500多,从经验来判断,我们服务器的磁盘IOPS 太低。HDFS的map i
2022年05月16日 1,455次浏览

JFR应用之通过TLAB事件分析应用性能

JFR应用之通过TLAB事件分析应用性能
性能 2022年05月16日 901次浏览

记一次光模块光衰引发的血案

一.背景:2021年的1月1号,新年伊始的2:27分,突然大数据运维同学在钉钉群中反馈,大数据的slave002节点是不是卡住了。DBA和运维同学就着手进行排查。DBA同学反馈,从IDC的大数据集群通过网络拉取阿里云的RDS数据库,确实耗时大幅增加,我们看下图中的Time字段,平时在分钟级别的,今天
性能 网络 2021年11月11日 2,378次浏览

一次应用单测耗时过长的原因分析

一、背景在对pay应用的branch777分支做单元测试并使用jacoco统计覆盖率时,发现以下问题:1)执行时间很长,达到42分钟~5小时不等2)没有覆盖率数据产生由图中可看到,多次执行后,覆盖率数据都是0.00%,且单测结果有很多Error。二、初步分析1、对比其他分支使用pay应用的maste
性能 2021年10月13日 1,739次浏览