PMU Event counter的使用状况检测

题目用中文反而有点绕,How to detect whether PMU event counters are occupied?

就是在前几天全民在家办公的时候,有个来自A公司的“大客户”发邮件咨询了类似的问题。事发他们正在开发一套基于PMU (performance monitoring unit)event counter的工具用于监控物理主机的硬件资源使用情况。但他们在开发过程中发现有些客户的某些应用同样也会使用到Event counter,导致Event counter的使用出现冲突,数据不可用。于是自然就需要一种event counter是否正在使用的机制。

继续阅读“PMU Event counter的使用状况检测”

从Linux perf的数据采集说起

挺长时间了,不太情愿地做了一个给蝙蝠集团之一的consultant,即给所谓“精细化资源管理”做支持,该系统通过一个Linux perf为接口的守护工具,不断向控制节点发送当前系统中每一个应用的细粒度资源使用情况,方便从全局入手为应用程序求得最优分配方案。在这个过程中,A-B测试的结果反映这个守护工具会影响到业务的性能——这是意料之中的,对方的认可的心理底线是性能下降3%以内。可问题是对于某个核心应用的特定场景,这个工具居然导致了30%左右的性能下降,这就尴尬了!

继续阅读“从Linux perf的数据采集说起”