一个物理内存分布导致的问题

事出前些日子有人咨询我:“在某个关闭NUMA的双CPU机器上,通过lat_mem_rd跑分,为什么会出现差不多2倍的跑分差距?” 话说这里的lat_mem_rd是lmbench 的一个组件,它通过模拟排序来测试系统的内存读性能——主要是时延为主。

继续阅读“一个物理内存分布导致的问题”
推荐阅读:
继续在NUMA和性能差异的路上
首先列出本站之前相关的几篇帖子
NUMA(Non-Unifor

时延的误区

时延 latency(亦称为延时、潜伏时间等),是衡量一个系统性能的重要指标。这里就简单的谈谈在时延这个概念上经常容易犯的几个误区吧。

继续阅读“时延的误区”
推荐阅读:
事出前些日子有人咨询我:“在某
似乎每次开头都要讲述一下计算机
近一段时间一直在做些任务负载特

从stream的多线程协同效率说起

似乎每次开头都要讲述一下计算机或者说x86架构的演进历史,这似乎成了站长Litrin的一种习惯。现在的x86架构CPU频率以及最大IPC已经接近极限,厂商倾向于将越来越多的核心通过SMP技术多线程负载。不妨做一个思想实验:将计算机的任务想象为搬砖,CPU核心则是搬砖的工人。根据我们的常识,工人越多则任务完成的越快,也就是意味着核心数和性能是成正比的。然而事实真的如此吗?

继续阅读“从stream的多线程协同效率说起”
推荐阅读:
继续在NUMA和性能差异的路上
5月中旬,我参加了在加利福尼亚
长久以来,我们对计算机资源的理

SEP,EMON和EDP

近一段时间一直在做些任务负载特征分析的事儿。针对服务器上运行的若干个不同的业务,分析它们对于不同细颗粒度资源的使用情况。本身这些分析的工作是可以通过vtune这类的工具直接得到的。但vtune是一个桌面版本的性能分析工具,一对一的执行、跟踪、数据分析不够“工业化”。于是,这里就讲讲VTune的底层实现SEP和EMON以及EMON结果的分析工具EDP。

继续阅读“SEP,EMON和EDP”

推荐阅读:
事出前些日子有人咨询我:“在某

时延 latency(亦称为延

似乎每次开头都要讲述一下计算机

DCDC2018–混合部署场景下RDT的应用

5月中旬,我参加了在加利福尼亚圣克拉拉万豪举办的Intel Data Center Design Conference 2018(DCDC’18)这个主要针对与数据中心设计的会议。期间我做了关于Intel RDT技术在数据中心业务质量(QoS)保障为主题的presentation。尽管在本月还有台北、上海、北京三场普通话的同主题演讲,这里还是分享下整个英文版本演讲的主要内容。

继续阅读“DCDC2018–混合部署场景下RDT的应用”

推荐阅读:
似乎每次开头都要讲述一下计算机

长久以来,我们对计算机资源的理

在虚拟机的日常使用和开发中,我

Top-down性能分析模型

长久以来,我们对计算机资源的理解一直都停留在cpu,内存容量,IO这类的大粒度的划分之上。一个简单的top或者vmstat命令就很方便的帮助我们得到某某计算机需要升级CPU或者加内存这类的结论,经验告诉我们,这一切似乎没有什么错。

继续阅读“Top-down性能分析模型”

推荐阅读:
继续在NUMA和性能差异的路上

首先列出本站之前相关的几篇帖子

熟悉Linux内核内存管理机制

说说SSD硬盘

我们都知道SSD是“固态硬盘”的代名词,考虑到现在各种接口,各种指标规格的大混乱模式,这里我将会通过几个名词解释来说说SSD硬盘。

继续阅读“说说SSD硬盘”

推荐阅读:
事出前些日子有人咨询我:“在某

时延 latency(亦称为延

似乎每次开头都要讲述一下计算机

Linux下CPU的手动频率设定

众所周知的是,CPU的频率和它的实际性能特别是整数运算能力上有着相当强的关联性。但同时CPU的频率也跟它的功耗成正比,而功耗是有一个TDP的热功耗上限。根据当下多核CPU、多任务的趋势我们很容易就联想到在一个系统上如果存在多个任务,我们是否可以通过为不同任务设置不同的CPU频率的方法区分优先级?也就说CPU的频率是否可以作为一种可用资源来任意分配?

继续阅读“Linux下CPU的手动频率设定”

推荐阅读:
事出前些日子有人咨询我:“在某

时延 latency(亦称为延

似乎每次开头都要讲述一下计算机

Kernel 4.14的RDT配置

之前发过一个帖子介绍了RDT在Kernel4.10中的使用方法,当kernel迭代到4.14之后,相对应的接口有了变化,最主要的就是增加了对于CMT和MBM这类监控接口。同时,由于上面提及的帖子还没有介绍CDP方面的内容,这次就一并补上。

继续阅读“Kernel 4.14的RDT配置”

推荐阅读:
前几天写的关于Intel RD

RDT技术,全称为Resour

事出前些日子有人咨询我:“在某

UMA/NUMA之性能差异

继续在NUMA和性能差异的路上走下去。

之前写过一片东西http://www.litrin.net/2017/08/03/numa%e5%af%b9%e6%80%a7%e8%83%bd%e7%9a%84%e5%bd%b1%e5%93%8d/ 讲的是一个基于SPECjbb2005的快速测试给大家做了一个对于UMA/NUMA的直观介绍。这篇就是针对不同的计算类型,介绍下NUMA是如何对性能做出改变的。

继续阅读“UMA/NUMA之性能差异”

推荐阅读:
事出前些日子有人咨询我:“在某

时延 latency(亦称为延

似乎每次开头都要讲述一下计算机