Chinaunix首页 | 论坛 | 博客
  • 博客访问: 122273
  • 博文数量: 26
  • 博客积分: 15
  • 博客等级: 民兵
  • 技术积分: 15
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-24 21:45
文章分类
文章存档

2019年(1)

2018年(6)

2017年(17)

2016年(2)

我的朋友

发布时间:2017-03-24 13:13:17

By Jonathan Corbet May 24, 2011 The problem with prefetch 翻译:曾怀东 随着经验的增长,软件开发者会发现微优化的努力并不值得,尤其是在缺少针对具体问题的硬数据(hard data)的时候。性能问题通常不是出在我们认为的位置,所以没有头绪地进行调整试图获得更好的效果可能是徒劳的,甚至可能使事情变得更糟糕。这是内核开 发人员得到的教训。 在内核层面,性能通常受缓存行为的影响。真正高性能要求只有命中cpu缓存才能够满足,内存访问相比较显得过于缓慢了。内核尽量地使用cache- hot memory;以及其它一些其它重要的工作......【阅读全文】

阅读(3325) | 评论(0) | 转发(0)

发布时间:2017-03-24 13:11:00

SIMD是指单指令多数据技术,它已经成为Intel处理器的重要性能扩展。目前Intel处理器支持的SIMD技术包括MMX,SSE,AVX.MMX提供了8个64bit的寄存器进行SIMD操作,SSE系列提供了128bit的8个寄存器进行SIMD指令操作。而最新的AVX指令则支持256bit的SIMD操作。目前SIMD指令可以有四种方法进行使用分别是汇编语言,C++类,编译器I.........【阅读全文】

阅读(2416) | 评论(0) | 转发(0)

发布时间:2017-03-24 13:10:45

对于软件的缓存访问问题进行优化的第一步应该是选择合适的编译器选项,使得编译器能够根据你的应用和要针对的处理器进行优化。每个处理器采用不同的缓存,比如通过QxW针对P4处理器进行优化,/O3允许一些循环分割、合并等激进优化,/Qipo通过过程间优化可以减少代码的大小,通过代码移动优化使得经常调用的变量和函数可以放.........【阅读全文】

阅读(1922) | 评论(0) | 转发(0)

发布时间:2017-03-24 13:10:39

1)方法一可以通过调用QueryPerformanceFrequency函数获得计时器的频率。假设调用该函数返回3579545,这样这个计数器每次计数的时间为1/3579545秒,大约为0.28us。计算出每一个计数的计数时间之后,再调用QueryPerformanceCounter返回程序计数的几次,将计数次数乘以每次计数的时间(0.28us)就是程序运行的时间了。实例.........【阅读全文】

阅读(1759) | 评论(0) | 转发(0)

发布时间:2017-03-24 13:10:20

Intel平台编程,可以采取自顶向下的软件优化策略。影响软件性能的因素除了所采用的算法的性能外,还包括处理器、内存、网络接口、磁盘I/O接口等硬件设施以及运行的操作系统、平台软件和程序库等。因此在进行软件的性能优化时,一般采取自顶向下的方法:首先是系统层的优化,其主要目的是确保那些包括处理、内存、网络和磁.........【阅读全文】

阅读(1592) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册