CPU每时钟周期浮点计算值是4还是8

忘是亡心i 2022-01-16 10:55 659阅读 0赞

对于intel xeon e7-8837的理论flops计算是不是:
2.66(主频)×8(核心)×4(每周期浮点运算次数)=85.12 gflops
对于amd opteron 6220的峰值flops:
3(主频)×8(核心)×4(每周期浮点运算次数)=96 gflops
目前大多数的理论峰值是按照x4的来计算,因为通常cpu核可以一拍执行两条指令,每条指令可以执行两个操作,因此是x4。
intel新架构的处理器增加了新的指令集AVX,因此一条指令可以执行四个操作,故新架构的处理器x8,也就说支持新指令集AVX的intel处理器都是x8。
新架构sandy bridge和ivy bridge都是x8。 服务器处理器E5-XXXX, E3-XXXX都是x8。

转载于:https://blog.51cto.com/sclijq/1082144

发表评论

表情:
评论列表 (有 0 条评论,659人围观)

还没有评论,来说两句吧...

相关阅读

    相关 衡量模型复杂度:①模型参数量、②FLOPs(运算数,计算量,s小写)【全连接层无权共享,运算数==参数量】;衡量硬件(GPU)性能的指标:FLOPS(运算次数,计算速度,S大写)

    一、衡量模型复杂度 评价一个CNN的性能,除了其性能指标(分类任务的准确度、估计任务的误差、检测任务的精度等)外,还需要考虑该CNN的模型复杂度,如参数量和计算量。CNN

    相关 VC++获取CPU时钟频率

    先通过执行两条汇编语句得到执行两条汇编语句所使用的相对时间刻度,然后继续执行这两条汇编语句获取一个时间刻度减去先前的相对时间刻度就是CPU时钟频率。 inline U