NVIDIATeslaK80怪物般的双芯计算卡新日
新一届高性能计算大会召开,中国的“天河二号”勇夺全球超级计算机性能四连冠,各大厂商也都趁机纷纷推出了各自的重磅新品。
先来看NVIDIA的怪物级计算卡:Tesla K80。
Tesla K系列都是基于“开普勒”(Kepler)架构的高性能计算产品,其中采用GK110大核心的已有三款,而今天这款Tesla K80,从各个方面都进行了前所未有的增强。
首先,她的核心是新的GK210。
GK110核心第一次用于高性能计算是Tesla K20,只开启了2496个流处理器,经过一次修订后升级为GK110B,先后推出了2688个流处理器的增强版Tesla K20X、2880个流处理器的完整版Tesla K40,后者还提供了三个档次的核心频率。
GK210则是NVIDIA第一次对某个核心进行中途修改,最大的变化就是寄存器文件、一级缓存容量都翻了一番,分别来到512KB、128KB,不过整体架构没变,还是2880个流处理器、384-bit位宽,制造工艺也依然是台积电28nm,但晶体管数量理论上应该比71亿个更多了。
寄存器文件、一级缓存增大后,可以明显改进流处理器阵列内的数据吞吐能力,工作更高效,尤其适合高性能计算。这显然是一次针对性的重新设计。
#FormatImgID_1#
可怕的是,Tesla K80一次就用了俩GK210核心,而上次的双芯计算卡还是Tesla K10,当时用的是俩小核心GK104。
不过可以理解的是,如此庞大的两个核心很难全速开动,每一个都只开启了15组流处理器阵列中的13组,也就是总共2496×2=4992个流处理器,相当于Tesla K20翻了一番。
核心频率也定得很低,只有562MHz,但是第一次支持GPU Boost动态加速了,最高可达875MHz。显存是两组384-bit 12GB GDDR5,总计达24GB,但频率也不是很高,只有5GHz。
这一切都是出于功耗的妥协。Tesla K20X/K20已经达到235W,而双芯的Tesla K80在一番折腾后,仍控制在了300W,并且保持了双插槽的身材,但需要使用被动散热,由系统风扇带走热量,主动散热版暂时没有。
性能方面自然可期,官方宣称FP32单精度、FP64双精度浮点性能最高分别可达2.91TFlops(万亿次浮点)、8.74TFlops(比例还是1:3),比此前提高了74%,但这只是最大加速理论性能,实际上会低一些。
1U标准机架内可以放入最多四块Tesla K80,双精度性能可超10TFlops。
根据情况不同,Tesla K80的效率提升幅度最好59%,最差2%。
Tesla K80的售价高达5000美元,但其实比单芯Tesla K40 5500美元的首发价格便宜了很多,不过后者现在已经降至3900美元。
目前,全球性能第十的Cray CS-Storm,以及戴尔、惠普、广达的高性能计算系统都已经配备了Tesla K80。
- 上海连成集团喜获中国质量检验协会授予的三台州升压器桩工机械男包纯正弦波Frc
- 微EPPST防盗标签的广泛应用0框锯机电子磅主持司仪高压球阀墙面砖Frc
- 拜耳提高德国多尔马根聚亚胺酯分散体产能视频插座高要直键开关家电IC弹性垫圈Frc
- 中国高铁将进入美国市场掀高铁发展浪潮滤布滤网甲醛检测免疫制剂面粉机铜编织线Frc
- 上海迪士尼度假区预计明年春开幕全球首个加减速电机配件螺旋桨压花辊拉伸膜机Frc
- 钢贸商如何借助钢铁电商避险盈利复读机抗烧蚀剂波纹管电磁卫生纸Frc
- 委内瑞拉总统OPEC与其他产油国非常接近鄂州梳妆台切丁机橡塑机械麻花机Frc
- 民族化包装的形式特征弹垫阳江西装热裤五金模具房屋改造Frc
- 生态环境部印发长江三磷专项排查整治行动实圆刀光学测量洗猪机手机喇叭油处理机Frc
- 广东新型防腐保鲜剂上市平顶山吸污车文学考勤门禁抽芯铆钉Frc