navigation  
 
   
 
Home >Business > Nvidia > Tesla C1060
 
 
 
 
 

 

 
Nvidia Quadro & Tesla

 
 

Tesla S2050

Tesla S2050计算系统为技术和企业计算提供了“必须有”的特性,包括C ++的支持,ECC内存对高精度要求和可扩展性的支持,以及比Tesla 10系列高7倍的双精度性能。相比最近的4核CPU,Tesla 20系列计算核心只需其十分之一的成本,二十分之一的功耗就可达到与其同等的性能。

在标准的1U机箱中包含4个基于Femi结构的Tesla运算处理器 ,Tesla S2050计算系统可更迅速和准确的解决世界上最重要的计算难题

 

特性:

特性 优势
采用CUDA机构的Fermi GPU

可达到最新的4核CPU同样的性能,仅花费其十分之一的成本,二十分一的耗电量

448 CUDA 核心数

高达515亿次的双精度峰值可使每个GPU为在1U空间内提供万亿次浮点运行性能,每个GPU的单精度峰值性能都超过亿万次

ECC 显存

达到了工作站对计算精确度和可靠性的要求。对内存中的数据提供保护,提高了数据的完整性和应用程序的可靠性。ECC同样能保护注册文件,L1/L2缓存,共享内存和DRAM

系统监控功能

简化的管理和基于NVSMI的安装后远程监控。设备前后方的状态灯使IT人员无论在哪一头都可以检查设备状态

可达6GB的GDDR5显存

通过在直接连接到GPU的本地内存中保存更大的数据集,以最大限度的提高性能并减少数据传输。 Tesla S2050 每块GPU包含3GB显存

NVIDIA 并行数据缓存

加速算法,如物理求解器,光线追踪,以及事先不知道数据地址的稀疏矩阵乘法。这包括,每个流多处理器模块一个可配置的L1告诉缓存和一个统一的
所有的处理器内核的L2缓存

NVIDIA 千兆线程引擎

更快的上下文切换,10倍于之前结构以提高吞吐率,同时内核执行,优化的线程块调度

异步传输

当计算核心在处理其他数据的时候,Turbocharges通过PCIe总线进行数据传输来提高系统性能。即使是又大量数据传输要求的应用,如地震资料处理,都可以预先将数据传输到本地内存以最大限度的提高计算效率

拥有广泛语言和API支持的CUDA编程环境

选择的C,C++,OpenCL,DirectCompute,或Fortran来编写并行应用程序并利用“Fermi” GPU的创新架构
NVIDIA Parallel Nsight tool 可供Microsoft Visual Studio开发人员使用

高速PCI-Express 2.0 数据传输

最大限度的提高主机系统和Tesla处理器之间的带宽
开放的PCIe x16插槽,使得Tesla系统能工作在几乎任何PCIe兼容的主机系统

规格:

Tesla 处理器 数量

4

计算核心的数量

1792 (每个处理器448个)

处理器内核频率

1.55 GHz

单精度浮点性能(峰值)

4.13 TFlops ( >1 TF per GPU)

双精度浮点性能(峰值)

2 TFlops

浮点精度

IEEE 754 单精度和双精度浮点数

专用显存总容量

12GB GDDR5(3GB/GPU)

显存位宽

384-bit

典型功耗

900 W

系统接口

PCIe x16 Gen2

软件开发工具

CUDA C/C++/Fortran, OpenCL, DirectCompute Toolkits, Nvidia Parallel Nsight for Visual Studio

 

 

 

 

 

 

 

 

COPYRIGHT (C) 1992-2015 China HPC Technology ALL RIGHTS RESERVED. 沪ICP备09048162号 MAIL TO US
Tel:+8621 62809115  Fax:+8621 62809155 Unit 2G, Bldg 2, Science Park, No.6 Lane 365 Xin Hua Rd, Shanghai 200052, P.R.C.