China HPC Technology

Home >Business > Nvidia > Tesla C1060

Nvidia Quadro & Tesla

Tesla S2050

Tesla S2050计算系统为技术和企业计算提供了“必须有”的特性，包括C ++的支持，ECC内存对高精度要求和可扩展性的支持，以及比Tesla 10系列高7倍的双精度性能。相比最近的4核CPU，Tesla 20系列计算核心只需其十分之一的成本，二十分之一的功耗就可达到与其同等的性能。

在标准的1U机箱中包含4个基于Femi结构的Tesla运算处理器，Tesla S2050计算系统可更迅速和准确的解决世界上最重要的计算难题

特性：

特性	优势
采用CUDA机构的Fermi GPU	可达到最新的4核CPU同样的性能，仅花费其十分之一的成本，二十分一的耗电量
448 CUDA 核心数	高达515亿次的双精度峰值可使每个GPU为在1U空间内提供万亿次浮点运行性能，每个GPU的单精度峰值性能都超过亿万次
ECC 显存	达到了工作站对计算精确度和可靠性的要求。对内存中的数据提供保护，提高了数据的完整性和应用程序的可靠性。ECC同样能保护注册文件，L1/L2缓存，共享内存和DRAM
系统监控功能	简化的管理和基于NVSMI的安装后远程监控。设备前后方的状态灯使IT人员无论在哪一头都可以检查设备状态
可达6GB的GDDR5显存	通过在直接连接到GPU的本地内存中保存更大的数据集，以最大限度的提高性能并减少数据传输。 Tesla S2050 每块GPU包含3GB显存
NVIDIA 并行数据缓存	加速算法，如物理求解器，光线追踪，以及事先不知道数据地址的稀疏矩阵乘法。这包括，每个流多处理器模块一个可配置的L1告诉缓存和一个统一的所有的处理器内核的L2缓存
NVIDIA 千兆线程引擎	更快的上下文切换，10倍于之前结构以提高吞吐率，同时内核执行，优化的线程块调度
异步传输	当计算核心在处理其他数据的时候,Turbocharges通过PCIe总线进行数据传输来提高系统性能。即使是又大量数据传输要求的应用，如地震资料处理，都可以预先将数据传输到本地内存以最大限度的提高计算效率
拥有广泛语言和API支持的CUDA编程环境	选择的C，C++，OpenCL，DirectCompute，或Fortran来编写并行应用程序并利用“Fermi” GPU的创新架构 NVIDIA Parallel Nsight tool 可供Microsoft Visual Studio开发人员使用
高速PCI-Express 2.0 数据传输	最大限度的提高主机系统和Tesla处理器之间的带宽开放的PCIe x16插槽，使得Tesla系统能工作在几乎任何PCIe兼容的主机系统

规格：

Tesla 处理器数量	4
计算核心的数量	1792 (每个处理器448个)
处理器内核频率	1.55 GHz
单精度浮点性能(峰值)	4.13 TFlops ( >1 TF per GPU)
双精度浮点性能(峰值)	2 TFlops
浮点精度	IEEE 754 单精度和双精度浮点数
专用显存总容量	12GB GDDR5(3GB/GPU)
显存位宽	384-bit
典型功耗	900 W
系统接口	PCIe x16 Gen2
软件开发工具	CUDA C/C++/Fortran, OpenCL, DirectCompute Toolkits, Nvidia Parallel Nsight for Visual Studio

MAIL TO US

Tel:+8621 62809115　

Fax:+8621 62809155

Unit 2G, Bldg 2, Science Park, No.6 Lane 365 Xin Hua Rd, Shanghai 200052, P.R.C.