前言:中文期刊网精心挑选了高性能计算机范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
高性能计算机范文1
[关键词]芯片测试 可测型设计 内建自测试 扫描设计
[中图分类号]TN492 [文献标识码]A [文章编号]1009-5349(2016)20-0147-02
一、可测性设计与测试功耗
为了保证芯片的正确性,最重要的两个环节就是在设计时的验证,以及制造后的测试,然后随着芯片规模的不断扩大,导致测试的成本、难度和功耗都随之增大。为了解决这些难题,学术界和业界都做出了相应的研究和贡献。在这些成果之中,最为广泛的就是:在设计时就考虑到测试问题,即进行可测性设计(Design for Test)。可测性技术将测试的问题提升到设计阶段,因为越早的解决问题,消耗的成本越少,所以,在设计时不仅要考虑设计规则,同时也要满足DFT规则。通常的可测型设计方法包括扫描设计(Scan Design)、内建自测试(BIST)和边界扫描设计(Boundary Scan Design),针对逻辑电路和存储器各自的特征和不同的故障类型,都有适合其本身的DFT方法,其中,扫描设计主要用于数字逻辑电路,边界扫描设计主要用于板级电路,内建自测试主要用于存储器的测试,同时随着逻辑电路规模的不断上升,逻辑内建自测试也成为了一个研究的热点,除此之外,IDDQ的测试也是一种常用的方法,但随着特征尺寸的不断下降,它逐渐失去了原有的检测功能。在解决SOC的测试时,The Test Technology Technical Council (TTTC) of IEEE Computer Society 成立了一个嵌入式核测试的委员会,制定了IEEE P1500标准,同时基于NOC(Network On Chip)的测试也在不断发展中。[2]
二、常见的可测性技术
在现代集成电路的测试中,不仅要保证检测到芯片中所有的故障,并且同时要降低测试成本,其中包括测试时间、功耗和测试压缩。然而进入纳米时代后,集成规模不断扩大,使得只利用传统的测试方法根本无法对被测芯片做到完整的测试。其根本原因在于芯片内部各个节点的可测性,即可控制性和可观测性。无数的学者和工程师都为了改善可控制性和可观测性做了非常深入的研究。最初的方法是一种叫做Ad Hoc的方法,这种方法直截了当的在电路中插入控制点和观测点来改善它的可测性,一般的做法是加入多路选择器和一些简单的组合逻辑门,这样虽然在当时取得了非常不错的效果,但是随着电路功能的进一步复杂,规模的进一步扩大,这种方法也显现出了它的局限性。[3]为此,业界不得不探究新的方法来解决这一问题,最终产生了三种被广为接受的可测试设计方法,即扫描设计(Scan Design)、内建自测试(BIST)和边界扫描设计(Boundary Scan Design)。这三种方法至今仍是工业界主流的可测试设计方法,并且为多数EDA工具供应商所接受,将他们整合到相应的EDA工具中,完成自动化设计流程。
扫描设计的优化:由于全扫描设计存在面积开销较大和测试路径较长等问题,因此在一般的设计中都要插入不止一条的扫描链,将这些扫描触发器连接在不同的扫描链上,但扫描条数也不应过多,因为每增加一条扫描链将要增加一个扫描输入端口和一个扫描输出端口,通常所遵循的原则是:尽量使每条扫描链的长度相等,充分考虑端口的数目和复用,同时也要参考自动测试仪(ATE)的通道数目和数据存储量,对扫描链条数进行合理的分配。
测试图形生成:经过了扫描设计的电路,扫描触发器代替了原来的普通触发器形成了扫描链,使得原本要利用时序电路测试生成方法的电路,现在只需要利用组合电路的测试生成方法就可以达到很高的故障覆盖率,降低了测试生成的难度,同时也减少了测试数据。在现在EDA设计平台下,所有的EDA公司都提供了扫描链插入和测试图形生成的整套EDA工具,并且两者之间可以很好结合。例如Synopsys公司的DFT Compiler和TetraMax就是专门的用于扫描设计的工具,DFT Compiler可以对电路进行触发器的替换,之后再将替换后的触发器按设计者的实际需要连接成扫描链,之后将生成的文档交给TetraMax,让它根据所选的故障类型生成满足一定覆盖率要求的测试图形,同时可以对测试图形进行压缩,测试图形包括STIL、Verilog等多种形式可供选择。这些都可以很好地被ATE所支持,最终完成芯片的测试。[5]
内建自测试:当芯片的功能进一步加强,使得芯片的复杂度和规模不断上升,扫描设计也出现了一些较为棘手的问题。例如测试图形的加载、管脚数目较少和测试费用较高。针对这一系列的问题,内建自测试(BIST)的方法应运而生。内建自测试的基本思想就是将测试图形发生器和测试响应比较器都内嵌到电路里面。它一般包括测试激励生成电路、测试响应压缩电路、测试响应比较电路、理想响应存储电路和测试控制电路。
穷举测试:穷举测试是要对电路中的每一个状态都进行测试,在Intel 80386中就利用了这种方法进行测试激励的生成,但是一般情况下这种方法是不可行的,也是不必要的。因为大规模电路的内部状态将随着它的内部节点和逻辑门数随指数增长,同时,在一个芯片内部,很多状态在实际的功能中并未被使用,因此并没有必要λ们进行测试。
伪穷举测试:伪穷举测试克服了穷举测试中测试图形较多的缺点。一般的做法是将电路进行模块划分或进行敏化路径分割。模块划分是对电路中的模块按照功能进行合理划分,这样就可以对每一部分进行直接的控制和观测,但是这样会增加额外的电路面积。而敏化路径分割是根据PI和PO建立起敏化路径,对每一部分进行单独的测试,并且利用逻辑模拟其他部分的功能,这样就可以使故障在路径上进行正常的传播。
伪随机测试:这种测试图形生成方法是现下比较成功的一种,因为在现实的测试中,想要生成真正的随机测试码是不可能的。伪随机生成的测试图形是确定的,并且具有重复性。最常使用的伪随机测试图形都是根据线性反馈移位寄存器(LFSR)生成的,LFSR作为一个数据发生器,它在每一位上出现0和1的概率都是相等的,一般是利用DFF和异或门进行组合。根据LFSR的本原多项式随着时钟的变化生成一系列的测试图形,在该方法的启示下,又提出了加权伪随机测试图形生成方法。同时随着电路测试数据的进一步压缩,之前的研究中提出了一种新型的二维伪随机测试图形生成方法,该方法是利用了LFSR和Johnson序列进行运算,Johnson计数器随着时钟周期每次变化一位,当Johnson计数器完成了所有的跳变,LFSR根据本原多项式生成新的种子,从新运算得到新的测试图形,该方法由于利用了二维结构使得测试数据取得了很高的压缩率,并且每次只有一位进行变化,从而达到了降低功耗的目的,同时由于具有很好的伪随机性,使得故障覆盖率达到了很好的效果。
测试响应:当得到测试响应后,因为测试响应的数据量过大,不可能直接与理想响应进行比较,因此一般都是要先对测试响应进行压缩,然后再进行对比。然而在响应压缩过程中,有可能会对原有信息造成丢失,这种压缩称为有损压缩,不丢失信息的则是无损压缩,大多数情况下的响应压缩都是有损的,由于经压缩后的响应为特征符号,当该特征符号与理想的特征符号一样时,由于有信息丢失也不能确保该芯片一定没故障,这种情况称为混淆,混淆度的大小决定于压缩算法。常用的压缩算法有:“1”计数和跳变次数压缩。
“1”计数:这种压缩方法是对测试响应中的“1”进行计数,最终得到的特征符号就是该测试响应中“1”的个数。用该特征符号与理想的特征符号进行比较,如果有故障的电路的测试响应的“1”个数也与理想响应的一样,这样就会出现混淆,混效率随着测试响应的长度变长而减小。
内建自测试的分类:内建自测试在最初提出的时候,主要是用于存储器,因为存储器的故障模型和逻辑电路不同,而且它的内部结构十分的规律,同时又只有很少的面积开销,因此使用内建自测试得到了很好的效果。后来随着逻辑电路规模的进一步扩大,对ATE的要求越来越高,使得测试成本急剧上升,从而逻辑电路内建自测试的方法也得到了广大学者和业界的关注。
存储器内建自测试:当在存储器内建自测试中,最主要的问题是测试的调度和隔离问题。在现代集成电路中,每一块芯片中都不止一块的存储器,它们协同合作与逻辑电路交换数据。对于他们进行测试时,一般是共用一个测试图形发生器,根据测试功耗及端口的数目对它们进行合理的测试调度,使得在不超过额定测试功耗的前提下,最大程度的减少测试时间和成本。在与逻辑电路的交互中,存储器周边的逻辑单元起着至关重要的作用,当对存储器测试时,要将存储器和周围的逻辑单元隔离开,使得测试数据可以直接加载到存储器上,同时也可以直接对测试响应进行观测,而不受周围逻辑的限制。
逻辑内建自测试:逻辑内建自测试的原理与存储器的类似,而它的关键问题在于测试激励的生成。因为内建自测试不同于ATPG工具,ATPG工具可以根据软件的方法生成能检测到故障的测试图形,但内建自测试却不同,它是要根据硬件电路生成固定的测试图形,在这其中,或许有很多的测试图形是不能检测到故障的。因此如果要达到与ATPG工具同样的故障覆盖率就较为困难。当前较常使用的激励生成方法还是主要利用LFSR的伪随机性,再结合一些加权因子,这些方法不仅在测试覆盖率上有不错的效果,而且在功耗及时间方面都表现出很好的潜力。
边界扫描设计作为又一种DFT方法,它遵循JTAG标准,早期主要利用于一些FPGA电路中,后来经过进一步的修订和标准化,现在将它扩展到主要解决板级测试和诊断的问题。基本结构:边界扫描的整体结构包括一个测试存取通道(TAP)、一组边界扫描寄存器和一个TAP控制器。
边界扫描寄存器环绕在器件周围,功能和扫描设计的寄存器类似,内部的逻辑可以通过这些存储器进行数据和指令的读写,主要包括指令寄存器和数据寄存器。而数据寄存器又包括旁路寄存器、边界扫描寄存器和器件标志寄存器。
TAP控制是个状态机,主要含有了多种逻辑状态,包括:测试逻辑复位、选择指令寄存器扫描、选择数据寄存器扫描、捕获数据寄存器和数据寄存器移位等,由这些状态的转换可以完成整个测试过程。
边界扫描指令:在边界扫描设计下,TAP控制器有多重测试指令,按照这些指令可以完成相应的测试功能,主要包括以下指令:外测试指令(EXTEST):该指令是为了测试芯片外部的互联结构。内测试指令(INTEST):该指令是为了测试芯片内部的逻辑。运行内建自测试指令(RUNBIST):该指令是为了向器件内部发送一个内建自测试的命令。取器件标志指令(IDCODE):该指令主要是从器件内部读取器件的标号及厂商信息。组件指令(CLAMP):该信号是为了强制器件的输出信号与边界扫描寄存器驱动。旁路指令(BYPASS):该指令的功能是用旁路寄存器旁路掉边界扫描链。
本文重要介绍了集成电路测试的一些基本原理,其中最主要的是可控制性和可观测性,它们作为整个集成电路测试的重中之重,所有的测试方法和算法都是为了提高这两方面的性能。接下来简述了故障和ATPG相关信息,它们是电路测试的理论基础,只有建立了完整的故障模型,才有可能对电路进行接下来的测试。最后概述了常用的几种可测性设计方法,它们都是现下主流的方法,芯片在应用了这些可测性设计方法以后,大大提高了测试效率,使得测试成本急剧下降,但由于芯片规模的进一步扩大,测试的时间及功耗成为了研究的热点问题,尤其是扫描设计的功耗更是成为学者所关心的焦点。
【参考文献】
[1]Qiu W, Wang J, Walker DMH, et al. K Longest Paths Per Gate Test Generation for Scan-Based Sequential Circuit[C].IEEE International Test Conference,2004:223-231.
[2]Semiconductor Industry Association(SIA).Test and Test Equipment,International Technology Roadmap for Semiconductors(ITRS) 2006 Update[R].2006.http:///辛希孟信息技术与信息服务国际研讨会论文集:A集[C].北京:中国社会科学出版社,1979.
[3]Sehgal A, Chakrabarty K. Optimization of Dual-Speed TAM Architectures for Efficient Modular Testing of SOCs[J].IEEE Transactions On Computers,2007,56(1):120-133.
[4]Maxwell P,Hartanto I,Bentz paring Functional and Structural Test[C].IEEE International Test Conference,2000:400-407.
高性能计算机范文2
关键词:虚拟主机平台;VMware ESX;高性能计算机;虚拟技术
中图分类号:TP311 文献标识码:A文章编号:1009-3044(2010)18-5065-02
现代高性能计算机应用越来越普及、应用的范围越来越广,各种各样的网络系统,各种硬件和软件资源的规模不断增多,以及随着个人计算机操作水平不断提高,因此对计算机信息系统的管理水平要求越来越高,另外由于人们的工作需要,各种的系统的被引入,导致系统的规模越来越大,各种随之配套的硬件越来越多而且复杂,就会导致计算信息系统的可靠性及安全性不断降低。随着高性能计算机出现及应用的普及,使用虚拟主机平台(VMware ESX)解决上述问题变为行之有效的方法。
目前虚拟技术应用主要在台式电脑和应用服务器上,包括软件应用(如VMware workstation、Virtual PC、Xen和VMware ESX )及硬件应用(如Inter的VT-x、VTi和AMD的Pa-cific技术)。本文主要对虚拟技术软件应用部分虚拟主机平台(VMware ESX)在高性能计算机应用进行探讨,然后对虚拟主机平台的前景进行了分析。
1 虚拟主机平台(VMware ESX)在高性能计算机应用的探讨
目前,国外公司及国内一些事业单位已经开始把虚拟主机平台(VMware ESX)在高性能计算机应用,并取得一定成功,包括实现了:低碳节能、提供数据中心级的高可用性、实现整个虚拟化IT环境的管理、整合异构资源、虚拟化集群管理、实现异地备分。
1.1 低碳节能
一个完善的计算机信息系统应用一般包括OA、WEB、FTP、AD、VPN、E-MAIL、电子图书馆、电子阅览室、网管、防病毒、计费等系统,按管理及使用功能的不同或管理部门的不同,需要设置多台甚至每系统都要设置服务器。应用虚拟主机平台(VMware ESX)我们可以把轻负载应用(如OA及一些基础服务系统等)整合到VMware ESX上。通过利用较少数量的服务器运行同样数量的系统应用程序, 降低设备成本和能耗成本。减少服务器设备本身就可以减少耗电,另外由于硬件设备的减少,UPS损耗和散热空调也会随之省电。另一方面可以节省服务器空间,随着各种系统应用增多,不需要随之大量采购硬件设备,从而达节约能耗,实现低碳节能。
1.2 提供数据中心级的高可用性
虚拟主机平台(VMware ESX)本身的就是一个高可用性的基础架构。当我们将一些系统应用程序放在该虚拟平台上时,它也就具有了高可用的特性。在这样的技术平台下面,我们既可以很好处理故障切换,也可以很好地均衡资源,包括:利用VMware ESX可以实现对各应用系统采用最低或最高或按比例分配 CPU、内存、磁盘和网络带宽共享资源,实现优化虚拟机资源分配。CPU的虚拟化可以提高服务器利用率,不会导致关键服务因缺少 CPU 资源的风险。存储的虚拟化可以利用高性能的共享存储器来集中存储虚拟机文件,各种应用系统从而获得更高的可管理性、灵活性和可用性。网络的虚拟化能实现网络虚拟机与物理机一样的功能。进行生产部署或开发及测试时,可在单个 VMware ESX平台或跨多个 VMware ESX 平台安装来构建复杂的网络。另外具有增强的网卡分组功能。VMware ESX可以为每台网络虚拟机提供内置的网卡故障切换和负载平衡功能,实现了更高的硬件可用性和容错能力。利用网卡分组策略允许用户配置多个活动和备用适配器。同一虚拟交换机上的不同端口组可以使用不同的分组配置,甚至不同的端口组还可以为同一个组选择不同的分组算法。
因此通过使用虚拟主机平台(VMware ESX)的以上功能,可以让出现的故障只能影响到其中一VM,即使出现故障,也可以通过VM转移、重启VM等方法迅速恢复系统的运行。以较低的运行成本提供高级业务连续高可用性保护,同时为关键应用程序提高可用性,同时为了提高了系统的可靠性和容灾能力。
1.3 整合异构资源―平滑迁移
虚拟主机平台(VMware ESX)能够实现将多个操作系统的异构开发、测试和临时环境整合到同一个硬盘上。由于各种信息应用系统的研发公司和研发平台及运行环境的不同,导致产品的使用的软、硬件环境要求不一样,如(只能支持WINDOWS或只能支持LINNIX),VMware ESX平台上可以运行未经修改的 Windows、Linux、Solaris 和 NetWare 操作系统。并能支持64 位客户操作系统,运行以非 VMware 格式创建的虚拟机。虚拟主机平台能够在物理机与虚拟机之间平滑地过渡。比如像OA、WEB这样的一些前端应用,从客户端来看在物理机和虚拟机上的应用效果都一样的。虚拟主机平台升级的时候,虚拟主机平台相应的工具也能够实现平滑的迁移。
部分早年开发的应用系统程序由于开发环境的原因,只能运行在原来的操作系统安装与运行,但随着新式的硬件的出现,需要在新的操作系统支持新的硬件,利用虚拟主机平台能将早年开发的应用程序重新放到新硬件上来运行,实现了系统的平滑迁移。
1.4 实现整个虚拟化IT环境的管理―管理简单
虚拟主机平台(VMware ESX)支持对整个虚拟化IT环境的管理。包括软件和硬件的管理,如使用通用的用户界面来管理 VMware ESX、虚拟机和 VirtualCenter Server,可使用任何支持 SMI-S 的标准存储管理工具监控虚拟存储。使用简单的 Web 界面(以前称作“管理用户界面”或 MUI)管理 VMware ESX。使用通用信息模型 (CIM) 通过 VirtualCenter 或与 CIM 兼容的第三方工具提供监控硬件的状态。
另外通过虚拟机平台上的管理工具,可以很清楚地看到所有的虚拟机的状态,并对所使用的资源进行有效的监控和调配。如果是物理机器,我们并不能保证每台服务器在7x24小时都能连上去,甚至需要购置第三方的管理软件来监控。这些都会增加了系统的复杂性和运行成本。
1.5 虚拟化集群管理
虚拟主机平台(VMware ESX)提供了无与伦比的性能和可扩展性,即使最占用资源的生产应用程序(如数据库、ERP 和 CRM)也能实现虚拟化,因为VMware ESX虚拟技术支持:
1)RAM 超额负载。配置虚拟机内存以使其安全地超出物理服务器的内存,例如,在物理内存为 8GB 的服务器上运行的所有虚拟机的总内存可达到 16GB。
2)支持功能强大的物理服务器系统。能支持规模非常大的服务器系统(包括多达 32 个逻辑 CPU 和 256 GB RAM)实施大规模服务器整合和容灾项目。
3)异构存储阵列。在同一 VMFS 卷中使用多种异构存储设备。
4)灵活的虚拟交换机设置。可以创建端口数在 8 到 1016 之间的虚拟交换机,并且每台主机支持多达 248 个虚拟交换机。并提供4GB 光纤通道 SAN 支持。
因此在虚拟主机平台(VMware ESX)需要增加服务器时都很简单,只需要把服务器连接到机群,并配置好,虚拟主机平台就可以自动地利用这个服务器的资源了。增加虚拟主机平台也同样简捷,复制一份相同配置到相应服务器并做简单的配置就可以正常运行,不需要考虑服务器的异构等硬件因素,缩短了部署时间。
1.5 实现异地备份
在虚拟主机平台(VMware ESX)上,采用EMC Avamar虚拟备份工具正好相配,实现虚拟机异地备份。EMC Avamar Virtual Edition (AVE)是最优秀的重复数据删除技术之一,它是一种源端的全局重复数据删除技术。其特点是,在数据源开始处感知应用,能够针对具体应用数据(例如,Oracle数据库、SQL Server数据库、Word文档、PPT文档、电话录音、流媒体等等)的特点,实现最大限度的重复数据删除,删除率高达300:1甚至更高,从而减少需要备份的负载,提高备份速度,是视可替代传统磁带的数据备份工具。EMC Avamar Virtual Edition (AVE)是一种完全虚拟化的备份和恢复解决方案,通过Avamar 在源位置执行全局重复数据删除的技术与 VMware 虚拟基础架构的高效性结合起来,实现虚拟机异地备份。如果采用物理版本,就等于要多配置一台服务器。为了保证高可靠性,可能还需要购置两套互做支持,以防止硬件故障。而作为软件,Avamar虚拟化版本在可靠性、可管理方面都比在物理机上占优势,备份客户端免费,不限备份客户端数目和类型,可以随时追加备份却不用追加投资。如果采用别的备份方案,至少还要采购一台服务器和一个磁盘阵列,运行成本也会高出许多,另外实现容灾也变得复杂许多。
2 虚拟主机平台(VMware ESX)应用前景分析
虚拟机技术目前在台式计算机的应用已经相当普及(如Virtual PC等在教育和科研体系中的应用),而虚拟主机平台(VMware ESX)的应用还只在小范围。随着现代高性能计算机应用越来越普及,对计算机的信息系统的管理水平要求越来越高,虚拟主机平台(VMware ESX)将作为高性能计算机领域解决新出现的技术问题新的方法。
1)异地备分。提高容灾能力,一直以来,一般企业的关键业务数据只是采用B2D作为备份文件进行简单备份,并且每个系统分散备份,备份副本少,备份管理效率低。为了解决上述问题,可以使用虚拟技术建立本地异机备份方案,在不影响现有架构的情况下实现集中备份,提高数据的安全性和高容灾能力。
2)虚拟化集群管理。虚拟技术提供了无与伦比的性能和可扩展性,能使用多种异构存储设备,为客户端提供统一的系统环境和与物理机上一样的应用效果,为用户的运行成本。
3)提供高可用性的基础架构。由于各种系统的引入导致系统的规模越来越大,各种随之配套的硬件越来越多而且复杂,这样就导致计算系统的可靠性及安全性不断降低。为了提高系统的可靠性和容灾能力,使用虚拟技术可以使故障只能影响到其中一VM,即使出现故障,也可以通过VM转移、重启VM等方法迅速恢复系统的运行。
3 结束语
与台式计算机的应用虚拟技术在现代高性能计算机应用,虚拟主机平台目前只在一些高端用户使用,如银行、证券等行业,这些除了对计算机性能有苛刻的要求外,还必须技术工程人员的对各种系统的熟练程度要求较高。随着高效率的虚拟技术的不断发展以及新硬件对虚拟技术的支持,各种信息系统在虚拟主机平台应用是一个需要不断探讨的问题。
参考文献:
[1] 萨曼达.信息存储与管理:数字信息的存储、管理和保护[M].北京:人民邮电出版社,2010.
[2] 钱磊,李宏亮,谢向辉,陈左宁.虚拟化技术在高性能计算机系统中的应用研究[J].计算机工程与科学,2009,31(A1).
高性能计算机范文3
本报讯如果说去年中国高性能计算机应用还局限在几十万亿次量级,那么进入今年下半年已经上升到百万亿次。6月下旬,浮点运算处理能力可以达到230万亿次(交付用户使用能力200万亿次)的高性能计算机“曙光5000”率先落户上海超级计算机中心。一个多月后的8月7日,联想集团与中国科学院计算机网络信息中心(以下简称中科院网络中心)在京举行了百万亿次高效能计算机系统签约仪式。根据协议,联想公司将研制并部署一套具备每秒百万亿次运算能力的“深腾7000”高效能计算机,用于装备中科院超级计算环境总中心和国家网格(北方)主节点。整个项目将于年底前完成并投入使用。
联想承接研制的百万亿次高效能计算机的节点机,将采用模块化刀片服务器;处理器将采用数千颗多种类型的Intel处理器,涉及2路Xeon、4路Xeon和安腾处理器。整套设备将从中科院网络中心实际应用需求出发,采用异构体系机群,并为用户提供瘦节点、厚节点、胖节点、图形加速节点等四类计算节点。
中科院网络中心委托联想公司研制的百万亿次高效能计算机系统,将成为“十一五”中国科学院信息化建设专项“超级计算环境建设与应用”三层计算网格架构环境中顶层总中心的主机,同时也是国家863计划“高效能计算机及网格服务环境”的北方主节点。项目完成后,中科院网络中心将通过联想百万亿次高效能计算机,为全国数百个科研院所和机构提供强大的高性能计算、服务、存储资源,进一步提升我国科技界超级计算的应用水平。
显然,联想和曙光已经在百万亿次计算机方面进行了新的角力。联想集团高级副总裁贺志强以及他带领的高性能计算机团队也是脱胎于中国科学院计算技术研究所的,也参与过曙光高性能计算机的研发。他在接受本报记者专访时表示,在国内,除了曙光的高性能计算机团队外,中国国内还有别的高性能计算机研发团队。正是这些团队之间的良性竞争,才会让中国高性能计算机事业不断发扬光大,追赶世界潮流。贺志强透露,他个人很佩服曙光高性能计算机研发团队的冲劲,但他认为在百万亿次高性能计算机竞争中,曙光和联想哪个企业更领先现在还不能确定,“还要看最终结果”。
高性能计算机范文4
美国ASCI计划
美国能源部自1996年开始了一项名为ASCI计划的高性能计算机研制项目。该计划是在全球全面禁止核试验的情况下,美国为了保持其核威慑及核垄断地位而提出的一项计划。目前,世界上绝大多数最快的超级计算机都是这个项目的产物,其中主要的代表有IBM公司研发的Blue Gene和Cray公司研发的Red Storm。
1. IBM蓝色基因
Blue Gene是IBM、美国LLNL实验室和美国能源部合作的一项研制超级计算机的项目代号。项目计划是制造峰值性能达到每秒千万亿次级别的超级计算机。这是一个分阶段的项目,目前性能已经达到每秒360万亿次。现在正在研发的Blue Gene项目共有四种机型:Blue Gene/L、Blue Gene/C、Blue Gene/P和Blue Gene/Q。
Blue Gene/L采用了与以往设计完全不同的方法。系统由大量节点组成,每个节点的处理器不再追求高性能、高主频,而是相对适中,从而实现了低功耗和低成本。Blue Gene/L通过PowerPC的嵌入式处理器、嵌入式DRAM和片上系统技术把计算处理器、通信处理器、三级Cache和带有复杂路由的互联网络部件集成在一起。由于采用这样的低功耗、低主频设计,导致了整机的低功耗和高密度,可以把1024个计算节点放置于一个机柜当中。通过这样的方式把用于节点通讯的功能单元和处理器集成在一起,降低了成本。2004年9月,IBM公布了Blue Gene/L原型,当时的性能是每秒36.01万亿次。它以这个速度替代了NEC的地球模拟器成为世界上最快的超级计算机。截止到2006年6月,世界最快的前10台超级计算机中有3台是Blue Gene,前64台中有13台。
Blue Gene/C计划现在已经更名为Cyclops64。这个计划的目标是制造第一个“片上超级计算机”。每个Cyclops64芯片预计运行在500MHz主频下,包含80个处理单元。每个处理单元包含两个线程单元和一个浮点单元。处理器通过96口和7级的交叉开关互联,而且它们可以通过片上的SRAM进行通讯。单片的Cyclops64芯片的理论峰值将可以达到每秒8000亿次。整个系统将可以包含13824个芯片、1105920个处理单元以及可以同时运行2211840个线程。Cyclops64软件系统采用了Delaware大学的TiNy线程库,提供给用户良好的可编程界面。
Blue Gene/P计划是一个结构上类似于Blue Gene/L的项目。它的目标峰值性能将达到千万亿次。目前在美国的LLNL实验室部署的代号为Roadrunner的超级计算机,被认为有可能是该计划的一个具体应用。Roadrunner采用了混合式设计,它采用了16000个AMD的皓龙处理器以及相当数量的Cell处理器。由于Cell处理器具有良好的浮点运算性能,通过Cell处理器的运用将大大增加Roadrunner的峰值运算性能。如果IBM能完成这个系统,那么它将成为世界上最强大的超级计算机系统。
Blue Gene/Q计划是IBM面向未来的超级计算机研制计划,目前关于该计划的细节还知之甚少,该计划的性能目标将达到每秒3千万亿次~10千万亿次。
2.Cray红色风暴
针对ASCI项目,Cray公司提出了代号为Red Storm的超级计算机架构。第一台使用这个架构的超级计算机,在2004年被部署在美国的SNL实验室。这台机器包含有10368个处理器,拥有10TB的分布式内存和240TB的磁盘存储。该系统使用AMD的皓龙处理器作为处理单元,使用PowerPC 440的处理器作为通讯处理器。系统由计算节点和服务节点两个部分组成。计算节点运行称作Catamount的轻量级操作系统,服务节点运行Linux操作系统。该系统主要是为了替代ASCI Red,理论峰值将达到40万亿次。 ASCI随着第一个十年计划的完成,目前已经开始了第二个十年计划,该计划已经更名为ASCP(高级模拟与计算计划)。最新的发展规划认为第一个十年主要是通过开发一系列强大的工具和系统,验证基于模拟研究方法的可行性。第二个十年计划将要真正利用这些系统进行科学探索,进一步提高精度和正确性,逐步把模拟作为一种预测工具用于前沿的科学研究。同时第二阶段全面把下一代超级计算机系统的验证目标设定为每秒千万亿次。
美国HPCS计划
除了ASCI研制计划之外,美国国防部高级研究计划局于2001年初提出了HPCS(高效能计算系统)计划。该计划的目标开始就是面向千万亿次规模的计算机系统需求,针对当前高端计算机系统开发以及应用中存在的问题,研制适合于高端国家安全应用的高性能计算系统,填补目前高性能计算和量子计算之间的空白。
HPCS计划为期8年,分为三个阶段实施。第一阶段为概念研究阶段,第二阶段是研究、开发阶段,第三阶段是大规模开发阶段。整个HPCS的主要设计目标是高性能、良好的可编程性、可移植性以及可靠性。高性能的主要目标是在美国重要的国家安全应用方面,将目前的系统性能提高10~40倍;可编程的主要目标是减少HPCS应用方案的开发时间,降低系统的运行以及维护成本,提高系统使用效率;可移植性是指将研究和运行的HPCS应用软件和系统平台分离;可靠性的目标是针对外界的攻击、硬件故障以及软件错误开发相应的保护技术。因此HPCS主要提出的课题有:高带宽、低延迟、平衡的系统结构、可靠性策略、性能测试、系统伸缩性。
2002年开始的是为期一年的HPCS概念研究阶段。参与这个阶段研究的厂商主要包括Cray、HP、IBM、SGI和Sun五家,还有MIT的林肯实验室专门进行应用分析和性能评测。经过竞争和淘汰,第二阶段参与的企业为Cray、IBM和Sun三家。
1.Cray两步走
Cray计划分两步完成自己的千万亿次设计目标。第一阶段推出一种称为Rainier系列的机器,以整合Cray现有的XD1、XT3、X1/X1E三种平台,形成一种新的Rainier的计算节点也是异构的系统,包括基于AMD皓龙处理器的标量计算节点、向量计算节点,还包括其他特殊计算节点,比如FPGA可重构节点和MTA多线程节点等,各种不同的处理器节点在统一的框架下进行管理。
第二阶段Cray计划推出一种名为Cascade的平台,这是Cray更为长期的一项计划,将融合更多的创新性技术。Cascade将采用统一的高带宽光互联网络,节点将包含向量部件、粗粒度的多线程处理器、与DRAM结合支持细粒度并行的PIM部件等。Cascade还提供分布式共享内存、多层次多线程执行模型、硬件支持的分析和调试功能。编程模型上提供对UMA和NUMA的混合模型,并计划开发一种高级编程语言。
2.IBM PERCS计划
IBM针对HPCS提出了PERCS计划,该研究包括处理器、存储控制、I/O、编译和运行环境等各个方面的研究队伍。其主要的研究内容包括:片上多处理器,PERCS将采用IBM Power7处理器;智能内存,将在DIMM内存条上增加一个智能Hub芯片,实现预取、Scatter/Gather、重排序、缓存等功能;在编程模型方面,实现了一种名为X10的编程语言,而且支持OpenMP。此外,IBM还专门开发了一种称为K42的操作系统,专门支持大规模处理系统;为了进行前期的研究,他们还开发了PERCSim模拟器来支持各个研究小组的工作。
3.Sun HERO项目
Sun提出了HERO项目,其中一些核心的创新技术包括:片内多线程技术、Proximity通讯技术、区间计算技术、保护指针。
目前,HPCS已经进入第三阶段,其中Sun被淘汰出局。现在IBM和Cray公司基于各自提出的技术开始为HPCS制造运算速度千万亿次的超级计算机。
日本高性能计算进展
除了美国,日本很早就从事高性能计算机的研制工作,其中比较有代表性的是NEC公司。
1983年,NEC就了其代号为SX-1和SX-2的超级计算机,其后几乎NEC以5年一代的速度不断推出新产品。
2002年,NEC为日本太空探索局等机构安装的地球模拟器速度达到了每秒35万亿次,拥有超级计算机领域最高性能桂冠长达3年之久。
地球模拟器通过设置“虚拟地球”以预测和解析整个地球的大气循环、温室化效应、地壳变动、地震发生等自然现象。硬件上地球模拟器的设计基于NEC以前的一款名为SX-6的超级计算机的架构。
整个地球模拟器包含640个节点,每个节点包含8个向量处理器和16GB内存,整体上组成5120个处理器和10TB内存的超级计算机系统。其中两个节点共享一个机柜,每个机柜耗电20 kW。系统具有700 TB的磁盘阵列和1.6 PB的磁带存储。地球模拟器几乎比同时代的美国的ASCI White超级计算机快5倍。NEC从1999年10月份开始构建这台超级计算机,到2002年才正式完工,共耗资72亿日元。
日本的科研机构和大学在超级计算机方面也获得很大的成就。2006年6月,日本的RIKEN研究所宣布他们完成了一台名为MDGRAPE-3的超级计算机系统。这是一台专用于分子动力学研究的超级计算机。该机器由总共4808个定制的MDGRAPE-3芯片,外加用于主控的Xeon处理器等组成。
该研究所宣称MDGRAPE-3性能已经达到千万亿次的目标,比目前最快的超级计算机Blue Gene/L还要快3倍,但是因为其专用性,不能运行Top500的测试程序,因此无缘Top500排行榜。除此之外,日本东京大学的GRAPE项目也在高性能计算的某些领域获得了很高的成就。
中国高性能计算进展
除了美、日之外,我国在高性能计算机方面的努力也很值得关注。有很多从事高性能计算机研究的企业和科研单位涌现出来,比如开展高性能计算算法研究的单位有中国科学院、中国工程物理研究院、国防科技大学、中国科技大学等单位。硬件制造也有不少单位,比如曙光信息产业有限公司、联想集团等。他们在各自的领域获得了很多令人瞩目的成就。
2004年6月,浮点运算速度达到每秒11万亿次的曙光4000A超级计算机落户上海超级计算中心。这台超级计算机进入当时的全球超级计算机排行榜前10名,使得我国成为继美国和日本之后,第三个能研制10万亿次商业高性能计算机的国家。
曙光4000A在大规模集群计算、网格技术等方面有所突破,形成了鲜明的技术特色。曙光4000A在工业标准的主板尺寸上实现了4个64位AMD皓龙处理器的SMP系统。2U的服务器采用标准的机箱、电源、风扇等部件,有独到的通风设计和部件布局。通过网格路由器、网格网管、网格钥匙、网格视图等网格部件的研制,曙光4000A在网格环境下能更好地服务于具有多样性的用户需求。通过在主板上集成管理接口,开发大规模集群专有的管理网络,使得大规模集群能够被有效地管理和控制,使得管理员不需要靠近计算机就能控制其运行。通过合理划分集群软件栈,将公共支撑部分提取成为集群操作系统的核心,改变了集群上系统软件缺乏统一框架的现状。曙光4000A的Linpack实测速度达到每秒8.061万亿次,效率达到71.56%,这个结果是当时世界上所有采用AMD皓龙处理器的高性能计算机中速度最快且效率最高的。曙光4000A跟ASCI White相比,价格是后者的10%,系统占地是后者的60%,功耗为后者的30%。
联想公司承担着国家863计划“高性能计算机及其核心软件”专项课题,在此基础上制造了深腾6800超级计算机,该计算机于2003年10月完成。深腾配置了1060个64位安腾2代处理器、2.6TB内存、80TB磁盘存储。
高性能计算机范文5
今年6月的全球TOP500中,中国上榜高性能计算机台数从74台下降到68台,性能占比从14.16%下降至9.23%。“一方面,这种放缓是由于高性能计算机研发具有周期性,今年国外高性能计算机爆发所引起的;另一方面,未来一段时间高性能计算更重要的是探索互联网服务和云计算等新应用领域,中国企业开始起到越来越重要的作用。”曙光研发中心总经理邵宗有如是说。
应用领域逐渐拓宽
过去两年间,在TOP100榜单中,高性能计算的应用领域发生了不小的变化。2011年,互联网服务夺下21%份额,跃居榜首。今年的TOP100中,这一比例扩大到了35%。这种改变中蕴藏着机遇。
“实际上,今天的高性能计算概念与传统的高性能计算概念有些变化。互联网应用、云计算和传统的高性能计算之间的界限已经十分模糊。”邵宗有表示,学术界对如何界定高性能计算、云计算和互联网应用计算还有一些争议, “实际上,现在的很多云计算服务已经是由高性能计算机支持。深圳的超级计算中心中,云计算与高性能计算并举。同时,在互联网应用需求快速增长的今天,互联网企业已经成为高性能计算机的最大用户之一,它们需要计算设备按照它们的需求做出改变。谷歌等企业早已开始自行设计服务器,国内的百度、腾讯和阿里也共同启动了‘天蝎计划’,希望制定符合互联网应用需求的服务器标准。”
“作为一家市场化的企业,曙光可以不去考虑定义问题,而是第一时间介入到这种变化中。”邵宗有表示,这种变化对曙光来说,其实是一个难得的市场机遇。“例如,在互联网应用方面,曙光就将和百度成立联合实验室,研发适合互联网应用的服务器。同时,曙光也一直积极参与‘天蝎计划’,利用自己的技术能力,为互联网企业定制越来越多的计算设备。”
与此同时,其他应用领域,中国高性能计算的应用也达到了较高水平。“尤其是在一些新兴领域,我们的应用水平和国外差距反而较小。”邵宗有介绍,利用高性能计算对社会现象进行分析、对金融形势进行分析等新兴的应用,国内都有实践。“现在高性能计算的应用领域已经远远超越了以前的气象、能源、科研等领域,而是渗入了国民经济的每个环节。”
自主环境逐渐建立
在今年的TOP100榜单中,一个可喜的信息是,美国制造的HPC数量从49%降到44%,与此同时,国产16核处理器申威1600占据的份额超过了1%,打破了处理器领域的坚冰。
“在过去一段时间内,国内的高性能计算自主研发环境正在逐渐建立。”邵宗有说,“例如,在应用上,国内自主研发的气象、勘探、科研等应用早已在各自的领域内得到深入应用。但在处理器等方面,还在发展的过程中。未来一段时间,提高高性能计算机的国产化率也是曙光非常重要的研发方向。”邵宗有表示,曙光目前一方面要凭借日益增长的影响力,与国际合作伙伴继续加强合作,另一方面也要以国家核高基计划为依托,提高高性能计算机的国产化率。“过去几年,在核高基计划的支持下,国产处理器和操作系统的稳定性有了长足的进步,相关的应用也在逐渐完善,在高性能计算机中被大量采用的时机已经成熟。”邵宗有表示,在高性能计算机中采用国产处理器是“应该的、必然的、必须的”。
在提高自主性的过程中,自主的技术研发是根本。“在过去几年,曙光一直在增加技术研发投入,整个技术体系的人员数量大幅度上升。目前,曙光不包括服务体系,产品、解决方案的研发人员已经达到约500人,而2008年前也就是100多人。同时,在研发规模、研发环境方面也加大投入。” 邵宗有表示,技术研发方面的投入会直接反映在产品和市场上,曙光在TOP100中取得的36%份额也和这方面的投入有很大关系。
瞄准再创历史的目标
高性能计算机范文6
【关键词】 高性能计算 石油勘探技术 研究和应用
当前阶段,我国的石油行业飞速的发展以及石油储藏愈发复杂的地理状况让勘探开发行业面临更加严峻的挑战,因此对于高性能计算的技术也有了更加深层次的依赖程度,其应用范围也越来越广泛。本文将针对其在我国石油勘探行业的应用情况进行探究分析。
一、高性能计算技术应用在石油勘探领域存在的弊端
石油工程当中对数据进行处理的工作非常重要,如果出现误差就很可能会造成非常严重的后果,因此对于管理数据的计算机系统而言需要具备高度的计算能力,特别是在石油勘探行业当中。
石油的勘探和开发都是石油工程当中非常重要的内容,通常是将石油勘察的过程当中所收集到的大量数据资料进行一定的集中存储,随后根据这些存储的数据展开分析,判断勘察区域当中的石油储备情况,通常按照数据来进行等值线的绘制,随后交给专业的人员来进行石油分布的分析操作,绘制的等值线图终究还是二维图,因此不具备三维画面的立体性,即便能够绘制出三视图以及模拟三维画面,在实际操作的过程当中也会耗费掉大量的时间,显然这种方式存在比较严重的限制性因素。
传统模式下的高性能计算模式渐渐地已经无法和石油勘探行业所需要的计算能力相互满足,更加无法满足其未来发展以及具体的应用需求,可能会导致石油勘探行业无法良性发展,形势不容乐观。
当前,在大部分情况下,利用高性能计算所面临的严峻挑战包括如下几个方面:
第一,电脑CPU处理器的性能无法很好地满足石油勘探行业对于计算能力上的高度要求;
第二,在石油勘探行业当中,随着其不断的发展和进步,高速增长的数据量以及存储扩容的速度呈现出非常明显的不匹配现象;
第三,能耗对高性能计算的发展起到的制约作用越来越强,由于高性能计算机的占地面积比较大、消耗的电量也比较多、对于计算机房的条件有非常大的需求。
二、在石油勘探领域当中运用高性能计算
怎样能够在最短的时间内寻找到能够满足石油勘探行业所需要的高性能计算技术,是全国乃至于全世界的石油勘探单位都在关注的焦点之一。如果能够将计算机以及可视化技术利用起来,我们就能够从勘察数据当中找到有用的数据,构建出一个完整的三维实体,并且显示相关的参数数值,将油藏地质进行非常直观的完整再现,让专业人员能够进行非常准确的分析,同时对原始数据进行客观的解释,会让分析变得更加准确、定位变得更加的科学、石油勘探开发成本变得更加低廉。
就目前情况来看,英特尔公司对于在石油勘探行业当中应用高性能计算有比较丰富的经验以及技术上的支撑,在全球TOP500排名当中,有多台在英特尔处理器的基础之上开发出来的高性能计算机系统在全世界各个大型石油企业当中都有非常广泛的应用。比如,就我国2006年高性能计算机的前100排行当中的数据表示,在英特尔处理器基础之上开发出来的高性能计算机系统,仅仅在我国就有大庆油田、大港油田以及新疆地区的石油地物所等我国大量石油勘探单位当中使用。伴随着未来不断发展的计算机技术以及信息系统,英特尔公司开发的高性能计算机方案,还可以更好地为石油行业的各个客户提供出优秀、完善的计算系统,满足它们愈发严格的要求。
在英特尔公司开发的高性能计算机的处理器当中,拥有非常强大的计算节点服务器,可以给高性能计算提供更加强力的原动力,令其可以进行高效、大规模的计算,而且在此基础之上还拥有非常节能且环保的优势,对于能耗过度、污染环境的传统计算方式而言这一优势是非常重要的。
石油勘探行业的整个运作过程都需要依靠计算机进行。高性能计算机有非常广泛的应用范围,而且随着未来不断进步的科学技术,除了石油化工行业之外,其他的领域也能得到应用。
三、结语
就当前我国石油行业的情况而言,想要合理地对面临的问题进行处理,需要更加完善的改革,最近这些年高性能计算有了越来越快的发展,技术在不断地完善。石油勘探发展前景非常广阔,高性能计算技术和石油勘探的结合,将会促进石油行业更好的发展。
参 考 文 献
[1]李敏.高性能并行计算机的发展及其在石油勘探中的应用[J].科技导报,2014(02).