The World First GPGPU: AMD Stream Processor = R580?
세계 최초의 GPGPU : AMD Stream Processor 는 R580인가?
At the Supercomputing 2006 show today, AMD introduced the world…s first dedicated stream processor designed to meet the specific hardware demands of high-performance computing (HPC) applications. Engineered specifically for compute-only systems such as workstations and servers, the AMD Stream Processor makes use of AMD…s new thin hardware interface called Close To Metal (CTM) to drive substantial performance gains in areas such as financial analysis, seismic migration analysis, and life sciences research, among others.
오늘 Supercomputing 2006 쇼에서, AMD는 세계 최초의 HPC 어플리케이션의 특별 하드웨어를 요구에 응하기 위해 설계된 dedicated stream processor를 소개했다. 워크스테이션이나 서버같은 연산위주의 시스템에 특별히 처리된 AMD Stream Processor는 재무분석, 변화가 심한 분석과 같은 분야, 그리고 라이프 사이언스 리서치 등에서 실속있는 퍼포먼스를 얻을 수 있는 Close To Metal(CTM)이라 불려지는 새로운 얇은 하드웨어 인터페이스를 사용한다.
Stream computing leverages sophisticated massively parallel processors generally used to calculate and render millions of pixels onto computer monitors, hundreds of times each second for 3D graphics applications. Stream computing harnesses that tremendous processing power for a wide range of scientific, business and consumer computing applications, providing organizations the ability to process incredible amounts of information in significantly less time. The AMD Stream Processor is the first hardware of its kind dedicated to addressing stream computing problems in the enterprise space.
스트림 컴퓨팅은 일반적으로 3D그래픽 어플리케이션을 위해 매초 수백번, 컴퓨터 모니터에 수백만 픽셀을 계산하고 표현할 수 있는 정교하고 대량의 병렬 프로세서에 영향을 준다.
스트림 연산은 상당히 적은 시간에 믿을 수 없을 만큼 많은 양의 정보를 처리할 수 있는 능력의 조직화를 제공하는 과학적, 상업적인 소비자용 연산 어플리케이션의 넓은 범위를 위해 큰 연산력을 이용한다.
이 AMD Stream Processor는 엔터프라이즈 영역에서 스트림 연상 문제를 주소화하는 전용 하드웨어 중 첫 번째이다.
Basically, the AMD Stream Processor is the same as ATI Radeon X1900XTX besides the concept of General-Purpose Computation on Graphics Processing Unit (GPGPU). Through the 48 4-float vector ALU units in R580, Stream Computing is achieved. Like most of the graphic cards available in the market, this is a PCI Express-based add-in board designed, but its memory densities is higher than any consumer graphics card 좻 a full 1 GB of GDDR3 memory for stream computing applications. The processor also features HPC-optimized memory performance designed to best handle unique stream computing problem sets. In the previous interview to Stan Ossias, ATi…s Senior Product Manager of Desktop Discrete Graphics, he stated R580, in fact, has been optimized for GPGPU, supporting 512 threads running simultaneous. That provides substantial performance gains in areas such as financial analysis, seismic migration analysis, and life sciences research, among others.
기본적으로, AMD Stream Processor는 General-Purpose Computation on Graphics Processing Unit(GPGPU)외에도 ATI Radeon X1900XTX와 같다.
R580의 48 4float vector ALU를 통해, Stream Computing은 이루어 진다.
대부분의 그래픽 카드가 시장에서 구매할 수 있는 것처럼, 이것은 PCI Express 기반에 확장된 보드로 설계되었다. 그러나, 그것의 메모리 밀도는 steam 연산 어플리케이션을 위한 풀 1GB GDDR3 메모리의 어떤 소비자용 그래픽 카드 보다 높다. 또한 이 프로세서는 특이한 스트림 연산 문제를 가장 잘 처리할 수 있도록 설계된 HPC에 최적화된 메모리 퍼포먼스를 특징으로 한다.
이전에 Desktop Discrete Graphics의 수석 부장, Stan Ossias과의 인터뷰에서, 실제로 그는 R580은 동시에 운영하는 512 스레드를 지원하는 GPGPU에 최적화 되어 있다고 진술했다.
이것은 재무분석, 변화가 심한 분석과 같은 분야, 그리고 라이프 사이언스 리서치 등에서 실속있는 퍼포먼스를 얻을 수 있다.
CTM gives developers unfettered access to the native instruction set and memory of the massively parallel computational elements in AMD Stream Processors. Using CTM, stream processors effectively become powerful, programmable open architectures like today…s central processing units (CPUs). By opening up the architecture, CTM provides developers with the low-level, deterministic, and repeatable access to hardware that is necessary to develop essential tools such as compilers, debuggers, math libraries, and application platforms.
CTM은 개발자가 내장 명령 셋과 AMD Stream Processor에 대량의 병렬 연산을 요하는 요소의 메모리에 자유로이 액세스할 수 있게 한다. CTM을 사용하면, 스트림 프로세서는 오늘날의 CPU처럼 오픈 아키텍처에 효과적이다.
아키텍처를 오픈함으로해서, CTM은 개발자에게 컴파일러, 디버거, 수학 라이브러리와 어플리케이션 플랫폼같은 기본적인 툴 개발에 필요한 하드웨어에 낮고, 결정적이며, 반복적으로 액세스 할 수 있도록 해준다.
Through CTM, AMD intends to foster strong growth in the software industry for stream computing by enabling development of the best tools possible, unfettered from performance barriers, coding hurdles, and esoteric dependencies on drivers. Today more than 60 companies and research institutions are taking part in CTM trial programs. These organizations are bringing best-of-breed software to market that enable application developers to have a broader choice in how they develop and deploy their applications. This approach serves a wide range of markets, including high-performance computing and consumer software 좻 two segments with significantly different development needs.
CTM을 통해, AMD는 퍼포먼스 장애, 코딩 장애와 난해한 드라이버의 종속물로부터 쉽고 자유로운 최고의 툴을 개발함으로 스트림 연산을 위해 소프트웨어 산업의 강력한 성잔을 촉진할 의도이다.
요즘 60개 이상의 회사와 리서치 협회들이 CTM 시험 프로그램에 참여하고 있다.
이 조직들은 그들의 어플리케이션을 개발하고 전개할 방법에 대해 넓은 선택을 가지기 위해 어플리케이션 개발자가 이용하는 시장에 최상의 소프트웨어를 가져오고 있다.
이 접근은 상당히 다른 개발의 필요의 두 부분인 높은 퍼포먼스 연산과 소비자용 소프트웨어를 포함한 시장의 넓은 범위에 제공한다.
Leading hardware platform providers, including GraphStream Inc., PANTA Systems, and Rackable Systems, also introduced new stream servers to the market today. Stream servers make use of the new AMD Stream Processor to deliver enterprise-class performance for the HPC and enterprise markets in industry standard form factors. The AMD Stream Processor also includes broad operating system support for server implementations; full-service, enterprise-class technical support; and a limited three-year warranty. The AMD Stream Processor is available now from distributors.
GraphStream INC.를 포함해 하드웨어 플랫폼 공급업체인 PANTA System과 Rackable System도 새로운 Stream 서버를 오늘 시장에 소개했다. Stream 서버는 HPC를 위해 엔터프라이즈급 퍼포먼스를 전하는 새로운 AMD Stream Processor를 사용하며, 엔터프라이즈는 산업표준을 따르는 시장에서 도매상들로부터 판매된다.
또한 AMD Stream Processor는 서버 완성을 위한 broad operating system 지원을 포함한다.; 풀-서비스, 엔터프라이즈급 기술 지원; 그리고, 3년의 워렌티를 가진다.
이 AMD Stream Processor는 배급업자들로부터 지금 이용할 수 있다.
While GPGPU is becoming widely use in different applications, Vincent Lee, Intel…s Regional Sales Manager of South China, said GPGPU will not replace CPU even in future; GPGPU only give acceleration to specific application. Perry Deng, NVIDIA…s Senior Technology Marketing Manager, said NVIDIA…s G80 has been ready for GPGPU. By its 128 Streaming Processors, in total, G80 can provide 520 gigaflops computing power. (AMD Stream Processor: 375 gigaflops; Intel Core 2 Duio E6700: 48 gigaflopos) More than 1000 threads are allowed to run in G80 simultaneously, and this is called GigaThread technology which will further be implemented in Heterogeneous Computing.
GPGPU는 다른 어플리케이션에서 폭넓게 사용되기 때문에, Intel의 중국 남부의 지역판매 책임자인 Vincent Lee는 GPGPU가 미래에는 CPU조차도 대체할 것이라고 말했다.; GPGPU만 특정 어플리케이션에서 가속을 줄 수 있다.
NVIDIA의 수석 기술 마키텡 책임자인 Perry Deng은 NVIDIA의 G80은 GPGPU를 위한 준비가 되어 있다고 말했다.
그것의 128 스트리밍 프로세서에 의해, 전반적으로, G80은 520 기가플롭 연산력을 제공할 수 있다.
(AMD Stream Processor: 375 기가플롭; Intel Core 2 Duo E6700: 48 기가플롭)
1000 쓰레드 이상은 G80에서 동시작동이 허용되며, 이것은 이질적인(잡다한) 연산을 할 GigaThread 기술이라 불리운다.
그림 1. AMD Stream Processor…s Banner
그림 2. AMD Stream Processor…s Specification
그림 3. Close To Metal (CTM) Vs Traditional 3D Application Architecture
출처 및 저작권 : HKEPC
기사 원문 보기
세계 최초의 GPGPU : AMD Stream Processor 는 R580인가?
At the Supercomputing 2006 show today, AMD introduced the world…s first dedicated stream processor designed to meet the specific hardware demands of high-performance computing (HPC) applications. Engineered specifically for compute-only systems such as workstations and servers, the AMD Stream Processor makes use of AMD…s new thin hardware interface called Close To Metal (CTM) to drive substantial performance gains in areas such as financial analysis, seismic migration analysis, and life sciences research, among others.
오늘 Supercomputing 2006 쇼에서, AMD는 세계 최초의 HPC 어플리케이션의 특별 하드웨어를 요구에 응하기 위해 설계된 dedicated stream processor를 소개했다. 워크스테이션이나 서버같은 연산위주의 시스템에 특별히 처리된 AMD Stream Processor는 재무분석, 변화가 심한 분석과 같은 분야, 그리고 라이프 사이언스 리서치 등에서 실속있는 퍼포먼스를 얻을 수 있는 Close To Metal(CTM)이라 불려지는 새로운 얇은 하드웨어 인터페이스를 사용한다.
Stream computing leverages sophisticated massively parallel processors generally used to calculate and render millions of pixels onto computer monitors, hundreds of times each second for 3D graphics applications. Stream computing harnesses that tremendous processing power for a wide range of scientific, business and consumer computing applications, providing organizations the ability to process incredible amounts of information in significantly less time. The AMD Stream Processor is the first hardware of its kind dedicated to addressing stream computing problems in the enterprise space.
스트림 컴퓨팅은 일반적으로 3D그래픽 어플리케이션을 위해 매초 수백번, 컴퓨터 모니터에 수백만 픽셀을 계산하고 표현할 수 있는 정교하고 대량의 병렬 프로세서에 영향을 준다.
스트림 연산은 상당히 적은 시간에 믿을 수 없을 만큼 많은 양의 정보를 처리할 수 있는 능력의 조직화를 제공하는 과학적, 상업적인 소비자용 연산 어플리케이션의 넓은 범위를 위해 큰 연산력을 이용한다.
이 AMD Stream Processor는 엔터프라이즈 영역에서 스트림 연상 문제를 주소화하는 전용 하드웨어 중 첫 번째이다.
Basically, the AMD Stream Processor is the same as ATI Radeon X1900XTX besides the concept of General-Purpose Computation on Graphics Processing Unit (GPGPU). Through the 48 4-float vector ALU units in R580, Stream Computing is achieved. Like most of the graphic cards available in the market, this is a PCI Express-based add-in board designed, but its memory densities is higher than any consumer graphics card 좻 a full 1 GB of GDDR3 memory for stream computing applications. The processor also features HPC-optimized memory performance designed to best handle unique stream computing problem sets. In the previous interview to Stan Ossias, ATi…s Senior Product Manager of Desktop Discrete Graphics, he stated R580, in fact, has been optimized for GPGPU, supporting 512 threads running simultaneous. That provides substantial performance gains in areas such as financial analysis, seismic migration analysis, and life sciences research, among others.
기본적으로, AMD Stream Processor는 General-Purpose Computation on Graphics Processing Unit(GPGPU)외에도 ATI Radeon X1900XTX와 같다.
R580의 48 4float vector ALU를 통해, Stream Computing은 이루어 진다.
대부분의 그래픽 카드가 시장에서 구매할 수 있는 것처럼, 이것은 PCI Express 기반에 확장된 보드로 설계되었다. 그러나, 그것의 메모리 밀도는 steam 연산 어플리케이션을 위한 풀 1GB GDDR3 메모리의 어떤 소비자용 그래픽 카드 보다 높다. 또한 이 프로세서는 특이한 스트림 연산 문제를 가장 잘 처리할 수 있도록 설계된 HPC에 최적화된 메모리 퍼포먼스를 특징으로 한다.
이전에 Desktop Discrete Graphics의 수석 부장, Stan Ossias과의 인터뷰에서, 실제로 그는 R580은 동시에 운영하는 512 스레드를 지원하는 GPGPU에 최적화 되어 있다고 진술했다.
이것은 재무분석, 변화가 심한 분석과 같은 분야, 그리고 라이프 사이언스 리서치 등에서 실속있는 퍼포먼스를 얻을 수 있다.
CTM gives developers unfettered access to the native instruction set and memory of the massively parallel computational elements in AMD Stream Processors. Using CTM, stream processors effectively become powerful, programmable open architectures like today…s central processing units (CPUs). By opening up the architecture, CTM provides developers with the low-level, deterministic, and repeatable access to hardware that is necessary to develop essential tools such as compilers, debuggers, math libraries, and application platforms.
CTM은 개발자가 내장 명령 셋과 AMD Stream Processor에 대량의 병렬 연산을 요하는 요소의 메모리에 자유로이 액세스할 수 있게 한다. CTM을 사용하면, 스트림 프로세서는 오늘날의 CPU처럼 오픈 아키텍처에 효과적이다.
아키텍처를 오픈함으로해서, CTM은 개발자에게 컴파일러, 디버거, 수학 라이브러리와 어플리케이션 플랫폼같은 기본적인 툴 개발에 필요한 하드웨어에 낮고, 결정적이며, 반복적으로 액세스 할 수 있도록 해준다.
Through CTM, AMD intends to foster strong growth in the software industry for stream computing by enabling development of the best tools possible, unfettered from performance barriers, coding hurdles, and esoteric dependencies on drivers. Today more than 60 companies and research institutions are taking part in CTM trial programs. These organizations are bringing best-of-breed software to market that enable application developers to have a broader choice in how they develop and deploy their applications. This approach serves a wide range of markets, including high-performance computing and consumer software 좻 two segments with significantly different development needs.
CTM을 통해, AMD는 퍼포먼스 장애, 코딩 장애와 난해한 드라이버의 종속물로부터 쉽고 자유로운 최고의 툴을 개발함으로 스트림 연산을 위해 소프트웨어 산업의 강력한 성잔을 촉진할 의도이다.
요즘 60개 이상의 회사와 리서치 협회들이 CTM 시험 프로그램에 참여하고 있다.
이 조직들은 그들의 어플리케이션을 개발하고 전개할 방법에 대해 넓은 선택을 가지기 위해 어플리케이션 개발자가 이용하는 시장에 최상의 소프트웨어를 가져오고 있다.
이 접근은 상당히 다른 개발의 필요의 두 부분인 높은 퍼포먼스 연산과 소비자용 소프트웨어를 포함한 시장의 넓은 범위에 제공한다.
Leading hardware platform providers, including GraphStream Inc., PANTA Systems, and Rackable Systems, also introduced new stream servers to the market today. Stream servers make use of the new AMD Stream Processor to deliver enterprise-class performance for the HPC and enterprise markets in industry standard form factors. The AMD Stream Processor also includes broad operating system support for server implementations; full-service, enterprise-class technical support; and a limited three-year warranty. The AMD Stream Processor is available now from distributors.
GraphStream INC.를 포함해 하드웨어 플랫폼 공급업체인 PANTA System과 Rackable System도 새로운 Stream 서버를 오늘 시장에 소개했다. Stream 서버는 HPC를 위해 엔터프라이즈급 퍼포먼스를 전하는 새로운 AMD Stream Processor를 사용하며, 엔터프라이즈는 산업표준을 따르는 시장에서 도매상들로부터 판매된다.
또한 AMD Stream Processor는 서버 완성을 위한 broad operating system 지원을 포함한다.; 풀-서비스, 엔터프라이즈급 기술 지원; 그리고, 3년의 워렌티를 가진다.
이 AMD Stream Processor는 배급업자들로부터 지금 이용할 수 있다.
While GPGPU is becoming widely use in different applications, Vincent Lee, Intel…s Regional Sales Manager of South China, said GPGPU will not replace CPU even in future; GPGPU only give acceleration to specific application. Perry Deng, NVIDIA…s Senior Technology Marketing Manager, said NVIDIA…s G80 has been ready for GPGPU. By its 128 Streaming Processors, in total, G80 can provide 520 gigaflops computing power. (AMD Stream Processor: 375 gigaflops; Intel Core 2 Duio E6700: 48 gigaflopos) More than 1000 threads are allowed to run in G80 simultaneously, and this is called GigaThread technology which will further be implemented in Heterogeneous Computing.
GPGPU는 다른 어플리케이션에서 폭넓게 사용되기 때문에, Intel의 중국 남부의 지역판매 책임자인 Vincent Lee는 GPGPU가 미래에는 CPU조차도 대체할 것이라고 말했다.; GPGPU만 특정 어플리케이션에서 가속을 줄 수 있다.
NVIDIA의 수석 기술 마키텡 책임자인 Perry Deng은 NVIDIA의 G80은 GPGPU를 위한 준비가 되어 있다고 말했다.
그것의 128 스트리밍 프로세서에 의해, 전반적으로, G80은 520 기가플롭 연산력을 제공할 수 있다.
(AMD Stream Processor: 375 기가플롭; Intel Core 2 Duo E6700: 48 기가플롭)
1000 쓰레드 이상은 G80에서 동시작동이 허용되며, 이것은 이질적인(잡다한) 연산을 할 GigaThread 기술이라 불리운다.
그림 1. AMD Stream Processor…s Banner
그림 2. AMD Stream Processor…s Specification
그림 3. Close To Metal (CTM) Vs Traditional 3D Application Architecture
출처 및 저작권 : HKEPC
기사 원문 보기