Суперкомпьютеры


Слайды и текст этой презентации

Слайд №1
История вычислительной техники – Суперкомпьютеры
План:
Этапы развития суперкомпьютеров
1.1 Суперкомпьютеры XX века.
1.2 Современный этап массово-параллельные вычисления на базе микропроцессоров.
1.3 Вопросы дальнейшего развития суперкомпьютеров.
2. Суперкомпьютеры
2.1 Параллельно-векторные суперкомпьютеры
2.2 Суперкомпьютеры
2.3Суперкомпьютеры стали в миллион раз быстрее за 50 лет

Слайд №2
1.1 Суперкомпьютеры XX века
Динамика развития электронной вычислительной техники от её зарождения и до наших дней охарактеризована в ряде публикаций. Термин «суперкомпьютер» стал употребляться в период развития транзисторных вычислительных машин (это 2-е поколение вычислительной техники) применительно к десятку, затем сотне, а на сегодня – к тысяче наиболее мощных вычислительных установок мира (подразумевая тот или иной критерий оценки производительности).
Слайд №3
В создании наиболее мощных вычислительных систем в своё время лидировала корпорация Control Data (США), серийно выпускавшая с 1965 г. машину CDC -6600 производительностью 3 млн. операций в секунду, а затем и более мощные. Впоследствии это направление работ выделилось как фирма Cray, выпускавшая одноименные суперкомпьютеры (см. ниже). Корпорация IBM, лидирующая по объёму выпускаемой компьютерной продукции, также выпускала весьма мощные установки в составе семейств машин 2-го и 3-го поколений (соответственно, IBM 709х и System 360).
После 1975 г. большое внимание уделялось векторно-конвейерным суперкомпьютерам, построенным на схемотехнике с невысоким уровнем интеграции, но с высокой тактовой частотой – 100 МГц и более (американские системы Cray -1, -2, их разновидности и некоторые японские системы).
Слайд №4
1.2 Современный этап: массово-параллельные вычисления на базе микропроцессоров
В 2000 г. корпорация IBM ввела в действие суперкомпьютер ASCI White с пиковой производительностью 12 Tflops (6 тыс. процессоров), в 2004 — 2005 гг. поэтапно ввела в действие систему Blue Gene / L с пиковой производительностью 360 Tflops (65 тыс. двухпроцессорных чипов), а в 2007 г. производительность этой системы за счёт наращивания объёма аппаратуры была повышена до 0,6 Petaflops .
Установки названных типов выпущены также и с меньшим числом процессоров; таким образом, IBM закрепила свою доминирующую роль во всём спектре производительности компьютеров
Слайд №5
В 2004 г. создана в России и передана для эксплуатации в Минск 576-процессорная система К-1000 с пиковой производительностью 2,5 Tflops . В 2004 — 2006 гг. в МСЦ поэтапно введена 1148-процессорная система МВС-15000 с пиковой производительностью 10 Tflops . Крупным событием стал ввод в действие в начале 2007 г. в Томском университете системы Cyberia с пиковой производительностью 12 Tflops , содержащей 566 двухъядерных процессоров. Названные системы на момент их ввода в действие входили в первую сотню позиций списка Top 500. Они позволили решать новые сложные задачи с большим объёмом вычислений.
В Москве и различных регионах страны эксплуатируются также кластеры с меньшим числом процессоров (в различных модификациях по типам процессоров, объемам памяти, межпроцессорным связям, конструктивному оформлению, составу программного обеспечения). Осуществляется поэтапно-прогрессирующее наращивание производительности и совершенствование технико-экономических показателей действующих и вновь создаваемых систем. В 2007 — 2008 гг. введены в действие мощные кластеры в МГУ и ряде других вузов России.
Слайд №6
1.3 Вопросы дальнейшего развития суперкомпьютеров
Ведущие компьютерные фирмы сориентированы на выпуск систем производительностью 10 15 оп./с (квадриллион оп./с. — petaflops ) и более. Реализуются крупные программы работ этого направления В середине 2008 г. введен в действие кластер Roadrunner , корпорации IBM, с пиковой производительностью 1,3 Pflops, построенный на базе микропроцессоров Cell. Но ещё в 2006 г. производительность, эквивалентная уровню 10 15 оп./с , была реализована в японской системе MDGRAPE-3, процессоры и общая структура которой ориентированы на решение задач молекулярной динамики (в т. ч., исследование структур белковых молекул и др.)
Слайд №7
Pост производительности суперкомпьютеров взаимосвязан с расширением, обновлением и усложнением применений, разработками новых математических моделей, развитием соответствующих вычислительных методов. При этом необходимо распараллеливать обработку данных в алгоритмах и программах решаемых вычислительных
задач, учитывая специфику структурного параллелизма, присутствующего в том или ином виде на всех уровнях систем – от внутрипроцессорного до общесистемно-сетевого с выходом на глобальные Grid -технологии. Умелое использование и перманентное развитие программного обеспечения (как системного, так и прикладного) существенно определяет эффективность применений суперкомпьютеров и остается сложной и широкой проблемой.
Слайд №8
2.1 Параллельно-векторные суперкомпьютеры
Большое разнообразие архитектур вычислительных систем породило естественное желание ввести для них какую-то классификацию. Эта классификация должна была однозначно относить ту или иную вычислительную систему к некоему классу, который, в свою очередь, должен достаточно полно ее характеризовать. Таких попыток предпринималось множество. Одна из первых классификаций, ссылки на которую чаще всего встречаются в литературе, была предложена М. Флинном в конце 60-х годов прошлого века. Она базируется на понятиях двух потоков: команд и данных. На основе числа этих потоков выделяется четыре класса архитектур: SISD (Single Instruction Single Data) — единственный поток команд и единственный поток данных, SIMD (Single Instruction Multiple Data) — единственный поток команд и
множественные потоки данных, MISD (Multiple Instruction Single Date) — множественные потоки команд и единственный поток данных и, наконец, MIMD (Multiple Instruction Multiple Date) — множественные потоки команд и данных.С момента появления первых вычислительных устройств их создатели пытались усовершенствовать свои творения, в частности, повысить их эффективность за счет увеличения производительности или изобрести новые устройства, более совершенные. Суперкомпьютеры работают очень быстро не только благодаря самой современной элементной базе, но и за счет принципиальных решений, заложенных в их архитектуру. Основную роль здесь играет принцип параллельной обработки данных, воплощающий идею одновременного (параллельного) выполнения нескольких действий.
Слайд №9
Суперкомпьютеры NEC SX

Типичным примером PVP-решений могут служить системы SX, которые создает подразделение корпорации NEC — HNSX Supercomputers ( http://www.sw.nec.co.jp ). Развитие PVP-архитектуры продолжается, а суперкомпьютеры на ее основе в ряде случаев существенно опережают конкурентов. NEC имеет давние традиции производства больших универсальных ЭВМ (достаточно упомянуть выпускавшиеся в 80-х годах мэйнфреймы ACOS).
Примерно в то же время появились и первые суперкомпьютеры семейства SX. Процессоры в SX-1 имели пиковую производительность 570 MFLOPS. Во второй половине 80-х были разработаны NEC SX-2 со временем цикла 6 нс; пиковая производительность старшей модели SX-2 составила уже 1,3 GFLOPS. В 1989 г. была выпущена NEC SX-3 с пиковой производительностью центрального процессора около 5 GFLOPS, в состав которой входило до четырех процессоров.

Начинка суперкомпьютера SX-4A.—?——?

Слайд №10
Серия SX-5

Эти суперкомпьютеры предназначены для крупномасштабных параллельных вычислений, что обеспечивается набором параллельно работающих узлов, каждый из которых, в свою очередь, представляет собой полноценный векторно-конвейерный SMP-суперкомпьютер.
Серия SX-8

Суперкомпьютер SX-8.

Осенью прошлого года NEC представила новую серию суперкомпьютеров SX-8, одна из моделей которой, согласно утверждению компании, стала самым быстрым в мире на сегодняшний день векторным суперкомпьютером, обладая быстродействием до 65 TFLOPS. SX-8 существует в трех версиях — две с одним узлом (табл. 2) и одна система, состоящая из большего количества узлов (табл. 3). Результат в 65 TFLOPS — наивысший показатель, который могла бы показать последняя. Максимальное число узлов в ней — 512, каждый из которых имеет по восемь процессоров (т. е. общее число процессоров достигает 4096). Максимальный объем адресуемой памяти составляет 64 Тбайт, максимальная скорость обмена данными с памятью — 262 Тбайт/с.

Слайд №11
2.2 Суперкомпьютеры
В ноябре прошлого года была опубликована 18-я редакция списка 500 мощнейших компьютеров мира — Top500. Лидером списка по-прежнему остается корпорация IBM ( http://www.ibm.com ), которой принадлежит 32% установленных систем и 37% от общей производительности. Интересной новостью стало появление Hewlett-Packard на втором месте по количеству систем (30%). При этом, поскольку все эти системы относительно невелики, то их суммарная производительность составляет всего 15% от всего списка. Ожидается, что после слияния с Compaq обновленная компания займет доминирующее положение в этом списке. Далее по количеству компьютеров в списке идут SGI, Cray и Sun Microsystems.
Слайд №12
Суперкомпьютеры Intel
До недавнего времени одним из самых быстродействующих компьютеров был Intel ASCI Red — детище ускоренной стратегической компьютерной инициативы ASCI (Accelerated Strategic Computing Initiative). В этой программе участвуют три крупнейшие национальные лаборатории США (Ливерморская, Лос-Аламосская и Sandia). Построенный по заказу Министерства энергетики США в 1997 г ., ASCI Red объединяет 9152 процессора Pentium Pro, имеет 600 Гбайт суммарной оперативной памяти и общую производительность 1800 млрд операций в секунду.
Слайд №13
Суперкомпьютеры IBM
Когда на компьютерном рынке появились универсальные системы с масштабируемой параллельной архитектурой SP (Scalable POWER parallel) корпорации IBM они достаточно быстро завоевали популярность. Сегодня подобные системы работают в различных прикладных областях — таких, как вычислительная химия, анализ аварий, проектирование электронных схем, сейсмический анализ, моделирование водохранилищ, поддержка систем принятия решений, анализ данных и оперативная обработка транзакций. Успех систем SP определяется прежде всего их универсальностью, а также гибкостью архитектуры, базирующейся на модели распределенной. Вообще говоря, суперкомпьютер SP — это масштабируемая массивно-параллельная вычислительная система общего назначения, представляющая собой набор базовых станций RS/6000, соединенных высокопроизводительным коммутатором. Действительно, кому не известен, например, суперкомпьютер Deep Blue, который сумел обыграть в шахматы Гарри Каспарова? А ведь одна из его модификаций состоит из 32 узлов (IBM RS/6000 SP), базирующихся на 256 процессорах P2SC (Power Two Super Chip). памяти с передачей сообщений.
Слайд №14
2.3 Суперкомпьютеры стали в миллион раз быстрее за 50 лет
Затем он приступил к проектированию параллельного CDC 6600, способного работать с 60-разрядными словами. Из-за разногласий со своим партнером Крей покинул CDC и в 1972 г. основал фирму Cray Research. К тому времени в НАСА был установлен 64-разрядный ILLIAC IV корпорации Burroughs, показывавший 20 млн. операций в секунду. Он успешно действовал до 1981 г.

Суперкомпьютер Cray-1 ——————-?
История суперкомпьютеров неразрывно связана с именем Сеймора Крея (Seymour Cray, 1925–1996), известного прежде всего как основателя компании Cray, лидера американского рынка суперкомпьютеров. Первый транзисторный суперкомпьютер CDC 1604 Крей создал в 1958 г., возглавляя компанию Control Data Corporation (CDC), основанную им с Уильямсом Норрисом годом раньше.

Слайд №15
В перспективе в GRAPE-решение будет включено 20 тыс. процессоров, а обойдется оно всего в 10 млн. долл. Правда, еще в 1996 г. создатели GRAPE выдвигали оптимистичный лозунг: “Даешь петафлопс к 2000 г!”.

Суперкомпьютер Grape-6 ———?
Петафлопсный рубеж (тысяча триллионов операций с плавающей запятой в секунду) Cray обещает преодолеть к концу десятилетия. Схожие сроки сулят и японцы. В Токио в рамках соответствующего проекта GRAPE (http://grape.astron.s.u-tokyo.ac.jp/grape/) готовится модель GRAPE-6. Она объединяет 12 кластеров и 2048 процессоров и показывает производительность 2,889 Тфлопс (с потенциальными возможностями 64 Тфлопс).