БАЛАНСИРОВКА ВЫЧИСЛИТЕЛЬНОЙ НАГРУЗКИ ДЛЯ МНОГОЯДЕРНЫХ КЛАСТЕРОВ
Покупка
Основная коллекция
Тематика:
Математическое программное обеспечение
Издательство:
Удмуртский Государственный университет
Автор:
Новиков А.
Год издания: 2008
Кол-во страниц: 2
Дополнительно
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
ВЕСТНИК УДМУРТСКОГО УНИВЕРСИТЕТА КОМПЬЮТЕРНЫЕ НАУКИ 2008. Вып. 2 УДК 519.687.1 c ⃝À. Ê. Íîâèêîâ БАЛАНСИРОВКА ВЫЧИСЛИТЕЛЬНОЙ НАГРУЗКИ ДЛЯ МНОГОЯДЕРНЫХ КЛАСТЕРОВ 1 На примере конечно-элементного приложения рассматривается балансировка вычислительной нагрузки для многоядерных кластеров. Балансировка основывается на многоуровневом отображении расчетных данных и учитывает, что латентность и пропускная способность средств коммуникации между ядрами процессоров, между процессорами и между вычислительными узлами существенно отличаются. Ключевые слова: вычислительный кластер, многоядерность, балансировка вычислительной нагрузки, метод конечных элементов. Современные многопроцессорные вычислительные системы строятся на основе многоядерных процессоров и многопроцессорных вычислительных узлов. Существенное различие в латентности и пропускной способности коммуникационных средств при обмене данными между процессами, размещенными на разных ядрах и разных вычислительных узлах, подтверждается результатами теста производительности межпроцессорных обменов [1], проведенного на МВС100k (Межведомственный суперкомпьютерный центр РАН, г. Москва). Латентность при однонаправленном обмене средствами MPI внутри вычислительного узла составляет 0.3-0.6 мкс, между вычислительными узлами 3-4 мкс. Пропускная способность внутри вычислительного узла в 1.5-2 раза выше. Применительно к параллельному конечно-элементному приложению учесть многоядерность вычислительной системы можно разделяя расчетную сетку на подобласти одним из следующих способов. 1. Выбрать число подобластей сетки равным числу ядер процессоров. 2. Выполнить многоуровневое разделение сетки, создав дерево данных с корнем исходной сеткой и числом листьев равным количеству ядер процессоров. В обоих случаях выделение вычислительных процессов и обмен осуществимы средствами стандарта MPI-1. 3. Выбрать число подобластей сетки равным количеству вычислительных узлов. Процессы внутри конечно-элементного приложения порождать 1Ðàáîòà âûïîëíåíà ïðè ôèíàíñîâîé ïîääåðæêå ÐÔÔÈ (ãðàíò 06-07-89015).