Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Программирование и базы данных (http://forum.oszone.net/forumdisplay.php?f=21)
-   -   Распараллелить программу на ~20 компьютеров Pascal (http://forum.oszone.net/showthread.php?t=268135)

Pavluha 15-09-2013 18:50 2218366

Распараллелить программу на ~20 компьютеров Pascal
 
Здравствуйте. Имеются в наличии ~20 компьютеров приблизительно одинаковой мощности, соединённые между собой в локальную сеть 100 мбит/с фул дуплекс. К примеру, я написал программу на Free Pacal, которая выполняет очень сложную задачу, но при этом эту задачу можно распараллелить (этот код для упрощения можно вынести в отдельную функцию). Вот принцип параллелизации:

1. Выбираем главный компьютер, который будет только обрабатывать результаты и выполнять код, который нельзя распараллелить;
2. Главный компьютер отсылает остальным задание (саму функцию и данные для её работы, при этом данные распределяются между всеми компьютерами);
3. Рабочие компьютеры отправляют результаты на главный компьютер;
4. Программа на главном компьютере продолжает работу.

Теперь вопрос: как реализовать.

opel431 15-09-2013 22:09 2218472

Напоминает обычную работу с распределенной обработкой данных (SQL сервер + клиент-приложение).

AMDBulldozer 15-09-2013 22:20 2218477

Pavluha, не совсем понятен вопрос. Пишите, грубо говоря, две программы. Отдельно клиентскую часть, отдельно серверную. Потом, если захотите, сможете объединить эти части в одном исполняемом файле. Вас интересует как серверная часть будет запускать клиентские? К примеру, по ssh. Для простоты можно исходить из того, что программа установлена на все компьютеры сети. Как организовать взаимодействие? При помощи AF_INET гнезд (sockets).
Или я неправильно понял, что именно Вас интересует?

Pavluha 15-09-2013 23:23 2218510

всё вы правильно поняли. было бы очень хорошо, чтобы распараллелизация приблизитель выглядела так:

Код:

program prog;
uses paralell_mod;
var i:integer;
a,b:array[1..100000]of integer;

function myfunc(x,y:integer):integer;
begin
 myfunc:=x*y;
end;
begin
for i:=1 to 100000 do begin a[i]:=random(100); b[i]:=random(1000) end;

for i:=1 to 100000 do
 parallel(myfunc,a,b);
end.


lxa85 15-09-2013 23:52 2218522

Pavluha, самое простое, что приходит на ум "как реализовать ?" Через сетевой протокол. В любом случае это клиент-серверное приложение, и для его работы необходимо "клиент-серверное "окружение. Т.е. набор необходимых процедур и механизмов, которые проведут инициализацию каналов связи, зарегистрируются на сервере и будут вести прием/передачу данных.
В теории ...
Возникает вопрос о необходимости "передачи функции". Что под этим подразумевается? Я думаю проще вынести все необходимые функции на сторону клиента и с серверам просто указывать, какую функцию расчета следует запустить, и какие данные подать на вход.

К вопросу архитектуры проекта.
По логике вещей, хорошо бы сделать "асинхронный ввод/вывод информации". Т.е. запускать нить (?) на инициализацию клиента, одновременно с этим подготавливая пакет данных для второго и т.к.
Как это делать и как достигается такая производительность я честно сказать не знаю.
Поэтому сервер - в первую очередь диспетчер задач, и искать информацию надо в этой области.

----
Приведенный пример не корректен.

Pavluha 16-09-2013 16:48 2218850

Цитата:

Цитата lxa85
Приведенный пример не корректен. »

да, пример я очень плохой привёл. тогда попробую объяснить по-другому: у меня, допустим, имеется некая большая программа со сложным кодом. и мне надо её распараллелить, при этом как можно быстрее. принимая во внимание задержку (пинг) в локальной сети, надо отправлять данные компьютерам большими кусками (чтобы всё-таки распараллелизация имела успех).

Цитата:

Цитата lxa85
Pavluha, самое простое, что приходит на ум "как реализовать ?" Через сетевой протокол. В любом случае это клиент-серверное приложение, и для его работы необходимо "клиент-серверное "окружение. Т.е. набор необходимых процедур и механизмов, которые проведут инициализацию каналов связи, зарегистрируются на сервере и будут вести прием/передачу данных. »

абсолютно верно, однако, к сожалению, из всех языков программирования хорошо я знаю только паскаль, а на нём такого рода приложение написать очень трудно. можно попробовать все нужные для работы функции вынести в dll, а её можно и на с++ написать...

Цитата:

Цитата lxa85
Возникает вопрос о необходимости "передачи функции". Что под этим подразумевается? Я думаю проще вынести все необходимые функции на сторону клиента и с серверам просто указывать, какую функцию расчета следует запустить, и какие данные подать на вход. »

если было бы всё так просто, я бы тему эту не создавал. дело в том, что клиент не знает, какую функцию ему нужно запустить (к примеру, написал новую, исправил ошибки и т.п.). не бегать же мне по всем компьютерам с флешкой, чтобы на каждый закинуть нужную функцию.

под этим я подразумеваю вот что: выполняется программа на главном компьютере, как только встречает код (для упрощения функцию, легче реализовать), который нужно распараллелить, она отсылает в нескомпилированном виде всем компьютерам эту функцию (на рабочих компьютерах она скомпилируется клиентской программой) и присылает сразу же массив данных, которые нужно подставить в функцию, чтобы она дала ответ. в это время главный компьютер ждёт, когда хотя бы 1 из компьютеров выполнит этот код и вернёт массив значений, и тогда даёт так сказать "следующую порцию". когда все данные розданы, идёт ожидание ответа от каждого компьютера. когда все ответы получены, главный компьютер анализирует полученные данные и продолжает работу (а рабочим компьютерам говорит "отбой").

как-то так.

Цитата:

Цитата lxa85
К вопросу архитектуры проекта.
По логике вещей, хорошо бы сделать "асинхронный ввод/вывод информации". Т.е. запускать нить (?) на инициализацию клиента, одновременно с этим подготавливая пакет данных для второго и т.к.
Как это делать и как достигается такая производительность я честно сказать не знаю.
Поэтому сервер - в первую очередь диспетчер задач, и искать информацию надо в этой области. »

насчёт асинхронного ввода/вывода:

Код:

while (есть данные для распараллелизации) do
 begin
  for i:=1 to n do {n-число компьютеров}
  if r[i]=0 then работает, ничего ему не давать
    else if r[i]=1 then begin дать задание end
  else if r[i]=2 then begin считать результаты, при возможности дать ещё задание end
  else if r[i]=3 then отправляется решение, ничего не давать
  else begin ошибка при выполнении на уд. компьютере, дать еще раз задание end
 end;

где в массиве r будет содержаться состояния работы программы. тут асинхронной должна быть только функция отправки задания и приёма решений.


Время: 20:02.

Время: 20:02.
© OSzone.net 2001-