У меня есть python
функция, которую мне нужно многократно вызывать с разными значениями аргументов. Я хотел бы выполнить это параллельно на нескольких процессорах. Я успешно сделал это с помощью модуля joblib
. Теперь я хотел бы сделать свой код доступным в виде веб-приложения, использующего flask
, работающего на AWS EC2 instance
с несколькими процессорами. Вот игрушечный пример того, что я пробовал:
from flask import Flask
from joblib import Parallel, delayed
from time import sleep
def myfunc(x):
sleep(5)
return x
application = Flask(__name__)
@application.route('/', methods = ['GET'])
def getresult():
out = Parallel(n_jobs=-1, verbose=10)(delayed(myfunc)(i) for i in range(5))
return str(sum(out))
if __name__ == "__main__":
application.debug = True
application.run()
Проблема в том, что этот код не выполняется параллельно на нескольких процессорах. Я получаю следующее предупреждение и вывод (прошедшее время подтверждает, что он не работает параллельно):
/Library/anaconda/lib/python3.6/site-packages/joblib/parallel.py:547:
UserWarning: Multiprocessing-backed parallel loops cannot be nested below
threads, setting n_jobs=1
**self._backend_args)
[Parallel(n_jobs=-1)]: Done 1 out of 1 | elapsed: 5.0s remaining: 0.0s
[Parallel(n_jobs=-1)]: Done 2 out of 2 | elapsed: 10.0s remaining: 0.0s
[Parallel(n_jobs=-1)]: Done 3 out of 3 | elapsed: 15.0s remaining: 0.0s
[Parallel(n_jobs=-1)]: Done 4 out of 4 | elapsed: 20.0s remaining: 0.0s
[Parallel(n_jobs=-1)]: Done 5 out of 5 | elapsed: 25.0s remaining: 0.0s
[Parallel(n_jobs=-1)]: Done 5 out of 5 | elapsed: 25.0s finished
Какие-либо предложения?