В качестве побочного проекта я хочу реализовать Скрытую марковскую модель для своей видеокарты NVidia, чтобы она могла выполняться быстро и с использованием многих ядер.
Я смотрю на алгоритм Forward-Backward и мне интересно, что я могу сделать здесь параллельно? Например, если вы посмотрите на прямую часть алгоритма, матричные умножения можно разделить, чтобы выполнять их параллельно, но можно ли каким-либо образом распараллелить итерационные части алгоритма, зависящие от предыдущего шага? Можно ли здесь применить какой-то математический трюк?
Спасибо,
mj
http://en.wikipedia.org/wiki/Forward%E2%80%93backward_algorithm#Example