Drools очень медленно обрабатывает большие данные

Мы интегрировали Drools с Talend ETL. Drools требует много времени для обработки записей, насчитывающих до полумиллиона и более. Как мы можем увеличить скорость обработки drools. Я знаком с кодированием drools, но я не знаю, как drools работает внутри. пожалуйста, помогите мне с этой проблемой. Было бы очень здорово. Я не уверен, дал ли я правильные теги, т.е. есть ли у них правильный ответ. Но, пожалуйста, помогите мне в этом, если это необходимо.


person user2409470    schedule 21.02.2014    source источник
comment
Подробнее, пожалуйста. Как долго это много времени. Используется ли для вставки - сколько времени на n фактов? Это стрельба по правилам - опять же, сколько раз за сколько? Сколько правил? Насколько они сложны? Это для начала...   -  person laune    schedule 21.02.2014
comment
Предполагая, что тег drools-planner правильный, вполне нормально, что обработка займет некоторое время, и вы сами определяете, сколько времени должно пройти, чтобы предоставить разумный ответ. Этот вопрос действительно касается Drools Planner (теперь он называется OptaPlanner) или Drools Expert?   -  person Steve    schedule 24.02.2014
comment
мы использовали около 30 правил с несколькими условиями. мы исходим из того, что Drools берет одну запись и сравнивает ее с записями, а затем выдает результат для каждой из них. Таким образом, время, необходимое для обработки 1 миллиона записей, составляет около 4 часов. Мы не можем обрабатывать записи партиями. Я имею в виду в больших количествах и сокращения времени на обработку. Пожалуйста, помогите мне в этом вопросе. Спасибо за ответ.   -  person user2409470    schedule 10.03.2014


Ответы (1)


Типичные проблемы включают:

  • Not using == constraints, to allow for indexing.
    • Make sure you have the field on the left, and the variable on the right.
  • Не иметь в первую очередь самые строгие шаблоны и ограничения
  • Не следить за тем, чтобы ваши правила были написаны, чтобы избежать больших перекрестных произведений
  • Use of multiple accumulates per rule, or sub networks.
    • The last issue is improved in Drools 6.0.
person Mark Proctor    schedule 23.02.2014