В пакете aRules в R, как я могу эффективно работать нашли закрытые правила ассоциации? т.е. правила с закрытым набором элементов LHS
Набор элементов закрывается, если добавление любого элемента снижает поддержку.
Пакет предоставляет следующие варианты майнинга:
target: строка символов, указывающая тип добытой ассоциации. Один из
- "частые наборы товаров"
- "максимально частые наборы товаров"
- "закрытые частые наборы товаров"
- "правила" (доступно только для Априори)
- «гиперперые множества» (доступно только для Apriori; см. ссылки для определения ассоциаций • гиперреберные множества)
Кажется, не существует варианта «закрытых правил». Есть два очевидных решения:
Создавайте правила и применяйте фильтр для закрытых наборов элементов
rules = apriori(data, parameter=list(target="rules"))) rules <- rules[is.closed(generatingItemsets(rules))]
Это может быть довольно медленным. Например, для 5k транзакций с 10k элементами aPriori сгенерировал 8M правил за 10 секунд. Фильтр закрытия занял ~ 20 минут, в результате чего было закрыто ~ 3k правил.
- Найдите закрытые частые наборы элементов и примените фильтр для ассоциаций (уверенность, рост и т. Д.)
Еще не реализовано, но похоже на способ достижения чего-то гораздо более простого.
Если кто-то знает о других реализациях (других пакетах R или даже о чем-то вне R), которые могут это делать, указатели будут очень полезны. Например. Библиотека SPMF, похоже, поддерживает его , интересно, есть ли у кого-нибудь опыт его использования