Подготовьте файл csv для интеллектуального анализа процессов

надеюсь у тебя все хорошо ! Я следил за учебными пособиями по интеллектуальному анализу процессов с использованием «PM4PY», но обнаружил трудности в файле csv, в моем файле csv у меня есть следующие столбцы: «id», «status», «mailID», «date».... ( «статус» такой же, как «активность», которая содержит некоторые конкретные варианты)

мой файл csv содержит много данных.

чтобы следовать учебнику по интеллектуальному анализу процессов, я должен иметь в своих столбцах что-то вроде «case: concept: name» ... но я не знаю, как я могу это сделать


person marc-stupid    schedule 04.07.2020    source источник


Ответы (2)


В вашем случае я предполагаю, что «id» будет таким же, как идентификатор случая в обычной терминологии интеллектуального анализа процессов. Точно так же «статус» соответствует идентификатору действия, а «дата» соответствует отметке времени.

Лучший вариант — сначала прочитать кадр данных pandas, прежде чем передавать его в PM4Py.

Для подробного понимания того, как это сделать, вот пример ниже. Поскольку вы не упомянули все столбцы, которые есть в вашем CSV-файле, давайте предположим, что в настоящее время у вас есть только ['id', 'status', 'date'] в качестве списка столбцов. Следующий код можно адаптировать к любому количеству имеющихся у вас столбцов (добавив их в список с именем cols):

import pandas as pd
from pm4py.objects.conversion.log import converter as log_converter

path = '' # Enter path to the csv file
data = pd.read_csv(path)
cols = ['case:concept:name','concept:name','time:timestamp']
data.columns = cols
data['time:timestamp'] = pd.to_datetime(data['time:timestamp'])
data['concept:name'] = data['concept:name'].astype(str)

log = log_converter.apply(data, variant=log_converter.Variants.TO_EVENT_LOG)

Здесь мы изменили имена столбцов и их типы данных в соответствии с требованиями пакета PM4Py. Преобразуйте этот кадр данных в журнал событий, используя функцию log_converter. Теперь вы можете выполнять свои обычные задачи анализа процессов для этого объекта журнала событий. Например, если вы хотите создать график Directly-Follows из журнала событий вы можете использовать следующую строку кода:

from pm4py.algo.discovery.dfg import algorithm as dfg_algorithm

dfg = dfg_algorithm.apply(log)
person Ishwar Venugopal    schedule 28.01.2021

сначала вам нужно импортировать файл csv с помощью pandas, затем преобразовать в объект журнала событий, наконец, вы можете использовать его в pm4py.

ссылка: https://pm4py.fit.fraunhofer.de/documentation

person Paladino    schedule 12.09.2020