Я новичок в сетевом анализе, поэтому заранее извиняюсь за любые несоответствия или ошибки в моем вопросе.
У меня есть список ребер, где каждое ребро представляет собой упоминание в Твиттере (от userID до userID) в рамках определенного разговора (convoID).
Тот же список ребер содержит информацию о том, к какому диалогу принадлежит любое данное ребро, а также вес этого ребра, выраженный целым числом, представляющим количество раз, когда любое ребро встречалось в одном и том же диалоге (например, пользователь 1 ответил пользователю 2 3 раза в диалоге 144; пользователь 1 ответил пользователю 2 8 раз в диалоге 12 и так далее).
Вот как выглядят данные:
edgelist <- data.frame(my_convo = c(5, 5, 5, 5, 6, 6),
from = c("user2", "user3", "user4", "user5",
"user2", "user1"),
to = c("user1", "user1", "user1", "user1",
"user1", "user2"),
num_replies = c(1,1,1,1,10,8))
Я хотел бы создать сеть для каждого разговора, но в моем наборе данных сейчас тысячи разговоров. Я пытался создать полную сеть и использовать my_convo в качестве фактора группировки, чтобы каждую сеть можно было анализировать независимо, но поскольку одно и то же преимущество может иметь место в разных разговорах (см. Пользователь2 и пользователь1, встречающиеся в разговорах 5 и 6 выше), они появляются как дубликаты.
Я хотел бы избежать создания сетевого объекта для каждого разговора из-за большого объема данных, но я не знаю, как создать сетевой объект, включая my_conversation в качестве группирующей переменной. Это вообще возможно?