У меня есть некоторые данные, набор данных включает такие функции, как идентификатор устройства (int), телефон (int), имя (строка), id устройства и т. д. Но все данные не имеют метки. моя задача - получить вероятность того, что человек использует несколько идентификаторов или несколько устройств. Понятия не имею, как это сделать, у кого-нибудь есть идеи?
для ясности, вот пример. набор данных похож
name id phone device_id
Jason 123 12345 12341231 ......
James 1345 312312 312312312 ......
Jason 123 53523 23115124 ......
Итак, мы можем найти, что у Джейсона 2 телефонных номера,
как мне узнать вероятность, используя метод машинного обучения или метод глубокого обучения?