Вопросы по теме 'fuzzy-comparison'

Улучшение алгоритма нечеткого сопоставления в Python
Задача : возьмите два текстовых файла и выведите 100% совпадений и 75% совпадений. Решение : import difflib import csv # Imports and parses the files fileA = open("H:/comm.names.txt", 'r') try: setA = fileA.readlines() finally:...
1366 просмотров

Нечеткое сравнение в Ruby / Rails
Искал хорошие варианты нечеткого сравнения в Rails. По сути, у меня есть набор строк, которые я хотел бы сравнить с некоторыми строками в моей базе данных, и я хотел бы получить ближайшую, если применимо. В этом конкретном случае меня не так...
3470 просмотров
schedule 17.02.2024

Необычное поведение Jaro Distance в JellyFish
Я пытаюсь использовать Jellyfish для работы с нечеткими строками. Я заметил странное поведение алгоритма jaro_distance. Ранее у меня были некоторые проблемы с алгоритмом damerau_levenshtein_distance, которые оказались ошибкой в ​​​​коде, которую...
546 просмотров
schedule 24.02.2023

Нечеткий - NYSIIS Python 3
fuzzy.c:1635:5: ошибка: слишком мало аргументов для функции «PyCode_New». Я обновляюсь с Python 2.7 до 3.2. Я получаю сообщение об ошибке в c-компиляции нечеткой библиотеки (которая, по-видимому, несовместима с Python 3). Какие-либо предложения?...
280 просмотров

Нечеткая логика для больших наборов данных с использованием Python
Моя команда застряла в запуске алгоритма нечеткой логики на двух больших наборах данных. Первое (подмножество) составляет около 180 тыс. Строк, содержащих имена, адреса и электронные письма людей, которых нам нужно сопоставить во втором...
4665 просмотров

Нечеткое сравнение двух столбцов
У меня есть CSV-файл с условиями поиска (числа и текст), который я хотел бы сравнить со списком других условий (числа и текст), чтобы определить, есть ли совпадения или потенциальные совпадения. Затем я хотел бы, чтобы все результаты были записаны в...
2679 просмотров

Как нечетко сопоставить только соседние ячейки?
У меня есть строка из 10 000 имен в двух соответствующих столбцах, по 10 000 в каждом. Каждая ячейка в столбце A соответствует соседней ячейке в столбце B. Я хочу провести нечеткое сопоставление и получить оценку совместимости для всех из них только...
480 просмотров

Сравнение нечетких графов
Существуют ли известные алгоритмы или решения для сравнения графиков (функций)? Допустим, у нас есть два графика, у них есть некоторые одинаковые площади, но могут быть некоторые несоответствия в количестве точек или значениях точек. Например, на...
74 просмотров

Соединение/сопоставление фреймов данных в R
У меня есть два фрейма данных. Первый состоит из двух столбцов: x — глубина воды, y — температура на каждой глубине. Во втором тоже два столбца, x тоже глубина воды, но на другой глубине по сравнению с первой таблицей. Второй столбец z...
53 просмотров
schedule 26.01.2023

Разделение данных по переменной для ускорения нечеткого соответствия с использованием stringdist
Я основываюсь на ответе , предоставленном предыдущий вопрос о нечетком сопоставлении с использованием stringdist. У меня есть два больших набора данных (~ 30 тыс. строк) с длинными строками (названия потребительских товаров), которые я хочу...
559 просмотров
schedule 06.04.2023

Нечеткое совпадение строк в одном столбце и создание нового фрейма данных с помощью fuzzywuzzy
У меня есть следующий кадр данных: df = pd.DataFrame( {'id': [1, 2, 3, 4, 5, 6], 'fruits': ['apple', 'apples', 'orange', 'apple tree', 'oranges', 'mango'] }) id fruits 0 1 apple 1 2 apples 2 3 orange 3...
1916 просмотров

Нечеткое сопоставление со строками, содержащими числа
Я пытаюсь приблизить совпадения между эталонной и целевой строками. Я пробовал adist и stringdist в R с различными доступными расстояниями. Хотя алгоритмы хорошо справляются со строками, содержащими только буквы алфавита, они не могут...
432 просмотров