Статьи по теме fuzzy-comparison

Вопросы по теме 'fuzzy-comparison'

Улучшение алгоритма нечеткого сопоставления в Python

Задача : возьмите два текстовых файла и выведите 100% совпадений и 75% совпадений. Решение : import difflib import csv # Imports and parses the files fileA = open("H:/comm.names.txt", 'r') try: setA = fileA.readlines() finally:...

1366 просмотров

11.04.2023

Нечеткое сравнение в Ruby / Rails

Искал хорошие варианты нечеткого сравнения в Rails. По сути, у меня есть набор строк, которые я хотел бы сравнить с некоторыми строками в моей базе данных, и я хотел бы получить ближайшую, если применимо. В этом конкретном случае меня не так...

3470 просмотров

ruby ruby-on-rails fuzzy-comparison

17.02.2024

Необычное поведение Jaro Distance в JellyFish

Я пытаюсь использовать Jellyfish для работы с нечеткими строками. Я заметил странное поведение алгоритма jaro_distance. Ранее у меня были некоторые проблемы с алгоритмом damerau_levenshtein_distance, которые оказались ошибкой в коде, которую...

546 просмотров

python-2.7 string fuzzy-comparison

24.02.2023

Нечеткий - NYSIIS Python 3

fuzzy.c:1635:5: ошибка: слишком мало аргументов для функции «PyCode_New». Я обновляюсь с Python 2.7 до 3.2. Я получаю сообщение об ошибке в c-компиляции нечеткой библиотеки (которая, по-видимому, несовместима с Python 3). Какие-либо предложения?...

280 просмотров

python-3.x fuzzy-search fuzzy-comparison

22.08.2023

Нечеткая логика для больших наборов данных с использованием Python

Моя команда застряла в запуске алгоритма нечеткой логики на двух больших наборах данных. Первое (подмножество) составляет около 180 тыс. Строк, содержащих имена, адреса и электронные письма людей, которых нам нужно сопоставить во втором...

4665 просмотров

python fuzzy-comparison fuzzywuzzy record-linkage fuzzy-logic

25.09.2023

Нечеткое сравнение двух столбцов

У меня есть CSV-файл с условиями поиска (числа и текст), который я хотел бы сравнить со списком других условий (числа и текст), чтобы определить, есть ли совпадения или потенциальные совпадения. Затем я хотел бы, чтобы все результаты были записаны в...

2679 просмотров

python fuzzy-comparison fuzzywuzzy fuzzy-logic

30.06.2023

Как нечетко сопоставить только соседние ячейки?

У меня есть строка из 10 000 имен в двух соответствующих столбцах, по 10 000 в каждом. Каждая ячейка в столбце A соответствует соседней ячейке в столбце B. Я хочу провести нечеткое сопоставление и получить оценку совместимости для всех из них только...

480 просмотров

excel excel-formula fuzzy-search fuzzy-comparison

27.01.2024

Сравнение нечетких графов

Существуют ли известные алгоритмы или решения для сравнения графиков (функций)? Допустим, у нас есть два графика, у них есть некоторые одинаковые площади, но могут быть некоторые несоответствия в количестве точек или значениях точек. Например, на...

74 просмотров

graph algorithm fuzzy-search fuzzy-comparison

21.07.2022

Соединение/сопоставление фреймов данных в R

У меня есть два фрейма данных. Первый состоит из двух столбцов: x — глубина воды, y — температура на каждой глубине. Во втором тоже два столбца, x тоже глубина воды, но на другой глубине по сравнению с первой таблицей. Второй столбец z...

53 просмотров

r join left-join fuzzy-comparison

26.01.2023

Разделение данных по переменной для ускорения нечеткого соответствия с использованием stringdist

Я основываюсь на ответе , предоставленном предыдущий вопрос о нечетком сопоставлении с использованием stringdist. У меня есть два больших набора данных (~ 30 тыс. строк) с длинными строками (названия потребительских товаров), которые я хочу...

559 просмотров

r optimization fuzzy-comparison

06.04.2023

Нечеткое совпадение строк в одном столбце и создание нового фрейма данных с помощью fuzzywuzzy

У меня есть следующий кадр данных: df = pd.DataFrame( {'id': [1, 2, 3, 4, 5, 6], 'fruits': ['apple', 'apples', 'orange', 'apple tree', 'oranges', 'mango'] }) id fruits 0 1 apple 1 2 apples 2 3 orange 3...

1916 просмотров

python pandas fuzzy-comparison fuzzywuzzy

09.11.2022

Нечеткое сопоставление со строками, содержащими числа

Я пытаюсь приблизить совпадения между эталонной и целевой строками. Я пробовал adist и stringdist в R с различными доступными расстояниями. Хотя алгоритмы хорошо справляются со строками, содержащими только буквы алфавита, они не могут...

432 просмотров

r fuzzy-comparison stringdist fuzzy-logic

18.07.2023

Вопросы по теме 'fuzzy-comparison'

Похожие вопросы