Публикации по теме 'hierarchical-clustering'
ИЕРАРХИЧЕСКИЙ КЛАСТЕРНЫЙ АНАЛИЗ И ДЕНДОГРАММА
В этой статье я хотел бы поговорить с вами об иерархическом кластерном анализе. Во-первых, давайте обсудим, что такое иерархическая кластеризация и для чего она используется.
ЧТО ТАКОЕ ИЕРАРХИЧЕСКАЯ КЛАСТЕРИЗАЦИЯ?
Иерархический кластерный анализ, который является одним из методов интеллектуального анализа данных, представляет собой процесс разделения данных на кластеры и простого сбора похожих элементов в одной группе. Этот метод максимизирует сходство внутри кластера и минимизирует..
Вопросы по теме 'hierarchical-clustering'
Как узнать о групповой информации в кластерном анализе (иерархическом)?
У меня проблема с группой в кластерном анализе (иерархический кластер). Например, это дендрограмма полной связи набора данных Iris .
После того, как я использую
> table(cutree(hc, 3), iris$Species)
Это вывод :
setosa...
3925 просмотров
schedule
09.08.2023
Альтернативный способ Python найти дендрограмму
У меня есть данные размером 8000x100. Мне нужно сгруппировать эти 8000 элементов. Меня больше интересует порядок этих предметов. Я мог бы получить желаемый результат из приведенного выше кода для небольших данных, но для более высокого размера я...
1902 просмотров
schedule
01.04.2023
Иерархическая кластеризация микромассивов и PCA с помощью python
Я пытаюсь проанализировать данные микрочипов, используя иерархическую кластеризацию столбцов микрочипов (результаты отдельных реплик микрочипов) и PCA.
Я новичок в питоне. У меня есть Python 2.7.3, biopyhton, numpy, matplotlib и networkx....
986 просмотров
schedule
09.02.2023
Кластеры на основе расстояния
Вот моя проблема: у меня есть список деревень. Для каждой деревни я вычислил расстояние пути между ними и подготовил матрицу расстояний. Теперь я хочу определить кластеры деревень, которые находятся близко друг к другу.
Я использую Python 2.7 и...
224 просмотров
schedule
30.03.2022
Как создать кластеры документов с помощью иерархической кластеризации
Я пытаюсь сгруппировать документы на основе их сходства, идея состоит в том, чтобы сопоставить похожие слова в двух документах и разделить это число на общее количество слов в обоих документах. Каждое значение хранится в двумерном массиве:...
197 просмотров
schedule
15.11.2022
О возвращаемом значении и использовании scipy.cluster.hierarchy.fcluster
Предположим, у нас есть четыре наблюдения и возвращаемое значение scipy.cluster.hierarchy.linkage:
[[ 1. 3. 0.08 2. ]
[ 2. 4. 0.28813559 3. ]
[ 0. 5. 1. 4....
2531 просмотров
schedule
20.08.2022
Обнаружение углов в двумерных векторных данных
Я пытаюсь обнаружить углы (координаты x/y) в двумерных векторах рассеяния данных.
Данные взяты с лазерного дальномера, и наша текущая платформа использует Matlab (хотя автономные программы/библиотеки являются опцией, но код Nav/Control находится в...
2158 просмотров
schedule
29.12.2023
Кластерный анализ в R: как получить детерминированные результаты от pvclust?
pvclust отлично подходит для кластерного анализа в R. Однако при выполнении его как части пакетной операции получение разных результатов для одних и тех же данных раздражает. Очевидно, существует множество «правильных» кластеризаций одних и тех же...
379 просмотров
schedule
12.07.2023
Дендрограмма резки с высочайшим уровнем чистоты
Я пытаюсь создать программу, которая кластеризует документы, используя иерархическую агломеративную кластеризацию, и вывод программы зависит от разрезания дендрограммы на таком уровне, чтобы получить максимальную чистоту.
Итак, вот алгоритм, над...
482 просмотров
schedule
02.03.2024
Агломеративная кластеризация Python
Я новичок в кластеризации (используя sklearn в Python). Я пытаюсь импортировать агломеративную кластеризацию, используя:
from sklearn.cluster import AgglomerativeClustering
но я получаю следующую ошибку:
from sklearn.cluster import...
1018 просмотров
schedule
31.12.2023
Как сделать иерархическую кластеризацию для большой матрицы подобия
У меня есть около 50 тыс. наборов данных, значение которых может варьироваться от 0 до 10. Я хочу применить HAC для кластеризации этих данных. Но чтобы применить HAC, мне нужно подготовить матрицу подобия N*N.
Для N = 50 K эта матрица была бы...
844 просмотров
schedule
14.11.2022
Ошибка в трехуровневой вложенной линейной модели в Rstan
Я пытаюсь запустить трехуровневую вложенную линейную модель в Rstan, но постоянно получаю сообщение об ошибке.
Я черпал вдохновение из этой трехуровневой вложенной модели:...
453 просмотров
schedule
07.10.2022
Когда прекратить агломеративную иерархическую кластеризацию - критерии остановки
Я кодирую в своем приложении каждую функцию, поэтому я не использую инструменты, которые делают все за вас.
Искал решение, когда отказаться от агломеративной иерархической кластеризации
Как создать кластер?
Я закодировал приложение на C #...
1792 просмотров
schedule
29.04.2023
Кластеризация документов Weka: идентификатор документа не отображается в выходных данных
Мне нужно просканировать Википедию, чтобы получить HTML-страницы стран. Я успешно прополз. Теперь, чтобы построить кластеры, мне нужно использовать KMeans. Я использую Weka для этого.
Я использовал этот код для преобразования своего каталога в...
265 просмотров
schedule
03.02.2024
Раскрасьте галочки на дендрограмме, чтобы они соответствовали цветам кластера.
Как я могу индивидуально раскрасить метки дендрограммы, чтобы они соответствовали цветам кластеров в MATLAB?
Вот пример желаемого вывода, сгенерированного с использованием кода в моем ответе ниже (обратите внимание, что метки представляют собой...
734 просмотров
schedule
23.05.2022
Для иерархической кластеризации, как найти центр в каждом кластере в R
Я знаю, как найти центр в каждом кластере в кластеризации K-средних. Но для иерархической кластеризации я не уверен, как это сделать в R. Вот мои коды: сначала я создал свою матрицу расстояний, используя DTW Distance, и ввел ее в R:...
1515 просмотров
schedule
06.08.2022
r: получение окончательных результатов кластера в таблице / фрейме данных при использовании hclust ()
Я провожу иерархический кластерный анализ, используя hclust()
Код выглядит так:
hc <- hclust(dist(USArrests), "ave")
Теперь все, что мне нужно, это получить таблицу (или что-то эквивалентное), которая содержит все кластеры и...
2485 просмотров
schedule
08.12.2022
Извлечь цвет кластера из вывода dedextend::circlize_dendrogram()
Я пытаюсь извлечь цвета, используемые при кластеризации circlize_dendrogram . Вот примеры кодов:
library(magrittr)
library(dendextend)
cols <- c("#009000", "#FF033E", "#CB410B", "#3B444B", "#007FFF")
dend <- iris[1:40,-5] %>% dist...
760 просмотров
schedule
12.11.2023
Scipy дендрограмма с именами
Я использую пример дендрограммы из этот пост в моей работе, но я также хотел бы отслеживать, какая строка / столбец от какой части данных.
Я отредактировал код с записями имен данных как names , как показано ниже, и хотел бы распечатать имена...
1347 просмотров
schedule
05.05.2022
выявление кластеров взаимодействия в igraph
У меня есть сеть взаимодействия, и я использовал следующий код, чтобы создать матрицу смежности, а затем вычислить несходство между узлами сети, а затем сгруппировать их для формирования модулей:
ADJ1=abs(adjacent-mat)^6
dissADJ1<-1-ADJ1...
2439 просмотров
schedule
29.04.2022