Публикации по теме 'hierarchical-clustering'


ИЕРАРХИЧЕСКИЙ КЛАСТЕРНЫЙ АНАЛИЗ И ДЕНДОГРАММА
В этой статье я хотел бы поговорить с вами об иерархическом кластерном анализе. Во-первых, давайте обсудим, что такое иерархическая кластеризация и для чего она используется. ЧТО ТАКОЕ ИЕРАРХИЧЕСКАЯ КЛАСТЕРИЗАЦИЯ? Иерархический кластерный анализ, который является одним из методов интеллектуального анализа данных, представляет собой процесс разделения данных на кластеры и простого сбора похожих элементов в одной группе. Этот метод максимизирует сходство внутри кластера и минимизирует..

Вопросы по теме 'hierarchical-clustering'

Как узнать о групповой информации в кластерном анализе (иерархическом)?
У меня проблема с группой в кластерном анализе (иерархический кластер). Например, это дендрограмма полной связи набора данных Iris . После того, как я использую > table(cutree(hc, 3), iris$Species) Это вывод : setosa...
3925 просмотров

Альтернативный способ Python найти дендрограмму
У меня есть данные размером 8000x100. Мне нужно сгруппировать эти 8000 элементов. Меня больше интересует порядок этих предметов. Я мог бы получить желаемый результат из приведенного выше кода для небольших данных, но для более высокого размера я...
1902 просмотров

Иерархическая кластеризация микромассивов и PCA с помощью python
Я пытаюсь проанализировать данные микрочипов, используя иерархическую кластеризацию столбцов микрочипов (результаты отдельных реплик микрочипов) и PCA. Я новичок в питоне. У меня есть Python 2.7.3, biopyhton, numpy, matplotlib и networkx....
986 просмотров

Кластеры на основе расстояния
Вот моя проблема: у меня есть список деревень. Для каждой деревни я вычислил расстояние пути между ними и подготовил матрицу расстояний. Теперь я хочу определить кластеры деревень, которые находятся близко друг к другу. Я использую Python 2.7 и...
224 просмотров

Как создать кластеры документов с помощью иерархической кластеризации
Я пытаюсь сгруппировать документы на основе их сходства, идея состоит в том, чтобы сопоставить похожие слова в двух документах и ​​разделить это число на общее количество слов в обоих документах. Каждое значение хранится в двумерном массиве:...
197 просмотров

О возвращаемом значении и использовании scipy.cluster.hierarchy.fcluster
Предположим, у нас есть четыре наблюдения и возвращаемое значение scipy.cluster.hierarchy.linkage: [[ 1. 3. 0.08 2. ] [ 2. 4. 0.28813559 3. ] [ 0. 5. 1. 4....
2531 просмотров
schedule 20.08.2022

Обнаружение углов в двумерных векторных данных
Я пытаюсь обнаружить углы (координаты x/y) в двумерных векторах рассеяния данных. Данные взяты с лазерного дальномера, и наша текущая платформа использует Matlab (хотя автономные программы/библиотеки являются опцией, но код Nav/Control находится в...
2158 просмотров

Кластерный анализ в R: как получить детерминированные результаты от pvclust?
pvclust отлично подходит для кластерного анализа в R. Однако при выполнении его как части пакетной операции получение разных результатов для одних и тех же данных раздражает. Очевидно, существует множество «правильных» кластеризаций одних и тех же...
379 просмотров

Дендрограмма резки с высочайшим уровнем чистоты
Я пытаюсь создать программу, которая кластеризует документы, используя иерархическую агломеративную кластеризацию, и вывод программы зависит от разрезания дендрограммы на таком уровне, чтобы получить максимальную чистоту. Итак, вот алгоритм, над...
482 просмотров

Агломеративная кластеризация Python
Я новичок в кластеризации (используя sklearn в Python). Я пытаюсь импортировать агломеративную кластеризацию, используя: from sklearn.cluster import AgglomerativeClustering но я получаю следующую ошибку: from sklearn.cluster import...
1018 просмотров
schedule 31.12.2023

Как сделать иерархическую кластеризацию для большой матрицы подобия
У меня есть около 50 тыс. наборов данных, значение которых может варьироваться от 0 до 10. Я хочу применить HAC для кластеризации этих данных. Но чтобы применить HAC, мне нужно подготовить матрицу подобия N*N. Для N = 50 K эта матрица была бы...
844 просмотров

Ошибка в трехуровневой вложенной линейной модели в Rstan
Я пытаюсь запустить трехуровневую вложенную линейную модель в Rstan, но постоянно получаю сообщение об ошибке. Я черпал вдохновение из этой трехуровневой вложенной модели:...
453 просмотров
schedule 07.10.2022

Когда прекратить агломеративную иерархическую кластеризацию - критерии остановки
Я кодирую в своем приложении каждую функцию, поэтому я не использую инструменты, которые делают все за вас. Искал решение, когда отказаться от агломеративной иерархической кластеризации Как создать кластер? Я закодировал приложение на C #...
1792 просмотров

Кластеризация документов Weka: идентификатор документа не отображается в выходных данных
Мне нужно просканировать Википедию, чтобы получить HTML-страницы стран. Я успешно прополз. Теперь, чтобы построить кластеры, мне нужно использовать KMeans. Я использую Weka для этого. Я использовал этот код для преобразования своего каталога в...
265 просмотров
schedule 03.02.2024

Раскрасьте галочки на дендрограмме, чтобы они соответствовали цветам кластера.
Как я могу индивидуально раскрасить метки дендрограммы, чтобы они соответствовали цветам кластеров в MATLAB? Вот пример желаемого вывода, сгенерированного с использованием кода в моем ответе ниже (обратите внимание, что метки представляют собой...
734 просмотров

Для иерархической кластеризации, как найти центр в каждом кластере в R
Я знаю, как найти центр в каждом кластере в кластеризации K-средних. Но для иерархической кластеризации я не уверен, как это сделать в R. Вот мои коды: сначала я создал свою матрицу расстояний, используя DTW Distance, и ввел ее в R:...
1515 просмотров
schedule 06.08.2022

r: получение окончательных результатов кластера в таблице / фрейме данных при использовании hclust ()
Я провожу иерархический кластерный анализ, используя hclust() Код выглядит так: hc <- hclust(dist(USArrests), "ave") Теперь все, что мне нужно, это получить таблицу (или что-то эквивалентное), которая содержит все кластеры и...
2485 просмотров

Извлечь цвет кластера из вывода dedextend::circlize_dendrogram()
Я пытаюсь извлечь цвета, используемые при кластеризации circlize_dendrogram . Вот примеры кодов: library(magrittr) library(dendextend) cols <- c("#009000", "#FF033E", "#CB410B", "#3B444B", "#007FFF") dend <- iris[1:40,-5] %>% dist...
760 просмотров
schedule 12.11.2023

Scipy дендрограмма с именами
Я использую пример дендрограммы из этот пост в моей работе, но я также хотел бы отслеживать, какая строка / столбец от какой части данных. Я отредактировал код с записями имен данных как names , как показано ниже, и хотел бы распечатать имена...
1347 просмотров

выявление кластеров взаимодействия в igraph
У меня есть сеть взаимодействия, и я использовал следующий код, чтобы создать матрицу смежности, а затем вычислить несходство между узлами сети, а затем сгруппировать их для формирования модулей: ADJ1=abs(adjacent-mat)^6 dissADJ1<-1-ADJ1...
2439 просмотров