Я изучал интерактивные графики в R. Я знаю, что есть несколько пакетов для создания интерактивных графиков, особенно графиков рассеяния, но я ищу определенную функциональность.
Например, этот график. Можно навести указатель мыши на кнопки, чтобы получить небольшую числовую сводку данных за точкой, то есть всплывающую подсказку.
Когда у вас есть набор данных с большим количеством переменных, часто полезно исследовать / визуализировать оценки из PCA или выполнять многомерное масштабирование (MDS). Но если построить график данных в интерактивном режиме, как в приведенном выше примере, сводка при наведении курсора на точку дает не так много информации, то есть просто длинный список чисел. Было бы лучше иметь возможность создавать настраиваемый график для отображения, а не просто отображать числовые значения.
Итак, мой вопрос:
Возможно ли (в некоторых из пакетов, доступных в R) генерировать визуальную сводку при наведении курсора на точку на диаграмме рассеяния. Это может быть гистограмма или просто определенная пользователем функция построения графика, которая принимает одну строку из data.frame в качестве аргумента.
Если это возможно, это очень поможет быстро понять результаты MDS.
РЕДАКТИРОВАТЬ:
Вот код для выполнения MDS с набором данных радужной оболочки:
library(ggplot2)
library(plotly)
d <- dist(iris[,-5]) # euclidean distances between the rows
fit <- cmdscale(d,eig=TRUE, k=2) # k is the number of dim
# Put coordinates and original data in one data.frame
x <- fit$points[,1]
y <- fit$points[,2]
pDat <- data.frame(x=x,y=y)
pDat <- cbind(pDat,iris)
p <- ggplot(pDat) + geom_point(aes(x,y))
ggplotly(p)
Во-первых, теперь всплывающая подсказка включает только координаты x, y. Я хотел бы, чтобы всплывающая подсказка содержала значения исходных 4 переменных. Затем вместо исходных 4 переменных за точкой данных я хотел бы отобразить всплывающую подсказку в виде гистограммы. MDS сохраняет расстояние между точками данных, поэтому можно будет постепенно наводить курсор мыши и видеть гистограмму, почти непрерывно меняющуюся, потому что расстояния сохраняются. В моем случае использования у меня есть 30 переменных за каждой точкой, поэтому сводка гистограммы дает больше визуальной информации, чем 30 числовых значений.