Я столкнулся с проблемой, пытаясь создать карту цветов в диаграмме рассеяния. Вот часть моего кода:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import gaussian_kde
f, ax = plt.subplots()
xy = np.vstack([x, y])
xy = xy[~np.isnan(xy)]
z = gaussian_kde(xy)(xy)
idx = z.argsort()
x, y, z = x[idx], y[idx], z[idx]
plt.scatter(x, y, c=z, cmap='Reds', alpha=0.5)
x
и y
являются столбцами в моем фрейме данных panda, и оба они имеют значения NaN
. Я попытался удалить все значения NaN
, выполнив ~np.isnan(xy)
, чтобы получить только фактические значения, поскольку это не позволяло мне принимать infs или NaN, поскольку я считаю, что gaussian_kde()
выдавало эту ошибку. Кроме того, оба столбца не совпадают друг с другом с точки зрения того, где находятся эти значения NaN
, и один столбец содержит больше значений NaN
, чем другой. Оба также имеют одинаковое количество элементов. Когда я запускаю свой код, он просто продолжает работать, и мне приходится его останавливать. Есть идеи, что может быть не так?
gaussian_kde
. Каков типичный размер векторов x и y? - person Liris   schedule 08.11.2019