Вопросы по теме 'categorical-data'
Изменение данных для полиномиальной регрессии
В настоящее время я изучаю полиномиальную логит-оценку и хочу использовать ее для оценки модели в R с пакетом mlogit . После подробного чтения по этому вопросу стало ясно, что важным шагом в этом процессе является изменение формы данных с помощью...
1517 просмотров
schedule
17.01.2024
Сумма ошибок R не имеет значения для факторов
У меня есть файл rRna_RDP_taxonomy_phylum со следующими данными:
364 "Firmicutes" 39.31
244 "Proteobacteria" 26.35
218 "Actinobacteria" 23.54
65 "Bacteroidetes" 7.02
22 "Fusobacteria" 2.38
6...
134980 просмотров
schedule
03.01.2023
Как мне классифицировать мои данные для процедуры сбора данных?
Я выполняю процедуру интеллектуального анализа данных, используя функцию apriori . Эта функция работает только с категориальными данными, без значений, а только с текстом. Мой набор данных удовлетворяет этим требованиям, так как у меня есть пять...
6604 просмотров
schedule
28.04.2023
Таблица Anova, сравнивающая группы в R, экспортируется в латекс?
В основном я работаю с данными наблюдений, но я читал много экспериментальных научных статей, в которых результаты представлены в виде таблиц дисперсионного анализа, где буквы обозначают значимость различий между группами, а затем p-значения f -stat...
3172 просмотров
schedule
21.03.2023
Есть ли преимущество в упорядочении категориальной переменной?
Мне сказали, что лучше всего упорядочивать категориальные переменные там, где это уместно (например, короткие меньше, чем средние меньше, чем длинные). Мне интересно, в чем конкретное преимущество обработки категориальной переменной как...
1829 просмотров
schedule
16.07.2023
R: Не все уровни категориальных переменных показаны в итоговом выводе моей модели GLM.
У меня есть переменная под названием опыт, которая была закодирована как числовая и содержит 3 значения (1,5,10). Я изменил класс на фактор, используя df$experience<-factor(df$experience) , и он изменился на фактор. Затем я запускаю модель GLM...
1460 просмотров
schedule
25.04.2024
Отказ от категориальных переменных с большим количеством факторов
У меня есть набор данных data с 66 переменными и около 200 000 наблюдений. Снимок структуры данных отображается ниже:
$ f37: Factor w/ 10 levels "","1","10","2",..: 2 4 4 2 4 2 4 2 2 4 ...
$ f38: Factor w/ 3509 levels "","100","1000",..: 1 1...
1448 просмотров
schedule
08.07.2022
Добавить дополнительный уровень к факторам в фрейме данных
У меня есть фрейм данных с числовыми и упорядоченными столбцами факторов. У меня много ценностей NA, поэтому им не присваивается уровень. Я изменил NA на «Нет ответа», но уровни столбцов факторов не содержат этого уровня, поэтому я начал, но я не...
69286 просмотров
schedule
23.04.2022
Как создать категориальную легенду для изображений с квадратными символами легенды?
У меня есть 5 разных значений, и я хотел бы создать легенду? Это непрерывные данные, мне нужны маленькие цветные квадратики! Как добавить легенду в график изображений в Matlab Что-то вот так, но с квадратами, я попытался заменить «линию» на...
781 просмотров
schedule
27.04.2024
Как сохранить все уровни категориальных переменных при разделении фрейма данных в тестовом и обучающем наборе в R
Иногда при разделении фрейма данных с категориальными столбцами на тестовый и обучающий набор обучающий набор не будет содержать все уровни категориальной переменной. Когда вы затем обучите модель и попытаетесь предсказать набор тестов, прогноз не...
1523 просмотров
schedule
11.10.2022
SPSS версии 22: объединение двух или более столбцов
У меня есть два столбца с именами column_a1 и column_a2. Оба категоричны (1: да, 0: нет). Я хочу объединить два столбца и создать новый столбец с именем column_a. т.е. column_a содержит данные как из column_a1, так и из column_a2. Пожалуйста...
216 просмотров
schedule
23.06.2023
Получение нежелательного порядка при сортировке категориальных данных в кадре данных pandas
При сортировке столбцов в кадре данных pandas, которые содержат текст (и, следовательно, имеют тип данных «объект»), работает синтаксис df.sort и сортирует apple, orange, banana в правильном порядке. Однако, если я преобразую столбец фруктов в...
4288 просмотров
schedule
11.03.2023
R Отменить фиктивные переменные
У меня есть набор данных, в котором набор категориальных переменных был преобразован в фиктивные переменные (все используемые классы, НЕ n-1), а некоторые нет. Я пытаюсь перекодировать их в один столбец.
Например
Q1.1 Q1.2 Q1.3 Q1.NA...
1858 просмотров
schedule
19.04.2024
Тепловая карта с категориальными переменными и филогенетическим деревом в R
:)
У меня есть вопрос, на который личным поиском не нашел ответа. Я хотел бы создать тепловую карту с категориальными переменными (немного похожую на эту: тепловая карта -подобный сюжет, но для категориальных переменных ), и я хотел бы добавить...
2578 просмотров
schedule
14.02.2022
Изменение непрерывных диапазонов на категориальные в R
Я пытался преобразовать некоторые непрерывные целые числа в категориальные диапазоны, но произошло что-то, чего я не понял. Хоть я и исправил, чтобы получить то, что хочу, я до сих пор не понимаю, почему это произошло.
Переменная представляет...
2708 просмотров
schedule
24.05.2022
Регрессия дает ошибку по одной из входных переменных, контрасты могут применяться только к факторам с 2 или более уровнями [дубликаты]
Я запускаю логит-регрессию в R с большим количеством входных переменных.
newlogit <- glm(install. ~ SIZES + GROSSCONSUMPTION.... +
NETTCONSUMPTION..... + NETTGENERATION....... +
GROSSGENERATION.... + Variable....
1525 просмотров
schedule
25.11.2022
Проблемы с бинарным one-hot (one-of-K) кодированием в python
Двоичное горячее (также известное как one-of-K) кодирование заключается в создании одного двоичного столбца для каждого отдельного значения категориальной переменной. Например, если есть столбец цвета (категориальная переменная), который принимает...
1905 просмотров
schedule
25.11.2022
Как создать категориальную переменную на основе числовой переменной
Мой DataFrame имеет один столбец:
import pandas as pd
list=[1,1,4,5,6,6,30,20,80,90]
df=pd.DataFrame({'col1':list})
Как я могу добавить еще один столбец «col2», который будет содержать категориальную информацию со ссылкой на col1:
if col1...
20428 просмотров
schedule
27.05.2023
Как передать категориальные функции моделированию линейной регрессии в PySpark MLlib?
Я работал над Linear Regression моделированием в PySpark и сомневаюсь, что смогу его переоценить. Данные, которые у меня есть, имеют categorical features . Я просмотрел документацию по PySpark , и пример для Linear Regression показывает...
2386 просмотров
schedule
12.03.2024
R присвоить уровни факторной переменной
Мне дали таблицу Excel, подобную этой:
datos <- data.frame(op= 1:4, var1= c(4, 2, 3, 2))
Теперь есть другие таблицы с ключами для op и var1 , которые являются категориальными переменными. Предположим, что после загрузки они становятся:...
1992 просмотров
schedule
07.02.2023