Вопросы по теме 'categorical-data'

Изменение данных для полиномиальной регрессии
В настоящее время я изучаю полиномиальную логит-оценку и хочу использовать ее для оценки модели в R с пакетом mlogit . После подробного чтения по этому вопросу стало ясно, что важным шагом в этом процессе является изменение формы данных с помощью...
1517 просмотров
schedule 17.01.2024

Сумма ошибок R не имеет значения для факторов
У меня есть файл rRna_RDP_taxonomy_phylum со следующими данными: 364 "Firmicutes" 39.31 244 "Proteobacteria" 26.35 218 "Actinobacteria" 23.54 65 "Bacteroidetes" 7.02 22 "Fusobacteria" 2.38 6...
134980 просмотров
schedule 03.01.2023

Как мне классифицировать мои данные для процедуры сбора данных?
Я выполняю процедуру интеллектуального анализа данных, используя функцию apriori . Эта функция работает только с категориальными данными, без значений, а только с текстом. Мой набор данных удовлетворяет этим требованиям, так как у меня есть пять...
6604 просмотров
schedule 28.04.2023

Таблица Anova, сравнивающая группы в R, экспортируется в латекс?
В основном я работаю с данными наблюдений, но я читал много экспериментальных научных статей, в которых результаты представлены в виде таблиц дисперсионного анализа, где буквы обозначают значимость различий между группами, а затем p-значения f -stat...
3172 просмотров
schedule 21.03.2023

Есть ли преимущество в упорядочении категориальной переменной?
Мне сказали, что лучше всего упорядочивать категориальные переменные там, где это уместно (например, короткие меньше, чем средние меньше, чем длинные). Мне интересно, в чем конкретное преимущество обработки категориальной переменной как...
1829 просмотров
schedule 16.07.2023

R: Не все уровни категориальных переменных показаны в итоговом выводе моей модели GLM.
У меня есть переменная под названием опыт, которая была закодирована как числовая и содержит 3 значения (1,5,10). Я изменил класс на фактор, используя df$experience<-factor(df$experience) , и он изменился на фактор. Затем я запускаю модель GLM...
1460 просмотров
schedule 25.04.2024

Отказ от категориальных переменных с большим количеством факторов
У меня есть набор данных data с 66 переменными и около 200 000 наблюдений. Снимок структуры данных отображается ниже: $ f37: Factor w/ 10 levels "","1","10","2",..: 2 4 4 2 4 2 4 2 2 4 ... $ f38: Factor w/ 3509 levels "","100","1000",..: 1 1...
1448 просмотров
schedule 08.07.2022

Добавить дополнительный уровень к факторам в фрейме данных
У меня есть фрейм данных с числовыми и упорядоченными столбцами факторов. У меня много ценностей NA, поэтому им не присваивается уровень. Я изменил NA на «Нет ответа», но уровни столбцов факторов не содержат этого уровня, поэтому я начал, но я не...
69286 просмотров
schedule 23.04.2022

Как создать категориальную легенду для изображений с квадратными символами легенды?
У меня есть 5 разных значений, и я хотел бы создать легенду? Это непрерывные данные, мне нужны маленькие цветные квадратики! Как добавить легенду в график изображений в Matlab Что-то вот так, но с квадратами, я попытался заменить «линию» на...
781 просмотров
schedule 27.04.2024

Как сохранить все уровни категориальных переменных при разделении фрейма данных в тестовом и обучающем наборе в R
Иногда при разделении фрейма данных с категориальными столбцами на тестовый и обучающий набор обучающий набор не будет содержать все уровни категориальной переменной. Когда вы затем обучите модель и попытаетесь предсказать набор тестов, прогноз не...
1523 просмотров
schedule 11.10.2022

SPSS версии 22: объединение двух или более столбцов
У меня есть два столбца с именами column_a1 и column_a2. Оба категоричны (1: да, 0: нет). Я хочу объединить два столбца и создать новый столбец с именем column_a. т.е. column_a содержит данные как из column_a1, так и из column_a2. Пожалуйста...
216 просмотров
schedule 23.06.2023

Получение нежелательного порядка при сортировке категориальных данных в кадре данных pandas
При сортировке столбцов в кадре данных pandas, которые содержат текст (и, следовательно, имеют тип данных «объект»), работает синтаксис df.sort и сортирует apple, orange, banana в правильном порядке. Однако, если я преобразую столбец фруктов в...
4288 просмотров
schedule 11.03.2023

R Отменить фиктивные переменные
У меня есть набор данных, в котором набор категориальных переменных был преобразован в фиктивные переменные (все используемые классы, НЕ n-1), а некоторые нет. Я пытаюсь перекодировать их в один столбец. Например Q1.1 Q1.2 Q1.3 Q1.NA...
1858 просмотров
schedule 19.04.2024

Тепловая карта с категориальными переменными и филогенетическим деревом в R
:) У меня есть вопрос, на который личным поиском не нашел ответа. Я хотел бы создать тепловую карту с категориальными переменными (немного похожую на эту: тепловая карта -подобный сюжет, но для категориальных переменных ), и я хотел бы добавить...
2578 просмотров
schedule 14.02.2022

Изменение непрерывных диапазонов на категориальные в R
Я пытался преобразовать некоторые непрерывные целые числа в категориальные диапазоны, но произошло что-то, чего я не понял. Хоть я и исправил, чтобы получить то, что хочу, я до сих пор не понимаю, почему это произошло. Переменная представляет...
2708 просмотров
schedule 24.05.2022

Регрессия дает ошибку по одной из входных переменных, контрасты могут применяться только к факторам с 2 или более уровнями [дубликаты]
Я запускаю логит-регрессию в R с большим количеством входных переменных. newlogit <- glm(install. ~ SIZES + GROSSCONSUMPTION.... + NETTCONSUMPTION..... + NETTGENERATION....... + GROSSGENERATION.... + Variable....
1525 просмотров
schedule 25.11.2022

Проблемы с бинарным one-hot (one-of-K) кодированием в python
Двоичное горячее (также известное как one-of-K) кодирование заключается в создании одного двоичного столбца для каждого отдельного значения категориальной переменной. Например, если есть столбец цвета (категориальная переменная), который принимает...
1905 просмотров

Как создать категориальную переменную на основе числовой переменной
Мой DataFrame имеет один столбец: import pandas as pd list=[1,1,4,5,6,6,30,20,80,90] df=pd.DataFrame({'col1':list}) Как я могу добавить еще один столбец «col2», который будет содержать категориальную информацию со ссылкой на col1: if col1...
20428 просмотров
schedule 27.05.2023

Как передать категориальные функции моделированию линейной регрессии в PySpark MLlib?
Я работал над Linear Regression моделированием в PySpark и сомневаюсь, что смогу его переоценить. Данные, которые у меня есть, имеют categorical features . Я просмотрел документацию по PySpark , и пример для Linear Regression показывает...
2386 просмотров

R присвоить уровни факторной переменной
Мне дали таблицу Excel, подобную этой: datos <- data.frame(op= 1:4, var1= c(4, 2, 3, 2)) Теперь есть другие таблицы с ключами для op и var1 , которые являются категориальными переменными. Предположим, что после загрузки они становятся:...
1992 просмотров
schedule 07.02.2023