Публикации по теме 'tidyverse'


Классификация с Tidymodels в R
Введение В этой статье я буду использовать фреймворк Tidymodels в R для построения модели классификации на титаническом наборе данных. Инфраструктура Tidymodels позволяет использовать разработку функций, проверку модели, выбор модели и многое другое в элегантном, простом и эффективном стиле Tidyverse. Исследование данных В этой статье я буду использовать титанический набор данных с этого конкурса Kaggle. Обзор данных показан ниже. Наша цель будет состоять в том,..

Вопросы по теме 'tidyverse'

Найдите максимальное / минимальное значение в паре столбцов
Мои данные выглядят так: df <- tribble( ~A, ~B, 0.2, 0.1, 0.2, 0.3, 0.5, 0.1, 0.7, 0.9, 0.8, 0.9, 0.4, 0.2) Как выбрать максимальное / минимальное значение между A и B ? Желаемый результат: A...
4403 просмотров
schedule 02.05.2022

dplyr tidyr для расширения и суммирования определенных столбцов
Я изо всех сил пытаюсь использовать dplyr и tidyr, чтобы принять df в этой форме: myDf <- data.frame(id = c(1,1,1,1,2,2), event = c('a','b','a','b','a','b'), a_property = c(1,NA,2, NA, 3, NA),...
567 просмотров
schedule 11.06.2022

Вывести наблюдение / строку из фрейма данных
Мои данные выглядят так: library(tidyverse) set.seed(1) df <- tibble( id = c("cat", "cat", "mouse", "dog", "fish", "fish", "fish"), value = rnorm(7, 100, sd = 50) ) Как я могу «вытащить» верхнее значение fish , например,...
415 просмотров
schedule 06.06.2023

R: изменить форму фрейма данных, создав столбцы для определенного элемента (контрольная обработка)
Рассмотрим набор данных, показывающий результаты для контрольной и двух экспериментальных обработок для мужчин и женщин вместе с размерами для каждой обработки: library(tidyverse) mydf <- data_frame( treatment =...
81 просмотров
schedule 23.08.2022

Группировка R по комбинации нескольких столбцов
Рассматривая ввод dsam как: structure(list(a = structure(c(3L, 2L, 1L, 3L, 1L, 3L, 1L, 1L, 1L, 1L), .Label = c("A", "B", "C"), class = "factor"), b = c(1, 1, 1, 1, 1, 3, 2, 3, 3, 1), c = structure(c(2L, 1L, 1L, 2L, 1L, 3L, 1L, 1L, 3L, 3L),...
914 просмотров
schedule 01.10.2023

dplyr::group_by() с несколькими переменными, но НЕ пересечением
Когда вы group_by используете несколько переменных, dplyr помогает найти пересечение этих групп. Например, mtcars %>% group_by(cyl, am) %>% summarise(mean(disp)) урожаи Source: local data frame [6 x 3] Groups: cyl [?]...
460 просмотров
schedule 04.07.2023

Столбцы списка в таблицах: Могу ли я связать столбец списка с другим столбцом списка?
Это мой первый пост, поэтому, пожалуйста, извините меня, если я звучу глупо или ответ, который я ищу, уже существует. Моя основная проблема заключается в следующем: я создал таблицу, содержащую 4 столбца (символьный столбец, два столбца данных и...
341 просмотров
schedule 29.11.2023

Создайте последовательность времени, используя R и lubridate
Есть ли эффективный способ сгенерировать вектор временной последовательности с tidyverse и lubridate ? Я знаю, что эти двое могут работать с seq() , если использовать количество дат в качестве интервала. Например, при вводе: seq(today(),...
3324 просмотров
schedule 18.06.2023

Dplyr Grouped Mutate Do альтернатива?
У меня есть ряд учетных записей с уникальными номерами счетов, которые можно сгруппировать по порядковому номеру. Я хотел бы использовать уникальный номер счета в начале каждой последовательности в качестве нового справочного столбца для всей группы....
298 просмотров
schedule 29.03.2022

Создание функции с использованием Forcats и Dplyr для перекодирования нескольких переменных шкалы удовлетворенности
library(dplyr) library(forcats) Ниже приведен простой фрейм данных, содержащий три столбца, которые необходимо перекодировать в три категории - удовлетворено, неудовлетворено, нейтрально....
458 просмотров
schedule 06.08.2023

Как рассчитать проценты в столбчатой ​​диаграмме с накоплением?
Проблема Текущие проценты в полосе рассчитываются с общим объемом данных. Я хочу, чтобы в каждом стеке было полностью 100%. (Решено) Также следует округлить проценты до ближайшего целого числа. (Решено) Изменить : удалить все проценты,...
843 просмотров
schedule 02.12.2023

Измените каждый столбец функцией с двумя параметрами, сгруппированными по другому столбцу.
Следующий набор данных представляет мои ситуации: library(dplyr) df <- data_frame( G1 = rep(1:2, each = 10), G2 = rep(1:10, 2), C1 = rnorm(20), C2 = rnorm(20), C3 = rnorm(20), C4 = rnorm(20) ) Я хочу выполнить следующую...
599 просмотров
schedule 22.07.2022

Как применить несколько функций к сгруппированной таблице с помощью dplyr
У меня есть следующий тибет: df <- structure(list(treatment = c("control", "control", "control", "control", "control", "control", "treated", "treated", "treated", "treated", "treated", "treated"), `0610005C13Rik` = c(5L, 2L, 2L, 5L, 1L, 0L,...
291 просмотров
schedule 16.07.2022

R: объединить две таблицы (таблицы) по * списку * столбцов
Похоже, на это должен быть простой ответ, но я не смог его найти: tib1 <- tibble(x = list(1, 2, 3), y = list(4, 5, 6)) tib1 # A tibble: 3 × 2 x y <list> <list> 1 <dbl [1]> <dbl [1]> 2 <dbl [1]>...
1110 просмотров
schedule 25.08.2023

Как взять подмножества списков в таблице
У меня есть годовые финансовые данные по нескольким акциям. Мне нужно было взорвать его, чтобы получить ежемесячные данные, и благодаря #43990791">ответ на этот вопрос, который я задавал ранее , у меня есть решение, которое включает преобразование...
320 просмотров
schedule 14.07.2023

read_excel не будет обрезать пробелы
Я использую пакет readxl для загрузки файла Excel. По умолчанию он должен удалять пустое пространство, но этого не происходит. Файл можно загрузить непосредственно по ссылке ниже или, альтернативно, его можно загрузить через веб-сайт, где...
2180 просмотров
schedule 01.01.2023

как запускать модели на комбинациях двух переменных и возвращать фрейм данных со значениями p и r-квадрат для каждой модели с помощью tidyverse
Я пытаюсь запускать модели с разными комбинациями переменных. Я хочу иметь фрейм данных с 3 столбцами: переменные, p-значение и r-квадрат для каждой модели. В качестве примера я использую набор данных mtcars. Вот мои коды: c('wt', 'hp', 'qsec')...
296 просмотров
schedule 27.07.2023

Нахождение процентиля наблюдения, соответствующего распределению с мурлыканьем - R
Я пытаюсь создать канал dplyr, который сравнивает значение с распределением и возвращает процентиль этого значения относительно этого распределения. Скажем, у меня есть tibble со списком столбцов: library(tidyverse) raw_val <- c(75,66, 80,...
291 просмотров
schedule 24.03.2023

Как изменить значения в столбце data.frame на числа?
У меня есть следующий (образец) data.frame x <- data.frame(gene = 1:3, Sample1 = 5:7, Sample2 = 4:6, Sample3 = 6:8) Я хочу изменить имена столбцов, а затем использовать числа в новых заголовках в качестве значений оси X для моего графика....
56 просмотров
schedule 22.04.2023

Коэффициент переупорядочения для построения графиков с использованием пакетов forcats и ggplot2 из tidyverse
Прежде всего, благодарим ^ 13 tidyverse . Я хочу, чтобы столбцы на приведенной ниже диаграмме следовали тем же уровням факторов, переупорядоченным на forcats::fct_reorder () . Удивительно, но я вижу различный порядок уровней в наборе данных,...
1058 просмотров
schedule 23.02.2024