Публикации по теме 'tidyverse'
Классификация с Tidymodels в R
Введение
В этой статье я буду использовать фреймворк Tidymodels в R для построения модели классификации на титаническом наборе данных.
Инфраструктура Tidymodels позволяет использовать разработку функций, проверку модели, выбор модели и многое другое в элегантном, простом и эффективном стиле Tidyverse.
Исследование данных
В этой статье я буду использовать титанический набор данных с этого конкурса Kaggle. Обзор данных показан ниже.
Наша цель будет состоять в том,..
Вопросы по теме 'tidyverse'
Найдите максимальное / минимальное значение в паре столбцов
Мои данные выглядят так:
df <- tribble(
~A, ~B,
0.2, 0.1,
0.2, 0.3,
0.5, 0.1,
0.7, 0.9,
0.8, 0.9,
0.4, 0.2)
Как выбрать максимальное / минимальное значение между A и B ?
Желаемый результат:
A...
4403 просмотров
schedule
02.05.2022
dplyr tidyr для расширения и суммирования определенных столбцов
Я изо всех сил пытаюсь использовать dplyr и tidyr, чтобы принять df в этой форме:
myDf <- data.frame(id = c(1,1,1,1,2,2),
event = c('a','b','a','b','a','b'),
a_property = c(1,NA,2, NA, 3, NA),...
567 просмотров
schedule
11.06.2022
Вывести наблюдение / строку из фрейма данных
Мои данные выглядят так:
library(tidyverse)
set.seed(1)
df <- tibble(
id = c("cat", "cat", "mouse", "dog", "fish", "fish", "fish"),
value = rnorm(7, 100, sd = 50)
)
Как я могу «вытащить» верхнее значение fish , например,...
415 просмотров
schedule
06.06.2023
R: изменить форму фрейма данных, создав столбцы для определенного элемента (контрольная обработка)
Рассмотрим набор данных, показывающий результаты для контрольной и двух экспериментальных обработок для мужчин и женщин вместе с размерами для каждой обработки:
library(tidyverse)
mydf <- data_frame( treatment =...
81 просмотров
schedule
23.08.2022
Группировка R по комбинации нескольких столбцов
Рассматривая ввод dsam как:
structure(list(a = structure(c(3L, 2L, 1L, 3L, 1L, 3L, 1L, 1L, 1L, 1L),
.Label = c("A", "B", "C"), class = "factor"), b = c(1,
1, 1, 1, 1, 3, 2, 3, 3, 1), c = structure(c(2L, 1L, 1L, 2L, 1L,
3L, 1L, 1L, 3L, 3L),...
914 просмотров
schedule
01.10.2023
dplyr::group_by() с несколькими переменными, но НЕ пересечением
Когда вы group_by используете несколько переменных, dplyr помогает найти пересечение этих групп.
Например,
mtcars %>%
group_by(cyl, am) %>%
summarise(mean(disp))
урожаи
Source: local data frame [6 x 3]
Groups: cyl [?]...
460 просмотров
schedule
04.07.2023
Столбцы списка в таблицах: Могу ли я связать столбец списка с другим столбцом списка?
Это мой первый пост, поэтому, пожалуйста, извините меня, если я звучу глупо или ответ, который я ищу, уже существует.
Моя основная проблема заключается в следующем: я создал таблицу, содержащую 4 столбца (символьный столбец, два столбца данных и...
341 просмотров
schedule
29.11.2023
Создайте последовательность времени, используя R и lubridate
Есть ли эффективный способ сгенерировать вектор временной последовательности с tidyverse и lubridate ? Я знаю, что эти двое могут работать с seq() , если использовать количество дат в качестве интервала. Например, при вводе:
seq(today(),...
3324 просмотров
schedule
18.06.2023
Dplyr Grouped Mutate Do альтернатива?
У меня есть ряд учетных записей с уникальными номерами счетов, которые можно сгруппировать по порядковому номеру. Я хотел бы использовать уникальный номер счета в начале каждой последовательности в качестве нового справочного столбца для всей группы....
298 просмотров
schedule
29.03.2022
Создание функции с использованием Forcats и Dplyr для перекодирования нескольких переменных шкалы удовлетворенности
library(dplyr)
library(forcats)
Ниже приведен простой фрейм данных, содержащий три столбца, которые необходимо перекодировать в три категории - удовлетворено, неудовлетворено, нейтрально....
458 просмотров
schedule
06.08.2023
Как рассчитать проценты в столбчатой диаграмме с накоплением?
Проблема
Текущие проценты в полосе рассчитываются с общим объемом данных. Я хочу, чтобы в каждом стеке было полностью 100%. (Решено)
Также следует округлить проценты до ближайшего целого числа. (Решено)
Изменить : удалить все проценты,...
843 просмотров
schedule
02.12.2023
Измените каждый столбец функцией с двумя параметрами, сгруппированными по другому столбцу.
Следующий набор данных представляет мои ситуации:
library(dplyr)
df <- data_frame(
G1 = rep(1:2, each = 10),
G2 = rep(1:10, 2),
C1 = rnorm(20),
C2 = rnorm(20),
C3 = rnorm(20),
C4 = rnorm(20)
)
Я хочу выполнить следующую...
599 просмотров
schedule
22.07.2022
Как применить несколько функций к сгруппированной таблице с помощью dplyr
У меня есть следующий тибет:
df <- structure(list(treatment = c("control", "control", "control",
"control", "control", "control", "treated", "treated", "treated",
"treated", "treated", "treated"), `0610005C13Rik` = c(5L, 2L,
2L, 5L, 1L, 0L,...
291 просмотров
schedule
16.07.2022
R: объединить две таблицы (таблицы) по * списку * столбцов
Похоже, на это должен быть простой ответ, но я не смог его найти:
tib1 <- tibble(x = list(1, 2, 3), y = list(4, 5, 6))
tib1
# A tibble: 3 × 2
x y
<list> <list>
1 <dbl [1]> <dbl [1]>
2 <dbl [1]>...
1110 просмотров
schedule
25.08.2023
Как взять подмножества списков в таблице
У меня есть годовые финансовые данные по нескольким акциям. Мне нужно было взорвать его, чтобы получить ежемесячные данные, и благодаря #43990791">ответ на этот вопрос, который я задавал ранее , у меня есть решение, которое включает преобразование...
320 просмотров
schedule
14.07.2023
read_excel не будет обрезать пробелы
Я использую пакет readxl для загрузки файла Excel. По умолчанию он должен удалять пустое пространство, но этого не происходит.
Файл можно загрузить непосредственно по ссылке ниже или, альтернативно, его можно загрузить через веб-сайт, где...
2180 просмотров
schedule
01.01.2023
как запускать модели на комбинациях двух переменных и возвращать фрейм данных со значениями p и r-квадрат для каждой модели с помощью tidyverse
Я пытаюсь запускать модели с разными комбинациями переменных. Я хочу иметь фрейм данных с 3 столбцами: переменные, p-значение и r-квадрат для каждой модели. В качестве примера я использую набор данных mtcars. Вот мои коды:
c('wt', 'hp', 'qsec')...
296 просмотров
schedule
27.07.2023
Нахождение процентиля наблюдения, соответствующего распределению с мурлыканьем - R
Я пытаюсь создать канал dplyr, который сравнивает значение с распределением и возвращает процентиль этого значения относительно этого распределения. Скажем, у меня есть tibble со списком столбцов:
library(tidyverse)
raw_val <- c(75,66, 80,...
291 просмотров
schedule
24.03.2023
Как изменить значения в столбце data.frame на числа?
У меня есть следующий (образец) data.frame
x <- data.frame(gene = 1:3, Sample1 = 5:7, Sample2 = 4:6, Sample3 = 6:8)
Я хочу изменить имена столбцов, а затем использовать числа в новых заголовках в качестве значений оси X для моего графика....
56 просмотров
schedule
22.04.2023
Коэффициент переупорядочения для построения графиков с использованием пакетов forcats и ggplot2 из tidyverse
Прежде всего, благодарим ^ 13 tidyverse . Я хочу, чтобы столбцы на приведенной ниже диаграмме следовали тем же уровням факторов, переупорядоченным на forcats::fct_reorder () . Удивительно, но я вижу различный порядок уровней в наборе данных,...
1058 просмотров
schedule
23.02.2024