Dplyr – вопросы и ответы

68
голосов
1
ответ
Я пытаюсь изменить все значения переменной, которая содержит слово "длина" через 12 часов до NA. df_data <- cbind( seq(0, 15, by = 0.5), sample(seq(from = 100, to = 300, by = 10), size = 31, rep...
4 месяца назад Galina Polishchuk
56
голосов
2
ответа
У меня возникли проблемы с попыткой создать новый DataFrame, который создает процент в год с dplyr. Dataframe выглядит следующим образом: structure(list(orgid = c("USGS-NJ", "USGS-NJ", "USGS-NJ", "...
4 месяца назад KWANGER
78
голосов
3
ответа
требуются пакеты 'Dplyr' 'Nycflights13' я использую q4<-flights%>%group_by(year,month,day)%>%summarise(cancelled=sum(is.na(dep_time)),avg_delay=mean(arr_delay,na.rm = T),totalflights=n()) ...
4 месяца назад Steve austin
100
голосов
1
ответ
Я пишу пакет, который импортирует блестящие, диграфы и блестящие. Однако всякий раз, когда я создаю и загружаю пакет, всегда появляется предупреждение, replacing previous imports by 'dygraphs::%>...
4 месяца назад Miller Zhu
56
голосов
2
ответа
У меня два кадра данных со следующим размером: dim(x) 8637 133 dim (y) 8113 26 Я пытаюсь объединить x и y одним общим столбцом в x и y. Я использую функцию left_join из пакета dplyr. df <- dplyr...
4 месяца назад yas.f
68
голосов
1
ответ
У меня есть ситуация, когда мне нужно перерисовывать несколько фреймов данных на основе имени, проблема, с которой я сталкиваюсь, заключается в том, как определить привязку к этим файлам данных, ко...
4 месяца назад S31
56
голосов
1
ответ
Я пытаюсь рассчитать расстояние между двумя наборами координат долготы и широты. Я использую функцию distm() из геосферы пакета, чтобы сделать это. Он отлично работает, если я вручную помещаю значе...
4 месяца назад Steen Harsted
56
голосов
1
ответ
У меня есть df ниже, help.a и мне нужно очистить его несколькими операциями фильтра. help.a <- data.frame(id = as.factor(c("01", "01", "01", "01", "01", "04", "04", "05", "05", "05", "05", "05",...
4 месяца назад bpace
-10
голосов
3
ответа
Я недавно видел такой код: library(dplyr) mtcars %.% mutate(carb_10 = carb %/% 10) И это.... mtcars %.% mutate(carb_10 = carb %% 10) Может ли кто-нибудь объяснить, что%/% и %% делают в вышеуказанно...
4 месяца назад luciano
80
голосов
1
ответ
У меня есть кадр данных с переменным числом столбцов (.csv import). Столбец 1 всегда один и тот же (временные коды), столбец 2 всегда существует, а другие столбцы могут существовать или нет (так чт...
4 месяца назад Peha
87
голосов
2
ответа
Попытка преобразования фрейма данных с несколькими булевыми столбцами для строк с дублирующимися идентификаторами в новый фреймворк данных, где для каждого идентификатора есть только одна запись, н...
4 месяца назад Sean Kelso
56
голосов
1
ответ
Я пытаюсь передать несколько аргументов group_by функции dplyr, а также именованной переменной. В понимании, что мне нужно использовать quosure для dplyr, чтобы понять переменные, которые я перехож...
4 месяца назад robbieNukes
56
голосов
1
ответ
Я работаю над старыми именами списков. Имена людей написаны по-разному, но на самом деле это одни и те же люди. Я использовал пакет stringdist для вычисления расстояния между строками, чтобы найти,...
4 месяца назад Wilcar
-4
голоса
2
ответа
У меня есть датафрейм с несколькими повторяющимися строками из цикла: v1 v2 v3 v4 Number 1 2 3 5 Index 0 0 0 0 Number.1 1 2 3 5 Index.1 0 0 0 0 Number.2 1 2 3 5 Index.2 0 0 0 0 Number.
4 месяца назад Gabriel G.
105
голосов
1
ответ
Мой код выглядит следующим образом: Form_CharSizePorts2 <- function(main, size, var, wght, ret) { main.cln <- main %>% select(date, permno, exchcd, eval(parse(text=size)), eval(parse(text=...
4 месяца назад BOBO
55
голосов
1
ответ
Я пытаюсь замедлить переменные днем, но многие из них не наблюдают в предыдущий день. Поэтому мне нужно добавить дополнительную строку в этот процесс. Dplyr меня приближает, но мне нужен способ доб...
4 месяца назад swhusky
79
голосов
1
ответ
Я довольно хорошо знаком с R dplyr для анализа данных, и я пытаюсь преобразовать часть кода, который я написал в dplyr, для pandas. У меня есть данные, у которых есть человек, идентифицированный ст...
4 месяца назад Kartik
110
голосов
1
ответ
У меня есть бинарный вектор y <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,1,1,1,1,1,1,0,1,1,0,1,0,1,0,0,0,0,0,1,0,0,0,1,1,0,1,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1...
4 месяца назад Pankaj
55
голосов
1
ответ
Я пытаюсь написать функцию, которая суммирует две метрики, основанные на Sepal.Length и Sepal.Year , это была моя попытка. Неужели я ошибаюсь? df = structure(list(Sepal.Length = c("short","short", ...
4 месяца назад timnus
55
голосов
1
ответ
Сокращенная версия моего набора данных приведена ниже. Z_dog1_mu1 Z_dog2_mu1 Z_dog3_mu1 Z_cat1_mu1 Z_cat2_mu1 Z_cat3_mu1 0.0000 0.0000 0.0001 0.0005 0.0043 0.0045 0.0039 -0.0016 -0.0102 -0.0009 0.0...
4 месяца назад Kim Jenkins
69
голосов
2
ответа
Я импортирую все файлы в список. library(ncdf4) list <- list.files(path=".", pattern="*test*", full.names=TRUE) dat = lapply(list, nc_open) Теперь, dat large list из 10 элементов. Каждый элемент...
4 месяца назад maximusdooku
68
голосов
1
ответ
Я пытаюсь подмножить результат вызова dplyr. Может кто-нибудь объяснить, почему это не работает? library(dplyr) df<-data.frame(name=c("bob","ann"),age=c(22,24),random=c(1,2)) View(df%>%filter...
4 месяца назад Rilcon42
77
голосов
2
ответа
Я хотел бы иметь решение для Tidyverse для следующей задачи. В моем наборе данных у меня есть данные о различных уровнях факторов. Я хотел бы создать новый уровень факторов "Итого", который будет с...
4 месяца назад miwin
55
голосов
1
ответ
Я хочу добавить отсутствующие наблюдения в свой набор данных панели, но все время сталкиваюсь с проблемами памяти. Я использую следующий код (на основе этого раздела): library(dplyr) group_by(df, g...
4 месяца назад research111
56
голосов
3
ответа
У меня есть приведенный ниже dataframe (Dput): structure(list(ID = c("TTR-1", "TTR-1", "TTR-2", "TTR-2", "TTR-2", "TTR-3", "TTR-4", "TTR-4", "TTR-4", "TTR-5"), Value1 = c(100L, 400L, 147L, 159L, 16...
4 месяца назад Vector JX
77
голосов
3
ответа
Я могу суммировать a data.frame тривиально с dplyr со следующим: z <- data.frame(a = rnorm(20), b = rep(letters[1:4], each = 5)) library(dplyr) z %>% group_by(b) %>% summarise(out = n()) S...
4 месяца назад cdeterman
67
голосов
2
ответа
Мне нужно создать функцию, которая могла бы group_by и суммировать фрейм данных, используя имена его столбцов. Я работаю с dplyr версии 0.4.1 (и не могу обновить), поэтому похоже, что решения, кото...
4 месяца назад Paugre
69
голосов
1
ответ
У меня есть набор данных, который показывает слишком много меток на оси. Когда я показываю его как месяцы, он слишком переполнен. Я хочу изменить ярлыки на годы, но оставить строки неизменными. Вот...
4 месяца назад Paul
102
голоса
1
ответ
Первый кадр данных, который у меня есть, включает столбец состояний, называемый state , но некоторые из них показаны как сокращения (LA, CA, OH), а другие имеют полное имя штата (Луизиана, Калифорн...
4 месяца назад Dennis
109
голосов
1
ответ
df%>% group_by(variable1)%>% summarise(length=length(levels(df$variable2)) group_by не работает, и у меня одинаковые результаты для всех уровней переменной1.
4 месяца назад Spigonico
76
голосов
1
ответ
library(tidyverse) df0 <- data.frame(col1 = c(5, 2), col2 = c(6, 4)) df1 <- data.frame(col1 = c(5, 2), col2 = c(6, 4), col3 = ifelse(apply(df0[, 1:2], 1, sum) > 10 & df0[, 2] > 5, "...
4 месяца назад Jason Hunter
77
голосов
1
ответ
Мне нужно cast свои данные: > data.frame(transactionID= c("941214", "941214", "140668","945320","945320","945320"), productCategory = c("A","B","C","B","C","A")) transactionID productCategory 1 ...
4 месяца назад Mario M.
94
голоса
1
ответ
Я чувствую, что моя основная проблема заключается в том, как регрессировать несколько серий в одной серии. Хотя мои серии не равны во времени, даже когда я использую равные серии временных рядов дл...
4 месяца назад Polar Bear
56
голосов
1
ответ
У меня есть dataframe со следующей структурой (сводный пример, а не фактический) dput(df1) structure(list(MedID = c(111, 111, 111, 111, 111, 111, 222, 222, 222, 222, 222), Service = structure(c(1L,...
4 месяца назад user3885754
78
голосов
2
ответа
Изменить . Позже я понял, что ошибка была в моем полном наборе данных, а не в коде. Мои извинения. Это может быть или не быть полезным для кого-либо еще. У меня есть заголовок, с столбцом "геометри...
4 месяца назад Ana
88
голосов
1
ответ
Мне нужно отфильтровать таблицу логическим столбцом (точнее, его отрицанием), но имя столбца может отличаться. Это легко, когда я знаю их имена заранее: tb = tibble( id = 1:4, col1 = c(TRUE, TRUE, ...
4 месяца назад Luiz Rodrigo
70
голосов
4
ответа
Вот упрощенный пример: library(tidyverse) frame <- tribble( ~a, ~b, ~c, 1, 1, 2, 5, 4, 7, 2, 3, 4, 3, 1, 6 ) key <- tribble( ~col, ~name, ~type, ~labels, 1, "a", "f", c("one", "two", "three",...
4 месяца назад Krizbi
69
голосов
1
ответ
Я пытаюсь найти среднее значение каждой группы/фактора и создаю новый столбец со средним значением группы для каждого случая, используя трубопровод dplyr. Мой код выглядит следующим образом: mtcars...
4 месяца назад TYL
69
голосов
1
ответ
У меня есть два фрейма данных, как показано ниже, которые разделяют имена столбцов, но информация может быть противоречивой. (В первой части данных больше информации (диапазон 0-5), второй - меньше...
4 месяца назад Yoshiki
57
голосов
2
ответа
В моем наборе данных есть следующие переменные: > colnames(sample) [1] "gender" "age" "partyID" [4] "treatment_rand" "treatment_bias" "y_randT" [7] "y_biasT" "y_randConti" "y_biasConti" [10] "fa...
4 месяца назад user51966
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема