Dataframe – вопросы и ответы

75
голосов
1
ответ
Я использую Rserve для соединения с R из Java. У меня проблема с использованием библиотечной функции в R только тогда, когда я обращаюсь к ней через Java. Вот подробности: В Java у меня есть четыре...
2 месяца, 2 недели назад novicegeek
86
голосов
2
ответа
Как бы я поместил каждую строку df влево с достаточным количеством пробелов, чтобы гарантировать, что строка насчитывает 30 символов? Я попытался пойти по этому пути, но это не сработало, и я счита...
2 месяца, 2 недели назад Mike
62
голоса
3
ответа
Я хочу извлечь данные из нескольких CSV файлов и объединить их в один большой фрейм данных в pandas. Для этого я создал один фрейм данных, который должен быть заполнен данными входящих фреймов. fin...
2 месяца, 2 недели назад Maple123
62
голоса
2
ответа
У меня есть большой набор данных, который устроен так Stat.num LatS.dec.NEW LonS.dec.NEW LatF.dec.NEW LonF.dec.NEW 388 66.68 -21.0666 66.7071666 -20.98 389 66.69 -21.01 66.6433 -21.06 Но я хотел бы...
2 месяца, 2 недели назад Stefán Áki Ragnarsson
96
голосов
3
ответа
У меня есть набор данных, заполненный средней скоростью ветра в час в течение нескольких лет. Я хотел бы создать "средний год", в котором за каждый час рассчитывается средняя скорость ветра в течен...
2 месяца, 2 недели назад Gerrit Jan
86
голосов
2
ответа
У меня есть data.frame, df, где у меня есть 2 столбца, один с названием песни, а другой с объединенным названием и исполнителем. Я хочу создать отдельное поле художника. Здесь показаны первые три с...
2 месяца, 2 недели назад pssguy
89
голосов
2
ответа
Я пытаюсь заменить строку в кадре данных на "+" "-", поэтому я могу разбить график на карте. Я знаю только основные о питоне, и я использую навигатор Anaconda, вот что я пробовал, и у меня есть оши...
2 месяца, 2 недели назад Jiyeon Mun
86
голосов
3
ответа
Доброе утро. Я езжу на велосипеде по некоторым данным, создавая DataFrame, когда я иду. Каждый раз, когда я добавляю или заменяю строку в фрейме данных, числовые значения становятся классифицирован...
2 месяца, 2 недели назад PJP
75
голосов
2
ответа
Наконец, я пришел к вопросу о том, что очень медленная обработка данных и добавление строк из нескольких data.frames . Я использую lapply и dplyr для обработки данных. OTH, процесс становится очень...
2 месяца, 2 недели назад Alexander
62
голоса
1
ответ
Мне нужно рассчитать сходство jaccard с рамкой данных ниже: df = data.frame( a=c("1", "1", "1", "1", "2", "2", "2", "3", "3", "4", "4", "4", "4"), b=c("100", "101", "111", "25841", "111", "101", "1...
2 месяца, 2 недели назад Thaciana G O Cerqueira
76
голосов
1
ответ
from bs4 import BeautifulSoup import pandas as pd import numpy as np import matplotlib.pyplot as plt #pd.set_option('display.max_columns', None) a = pd.read_html("D:\\abcd\New folder\PRTG Report AI...
2 месяца, 2 недели назад Shamsu Rahman
123
голоса
1
ответ
Исходя из R, я привык к легкому выполнению операций над столбцами. Есть ли простой способ взять эту функцию, которую я написал в scala def round_tenths_place( un_rounded:Double ) : Double = { val r...
2 месяца, 2 недели назад Michael Discenza
-4
голоса
1
ответ
У меня есть фрейм данных панд... в одном из его столбцов есть список строк. Я хочу определить условие для этого. Это условие заключается в том, что если список в каждой строке имеет длину менее 2 с...
2 месяца, 2 недели назад CFD
62
голоса
1
ответ
Привет, у меня есть следующие два кадра данных: # dataframe 1 --> clst1_trimmed > head(clst1_trimmed) # A tibble: 6 x 2 GeneName Clst.1 <fct> <dbl> 1 Cd74 1.20 2 Lyz2 1.02 3 Malat...
2 месяца, 2 недели назад Atakan
62
голоса
2
ответа
Я не знаю, возможно ли... Я бы сохранил файл, чтобы импортировать его в другие будущие сеансы. Я хочу сохранить этот файл data.frame в файле csv (это список списка, содержащий векторы): > operac...
2 месяца, 2 недели назад Victor J
88
голосов
2
ответа
У меня есть фреймворк pyspark, где я сгруппировал данные для списка с помощью collect_list . from pyspark.sql.functions import udf, collect_list from itertools impor
2 месяца, 2 недели назад Michail N
105
голосов
2
ответа
Я пытаюсь сделать простой reshape , чтобы сделать test следующим образом: a_estimate, a_tstat, b_estimate, b_tstat 1, 3, 2, 4 Это код, который я пытаюсь выполнить: require(reshape2) test = data.fra...
2 месяца, 2 недели назад Alex
61
голос
1
ответ
У меня есть приведенный ниже фреймворк, и мне нужно заполнить 1 за последнюю неделю этого месяца и года и недели отдыха за тот же месяц и год, что и 0 ДФ: date total 02/01/00 28.000568 09/01/00 28....
2 месяца, 2 недели назад user3222101
130
голосов
2
ответа
Есть ли более быстрый, более питонический способ сделать это? Что такое генерируя это предупреждение UserWarning: Boolean Series key will be reindexed to match DataFrame index. "DataFrame index.", ...
2 месяца, 2 недели назад zhespelt
87
голосов
1
ответ
У меня возникли проблемы с преобразованием этого фрейма данных в R. У меня есть dataframe, который имеет такую форму: |University |created | N| |:-------------------------------------|:-------|--:|...
2 месяца, 2 недели назад kriztean
115
голосов
1
ответ
mylist2<-list(as.numeric(c(1:20)),(c(1:20)**2),sqrt(c(1:20))) iData<-data.frame(do.call(cbind,mylist2)) print(iData,row.names=FALSE) quantile(iData$X1,iData$X2,iData$X3,c(0.25,0.25,0.25)) Я х...
2 месяца, 2 недели назад tytds
97
голосов
2
ответа
Допустим, у меня есть эти кадры данных: original = data.frame(id = 1, paramA = 12, paramB=30) update = data.frame(id=1 , paramA = NA , paramB = 22) Как я могу создать этот фрейм данных: result_df =...
2 месяца, 2 недели назад Stelios M
75
голосов
1
ответ
Поэтому я пытаюсь экспортировать Pandas DataFrame в.xlsx файл, используя метод to_excel; Я искал SO и не нашел вопросов, которые, кажется, полностью отвечают на это. Проблема состоит в том, что отд...
2 месяца, 2 недели назад AudreyM
61
голос
2
ответа
У меня есть требование, в котором я должен прочитать файл excel (с расширением.xlsx) в искро /scala. Мне нужно создать фрейм данных с данными, считываемыми из excel, и применять/писать sql-запросы,...
2 месяца, 2 недели назад Krishnan
76
голосов
2
ответа
Я мог бы использовать вашу помощь в следующем: У меня есть кадр данных с "посещением" и "днями обучения" для каждого участника, поэтому показывается количество дней, в течение которых участник нахо...
2 месяца, 2 недели назад user3640617
97
голосов
1
ответ
У меня есть следующий фреймворк: df = pd.DataFrame(columns=["a","b","c"]) df.loc[1] = [1,2,3] df.loc[2] = ["123.12", "3455,435",0] df.loc[3] = [23.2, 55.5,0.1] df.loc[4] = ["1,3","3,5","7.8"] и я х...
2 месяца, 2 недели назад woody
184
голоса
3
ответа
У меня есть цикл for: for i in links: data = urllib2.urlopen(str(i)).read() data = json.loads(data) data = pd.DataFrame(data.items()) data = data.transpose() data.columns = data.iloc[0] data = data...
2 месяца, 2 недели назад Blue Moon
61
голос
2
ответа
Я пытаюсь округлить значения фрейма данных pandas до ближайшего целого числа, так что я могу сохранить эти данные таким образом, прежде чем потенциально читать/сохранять его в csv. Я не уверен, поч...
2 месяца, 2 недели назад laszlopanaflex
63
голоса
1
ответ
В настоящее время я использую следующий код для объединения> 130 фреймов данных, и код занимает слишком много часов для запуска (я на самом деле так и не дошел до завершения на таком большом наб...
2 месяца, 2 недели назад Perlnika
62
голоса
1
ответ
Запросы базы данных могут быть очень техничными. Я хочу создать чатбот Python для запроса базы данных/CSV-данных. Я не хочу использовать какие-либо готовые API-сервисы, поскольку данные могут быть ...
2 месяца, 2 недели назад Yogesh
97
голосов
1
ответ
Я пишу с помощью мобильного телефона, поэтому извиняюсь за то, что не предоставил код. Моя организация не позволяет мне получить доступ к этому сайту. Я не смог добиться следующего. SomeFunction(co...
2 месяца, 2 недели назад Avinash Kumar
77
голосов
2
ответа
TL/DR: Я пытаюсь удалить заголовки и ссылки RSS, которые отображаются в одном списке списков от другого. У меня есть виджет, который тянет заголовки новостей Google News +, и ежедневно выводит их в...
2 месяца, 2 недели назад Mike W
114
голосов
4
ответа
У меня есть следующий фрейм данных ( s ): s<-read.table(text = "V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 1 0 62 64 44 NA 55 81 66 57 53 2 0 0 65 50 NA 56 79 69 52 55 3 0 0 0 57 NA 62 84 76 65 59 4 0 0 0 0...
2 месяца, 2 недели назад Avi
75
голосов
2
ответа
У меня есть data.frame в R, который выглядит так: percent Input_SNP 9.123 Set_1 8.713 Set_2 7.666 Set_3 7.091 Set_4 7.601 Set_5 5.461 Set_6 9.992 Set_7 5.555 Кроме того, у меня нет периода над Inpu...
2 месяца, 2 недели назад Evan
75
голосов
3
ответа
У меня большой data.frame с некоторыми столбцами, но мой 9-й столбец состоит из данных, разделенных точкой с запятой: gtf$V9 1 gene_id CUFF.1; transcript_id CUFF.1.1; FPKM 7.0762407256; frac 1.0000...
2 месяца, 2 недели назад Pierre-louis Stenger
62
голоса
2
ответа
Я использую следующий код, чтобы очистить таблицу HTML в данных игрока AFL: library(rvest) website <-read_html("https://afltables.com/afl/stats/teams/adelaide/2017_gbg.html") table <- website...
2 месяца, 2 недели назад S_C
97
голосов
3
ответа
У меня есть датафрейм, который выглядит так: df_pairs 128.437 128.437 121.639 5100.9 5029.08 5029.08 4888.81 4888.81 0 0 0 0 0 0 129.588 129.588 122.79 5102.05 5030.24 5030.24 4959.55 4959.55 4889....
2 месяца, 2 недели назад HelloToEarth
106
голосов
2
ответа
У меня есть таблица, подобная этой names ranges strand 1 [ 1, 3073252] + 2 ENSMUSG00000102693 [3073253, 3074322] + 3 [3074323, 3102015] + 4 ENSMUSG00000102693 [3102016, 3102125] + 5
2 месяца, 2 недели назад star
-4
голоса
1
ответ
Пусть говорят в среде R, у меня есть этот фрейм данных с n строками: samples size a 6 b 4 c 4 d 3 e 2 . . . . . . Результат, который я ищу, - использовать эту функцию> 4*(size -1)/4*size-3 и пол...
2 месяца, 2 недели назад Zero
97
голосов
1
ответ
Будучи новым для Панд, мне пришлось много копать, чтобы найти решение этой проблемы. Я хотел бы знать, как лучше решить эту проблему, учитывая, что мне все еще необходимо решить проблемы с границам...
2 месяца, 2 недели назад Cedric Zoppolo
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема