Pandas – вопросы и ответы

90
голосов
1
ответ
У меня есть кадр данных pandas oParameterData , который я построил на Hadoop, используя Hive ODBC-соединение. Я использую его для заполнения словаря Python под названием oParameter import pyodbc im...
7 месяцев, 3 недели назад Alexis.Rolland
65
голосов
1
ответ
Я попытался отразить некоторые сложные операции SQL в python. началось с интимного требования, чтобы узнать EMP_ID, который получает максимальную зарплату в отделе. 3 шага: GroupBy (Отдел) Макс (за...
7 месяцев, 3 недели назад Gokul Krishna
102
голоса
1
ответ
Я хочу подавить определенный тип предупреждения, используя регулярное выражение. Предупреждающее сообщение: C:\Anaconda3\lib\site-packages\pandas\core\indexing.py:420: SettingWithCopyWarning: A val...
7 месяцев, 3 недели назад Peter Li
91
голос
2
ответа
Как бы я поместил каждую строку df влево с достаточным количеством пробелов, чтобы гарантировать, что строка насчитывает 30 символов? Я попытался пойти по этому пути, но это не сработало, и я счита...
7 месяцев, 3 недели назад Mike
65
голосов
3
ответа
Я хочу извлечь данные из нескольких CSV файлов и объединить их в один большой фрейм данных в pandas. Для этого я создал один фрейм данных, который должен быть заполнен данными входящих фреймов. fin...
7 месяцев, 3 недели назад Maple123
91
голос
2
ответа
У меня есть dataframe, df , который выглядит как Open High Low Close Volume Date 2007-03-22 2.65 2.95 2.64 2.86 176389 2007-03-23 2.87 2.87 2.78 2.78 63316 2007-03-26 2.83 2.83 2.51 2.52 54051 2007...
7 месяцев, 3 недели назад Moondra
65
голосов
2
ответа
Я пытаюсь нарисовать красочную таблицу, вот так. этот
7 месяцев, 3 недели назад shi95
93
голоса
2
ответа
Я пытаюсь заменить строку в кадре данных на "+" "-", поэтому я могу разбить график на карте. Я знаю только основные о питоне, и я использую навигатор Anaconda, вот что я пробовал, и у меня есть оши...
7 месяцев, 3 недели назад Jiyeon Mun
120
голосов
1
ответ
У меня был код, который создавал бы хороший уложенный граф и общую строку при предоставлении DataFrame. когда я обновил свою Anaconda до 4.0 (pandas 0.18, matplotlib 1.5.1), общая линия была остано...
7 месяцев, 3 недели назад Stein
111
голосов
1
ответ
Если я делаю df.update() в кадре, для которого ключ не существует, какой самый чистый способ я могу его добавить? Что-то вроде: try: df.update(new_data) except: df.insert(new_data)
7 месяцев, 3 недели назад cjm2671
79
голосов
1
ответ
У меня проблемы с получением pandas для суммирования и суммирования. Образец из файла: 18820 Multiple choice / by Zambra, Alejandro, ZAMBRA B F 15.00 15.00 18821 Green girl / by Zambreno, Kate, ZAM...
7 месяцев, 3 недели назад Bubnoff
-5
голосов
1
ответ
У меня есть набор данных как следующий u_id request_day time request_time 4 2016-11-05 06:50 2016-11-05 06:50:30 4 2016-11-05 06:51 2016-11-05 06:51:55 4 2016-11-05 07:06 2016-11-05 07:06:38 4 2016...
7 месяцев, 3 недели назад Sriram Arvind Lakshmanakumar
64
голоса
2
ответа
У меня есть большой набор данных, который никогда не изменяется (я никогда не изменяю его напрямую). Я начинаю читать его с помощью панд dataset = pandas.read_csv(filepath) и затем я делаю некоторы...
7 месяцев, 3 недели назад Ben
80
голосов
1
ответ
from bs4 import BeautifulSoup import pandas as pd import numpy as np import matplotlib.pyplot as plt #pd.set_option('display.max_columns', None) a = pd.read_html("D:\\abcd\New folder\PRTG Report AI...
7 месяцев, 3 недели назад Shamsu Rahman
-8
голосов
1
ответ
Мне нужно добавить несколько df к одному excel, и я хочу, чтобы они выглядели как . Любая функция в pandas . что может это сделать?
7 месяцев, 3 недели назад ldevyataykina
129
голосов
1
ответ
Почему difflib.get_close_matches выдает "индекс списка вне диапазона" Ошибка, если совпадения не найдены в следующем примере? from pandas import DataFrame import difflib df1 = DataFrame([[1,'034567...
7 месяцев, 3 недели назад FunnyChef
-5
голосов
1
ответ
У меня есть фрейм данных панд... в одном из его столбцов есть список строк. Я хочу определить условие для этого. Это условие заключается в том, что если список в каждой строке имеет длину менее 2 с...
7 месяцев, 3 недели назад CFD
91
голос
3
ответа
Итак, у меня есть [Python2.7] Pandas dataframe (df), как показано ниже: name flag dummy_D random ID dummy_S dummy_T 0 Mick Purple 2 NaN 1 21 32 1 John Red NaN NaN 2 w32 4 2 Christine NaN 2 NaN 2 w3...
7 месяцев, 3 недели назад Wai Tong
79
голосов
2
ответа
Я использую библиотеку randomForest в R через RPy2 . Я хотел бы вернуть значения, рассчитанные с использованием метода predict caret и присоединиться к ним к исходному кадру данных pandas . См. При...
7 месяцев, 3 недели назад kungphil
119
голосов
3
ответа
Я пытаюсь преобразовать pandas datetime в эпоху, используя приведенный ниже код. import time import pandas as pd compare_date = pd.datetime.today()+pd.DateOffset(days=-60) print time.mktime(datetim...
7 месяцев, 3 недели назад ubh
110
голосов
1
ответ
Скажем, у меня есть серия чисел и список: s1 = pd.Series([0,1,2,5,4,1,0,2]) mylist = pd.Series(['apples','pears','bananas','oranges','lemons','limes']) и я хочу создать новую серию со значениями, п...
7 месяцев, 3 недели назад Jason S
128
голосов
2
ответа
Я пытаюсь объединить 2 разных файла Excel. (благодаря сообщению Импортировать несколько файлов excel в python pandas и объединить их в один фрейм данных ) Тот, который я выработал до сих пор: impor
7 месяцев, 3 недели назад Mark K
119
голосов
1
ответ
У меня есть сводная таблица, которую я создал с помощью: df = df[["Ref", # int64 "REGION", # object "COUNTRY", # object "Value_1", # float "Value_2", # float "Value_3", # float "Type", # object "Da...
7 месяцев, 3 недели назад Maverick
64
голоса
1
ответ
У меня есть приведенный ниже фреймворк, и мне нужно заполнить 1 за последнюю неделю этого месяца и года и недели отдыха за тот же месяц и год, что и 0 ДФ: date total 02/01/00 28.000568 09/01/00 28....
7 месяцев, 3 недели назад user3222101
136
голосов
2
ответа
Есть ли более быстрый, более питонический способ сделать это? Что такое генерируя это предупреждение UserWarning: Boolean Series key will be reindexed to match DataFrame index. "DataFrame index.", ...
7 месяцев, 3 недели назад zhespelt
120
голосов
1
ответ
Представьте, что у меня есть датафрейм с 9 столбцами. Я хочу иметь возможность добиться того же эффекта, что и df.hist(), но с помощью sns.distplot(). Другими словами, я хочу иметь возможность отоб...
7 месяцев, 3 недели назад pythonRCNewbie
65
голосов
1
ответ
Я пытаюсь заменить столбец в 24-часовой раз в df на полные секунды. В приведенном ниже коде генерируется случайный df. import pandas as pd import random def randomTime(): rtime = int(random.random(...
7 месяцев, 3 недели назад PeterJames123
64
голоса
2
ответа
Я пытаюсь выполнить итерацию через двумерный массив в Python и сравнить элементы в массиве с ints, однако я сталкиваюсь с множеством различных ошибок всякий раз, когда я пытаюсь сделать это. Я испо...
7 месяцев, 3 недели назад Christina de L
112
голосов
2
ответа
Мой исходный фреймворк: site code type name 0 a code_foo s 1 a code_foo t 2 b code_foo s 3 b code_foo t Желаемый результат: site code type name 0 a code_foo s 1 1 a code_foo s 2 2 a code_foo s 3 3 ...
7 месяцев, 3 недели назад andyb88
143
голоса
1
ответ
Я хочу отфильтровать следующие строки dataframe в начале 19 символов (соответствует требованиям) строки. На данный момент структура данных выглядит так: Name Reason 0 item1 {"state": "doesn't meet ...
7 месяцев, 3 недели назад David
65
голосов
2
ответа
Есть ли способ разрезать фрейм данных pandas, смешивая "массив меток" с "срезом объектов". Я не мог найти здесь пример. Индексирование и выбор данных Список или массив меток ['a', 'b', 'c'] Объект ...
7 месяцев, 3 недели назад IcemanBerlin
90
голосов
2
ответа
У меня есть набор данных, который выглядит как tradeid buyer seller quantity 1 John Mark 10 2 Frank John 5 3 John Jesse 4 где в основном каждая строка соответствует торговле между покупателем и про...
7 месяцев, 3 недели назад ℕʘʘḆḽḘ
65
голосов
1
ответ
Помогите! Мне нужно запросить таблицу с предложением "in", где SQL выглядит так: select * from some_table where some_field in (?) Я изначально использовал наивный подход и попробовал это: in_items ...
7 месяцев, 3 недели назад Ojingo
101
голос
1
ответ
Я использую Pandas Timegrouper для группировки datapoints в фрейме Pandas в python: grouped = data.groupby(pd.TimeGrouper('30S')) Я хотел бы знать, есть ли способ достичь перекрытия окна, как предл...
7 месяцев, 3 недели назад Fra
79
голосов
1
ответ
У меня есть фрейм данных, определяемый как df. Я пытаюсь создать новый столбец с именем, partialName, скопировав столбец с именем FullName, но принимаю только определенное количество символов (вклю...
7 месяцев, 3 недели назад newbie
64
голоса
1
ответ
Я удаляю данные из YAHOO и пытаюсь извлечь определенное значение из его фрейма данных, используя значение из другого файла. Мне удалось очистить данные и показать их как фрейм данных. дело в том, ч...
7 месяцев, 3 недели назад bikoman57
79
голосов
1
ответ
Поэтому я пытаюсь экспортировать Pandas DataFrame в.xlsx файл, используя метод to_excel; Я искал SO и не нашел вопросов, которые, кажется, полностью отвечают на это. Проблема состоит в том, что отд...
7 месяцев, 3 недели назад AudreyM
64
голоса
2
ответа
Я пытаюсь подсчитать количество последовательных положительных событий для каждого столбца в кадре данных панд. Решение, предоставляемое DSM here- Подсчет последовательного положительного значения ...
7 месяцев, 3 недели назад Mike
102
голоса
1
ответ
У меня есть следующий фреймворк: df = pd.DataFrame(columns=["a","b","c"]) df.loc[1] = [1,2,3] df.loc[2] = ["123.12", "3455,435",0] df.loc[3] = [23.2, 55.5,0.1] df.loc[4] = ["1,3","3,5","7.8"] и я х...
7 месяцев, 3 недели назад woody
192
голоса
3
ответа
У меня есть цикл for: for i in links: data = urllib2.urlopen(str(i)).read() data = json.loads(data) data = pd.DataFrame(data.items()) data = data.transpose() data.columns = data.iloc[0] data = data...
7 месяцев, 3 недели назад Blue Moon
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема