Pandas – вопросы и ответы

55
голосов
3
ответа
Предположим, что мы имеем ряд: s1 = pd.Series('a', index=[1,2,3], name="Column One") s2 = pd.Series('b', index=[1,2,3], name="Column Two") Как мы могли видеть из документации ( здесь ), предлагаемы...
3 месяца, 1 неделя назад Alex-droid AD
110
голосов
5
ответов
Это кажется тривиальным вопросом, но при использовании groupby(), как я могу создать DataFrame с новым столбцом, содержащим индекс номера группы. Например. если у меня есть >>> df=pd.DataF...
3 месяца, 1 неделя назад user2667066
79
голосов
1
ответ
У меня есть список с некоторыми датами, например: date_list = [201701, 201702, 201703, 201704]. Это пользовательский ввод желаемых дат для конкретного отчета. И у меня есть база данных с тремя стол...
3 месяца, 1 неделя назад Joao Salles
55
голосов
2
ответа
У меня есть следующий кадр данных python (test) с двумя индексами (permKey и ccy) qty inventoryValue permKey ccy CASH AUD 3 60000 USD 3 1200 SPY USD 5 1050 Чтобы выбрать все кассовые позиции, этот ...
3 месяца, 1 неделя назад Goofy Gert
76
голосов
1
ответ
Форма скрипичного графика полезна для визуализации распределения данных сгруппированных данных. Размер каждой группы также можно визуализировать как область "скрипки". Но когда данные неоднородны, ...
3 месяца, 1 неделя назад Chang Ye
78
голосов
1
ответ
У меня есть CSV, который я импортирую в dataframe. Я пытаюсь разбить один столбец, который имеет кучу значений, разделенных запятыми, в строки. df_supplier = pd.read_csv(wf['local_filename']) print...
3 месяца, 1 неделя назад Shenanigator
67
голосов
2
ответа
У меня есть кадр данных с ежемесячными данными за 2014 год для серии из 317 биржевых котировок (317 тикеров x 12 месяцев = 3,804 строки в DF). Я хотел бы преобразовать его в ежедневный фрейм данных...
3 месяца, 1 неделя назад Gregory Saxton
66
голосов
1
ответ
Я пытаюсь сделать перекрытие с некоторыми данными из dataframe. Вот краткий пример: df=pd.DataFrame({ 'player':['A', 'B', 'C', 'D', 'A', 'C', 'B'], 'game':['gameA', 'gameB', 'gameC', 'gameC', 'game...
3 месяца, 1 неделя назад erwanlc
86
голосов
1
ответ
У меня есть файл паркета, который имеет простую файловую схему с несколькими столбцами. Я прочитал его в python, используя следующий код from fastparquet import ParquetFile pf = ParquetFile('inout_...
3 месяца, 1 неделя назад Reyhaneh
76
голосов
2
ответа
У меня есть dataframe, сформированный с пандами, как показано ниже: a b c d e f g h i j k l m n o 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 3 0 1 0 0 1 0 1 0 1 0 1 0 0 1 0 4 0...
3 месяца, 1 неделя назад S. Quon
55
голосов
3
ответа
У меня есть pandas DataFrame df . Я хочу заменить ↑ (пробел после ↑) на + и ↓ (пробел после ↓) с - . Например, df.a[0] (значения ↑ 0.69% ) заменить на +0.69% . df['last_month'] = df['last_month'].r...
3 месяца, 1 неделя назад running man
54
голоса
1
ответ
Цель и мотивация API MultiIndex с годами набирает популярность, однако не все в нем полностью понимается с точки зрения структуры, работы и связанных операций. Одна важная операция - фильтрация. Фи...
3 месяца, 1 неделя назад coldspeed
66
голосов
2
ответа
Я манипулирую DataFrame с помощью pandas, Python. Мои данные - 10000 (строки) X 20 (столбцы), и я это визуализирую, как это. df.hist(figsize=(150,150)) Однако, если я делаю figsize больше, каждый з...
3 месяца, 1 неделя назад jaykodeveloper
68
голосов
1
ответ
Мне нужно переслать ощущения данных в пределах определенной метки (где метка определена в другом столбце: LABEL | Col1 | ffil_col | ------------------------- 1 | N | female | 1 | M | | 2 | A | | 2 ...
3 месяца, 1 неделя назад Philipp_Kats
55
голосов
2
ответа
Я хочу получить значения столбца из DataFrame, который состоит из массивов. Используя DataFrame.values , возвращаемый dtype является объектом, то, что я хочу, является float64 . a=pd.DataFrame({'ve...
3 месяца, 1 неделя назад Hunger
103
голоса
1
ответ
Я пытаюсь создать столбец в фрейме данных, который содержит минимум столбца A (столбец значений), для которого столбец B (столбец id) имеет конкретное значение. Мой код очень медленный. Я ищу более...
3 месяца, 1 неделя назад nikosd
56
голосов
1
ответ
Вот копия того, как выглядит один из многих файлов txt. Class 1: Subject A: posX posY posZ x(%) y(%) 0 2 0 81 72 0 2 180 63 38 -1 -2 0 79 84 -1 -2 180 85 95 . . . . . Subject B: posX posY posZ x(%)...
3 месяца, 1 неделя назад user1504774
-4
голоса
1
ответ
У меня проблема с моим кодом, где он не включает все данные. У меня есть две формы excel с одинаковыми названиями столбцов D1 StartDateTime Model Currency Quantity 7/3/2018 13:35 1 US 3 7/3/2018 13...
3 месяца, 1 неделя назад user10146796
94
голоса
3
ответа
Я пытаюсь отформатировать вывод в ноутбуке IPython. Я попытался использовать функцию to_string, и это аккуратно позволяет мне исключить столбец индекса. Но текстовые данные правильно обоснованы. В ...
3 месяца, 1 неделя назад Fred Mitchell
56
голосов
1
ответ
У меня есть мультииндексированный файл данных pandas, созданный следующим образом: m_index = ['time_remaining', 'inventory'] for i in indicators: m_index.append(i.name) cols = [] for col in m_index...
3 месяца, 1 неделя назад Jason Clarkson
107
голосов
1
ответ
Для удобства чтения я пытаюсь использовать именованные переменные в своих булевых выражениях. Тем не менее, я продолжаю получать следующую ошибку: ValueError: The truth value of a Series is ambiguo...
3 месяца, 1 неделя назад j riot
86
голосов
2
ответа
У меня есть мой dataframe, как показано ниже: +--------------+--------------+----+-----+-------+ | x1 | x2 | km | gmm | class | +--------------+--------------+----+-----+-------+ | 180.9863129 | -0...
3 месяца, 1 неделя назад Jadu Sen
68
голосов
2
ответа
Я много искал, но не смог найти решение для этого конкретного случая. Я хочу удалить любые строки, содержащие менее 3 строк или элементов в списках. Мои проблемы будут более четко рассмотрены ниже....
3 месяца, 1 неделя назад Mo Houshmand
67
голосов
1
ответ
У меня есть pandas df со столбцом (скажем col3), содержащим число. Эти числа используются в нескольких строках, и я хочу, чтобы функция для строк каждого номера разделилась отдельно. Поэтому я кажд...
3 месяца, 1 неделя назад MaMo
78
голосов
1
ответ
Я пытаюсь выполнить следующее... У меня есть кадр данных Pandas, который содержит несколько записей, индексированных с помощью DatetimeIndex, который выглядит примерно так: bro_df.info() <class ...
3 месяца, 1 неделя назад Swedish Mike
67
голосов
1
ответ
Я пытаюсь объединить два DataFrames через их соответствующие ключи, но ключи могут встречаться несколько ( n ) раз в каждом DataFrame. Внутреннее объединение дает строки для всех n ^ 2 пар ключей -...
3 месяца, 1 неделя назад Samadin
78
голосов
1
ответ
У меня большой кадр данных панд, который читается как table . Я хотел бы рассчитать средства и стандартные отклонения двух разных групп: CRPS и Age , поэтому я могу построить их на графике штриха с...
3 месяца, 1 неделя назад florence-y
94
голоса
2
ответа
Я пытаюсь исключить строки из одного фрейма данных, которые также встречаются в другом фрейме данных: import pandas df = pandas.DataFrame({'A': ['Chr1', 'Chr1', 'Chr1','Chr1', 'Chr1', 'Chr1','Chr2'...
3 месяца, 1 неделя назад David Ries
76
голосов
2
ответа
У меня есть dataframe, как показано ниже (верхние 3 строки): Sample_Name Sample_ID Sample_Type IS Component_Name IS_Name Component_Group_Name Outlier_Reasons Actual_Concentration Area Height Retent...
3 месяца, 1 неделя назад kkhatri99
-4
голоса
4
ответа
Скажем, у меня есть DataFrame, который я получаю еженедельно, и хотел бы обновить трекер, который обновляется на основе еженедельного отчета, например: Это еженедельный отчет, который я получаю: ID...
3 месяца, 1 неделя назад sgerbhctim
55
голосов
1
ответ
Привет всем, поэтому у меня возникают проблемы с разбором информации из запроса, который я сделал в API Mapquest. Я пытаюсь проанализировать данные из моего столбца geocode_data и поместить их в от...
3 месяца, 1 неделя назад Gonzalo68
68
голосов
1
ответ
Я хотел бы применить следующую функцию к ряду dataframe: unicodedata.normalize('NFKD', c.lower().decode('utf-8')).encode('ascii','ignore') Я (вроде) понимаю, как я могу делать такие вещи, как db.cn...
3 месяца, 1 неделя назад Dervin Thunk
55
голосов
2
ответа
У меня есть два кадра данных, один содержит большую часть данных набора данных, а второй содержит некоторые дополнительные данные, которые я получил в более поздний момент времени. В приведенном ни...
3 месяца, 1 неделя назад Thanos
55
голосов
2
ответа
У меня есть 2 кадра данных pandas, каждый из которых имеет индекс с object dtype, и в обоих из них я вижу значение 533 . Однако, когда я присоединяюсь к ним, результат пуст, так как одним из них яв...
3 месяца, 1 неделя назад ihadanny
66
голосов
2
ответа
Мой dataframe - это одна строка с N столбцами: col1 col2 col3 col4 col5 col6 col7 col8 col9 0 NBA Mens Sports LAL Lakers BOS Celtics SAS Spurs Результат, который я ищу, - это новый dataframe, как п...
3 месяца, 1 неделя назад min2bro
68
голосов
1
ответ
У меня есть пара столбцов с суффиксом _id в CSV файле. Большинство из них являются целыми числами, но иногда они не имеют значения (NaN - пусто в CSV файле). Например, некоторые имена могут быть: И...
3 месяца, 1 неделя назад Martin Thoma
68
голосов
2
ответа
Как я могу эффективно находить совпадающие даты между многими диапазонами дат? У меня есть кадр данных панд, содержащий информацию о ежедневном складе многих продуктов. Есть только записи для тех д...
3 месяца, 1 неделя назад malte
67
голосов
2
ответа
Я новичок в python и pandas. Я пытаюсь добавить новый столбец в кадр данных (столбец группы) со значениями, основанными на частичной строке в другом столбце (столбце пользователя). Пользователи код...
3 месяца, 1 неделя назад svn
67
голосов
1
ответ
Привет, у меня есть фильтр "m", который достаточно гибкий, чтобы меня изменить. Иногда я хочу фильтровать Car или x_acft_body или любое другое поле и т.д. Иногда я хочу, чтобы все строки возвращали...
3 месяца, 1 неделя назад ihightower
115
голосов
1
ответ
Я пытаюсь сортировать фрейм данных pandas на основе значений из двух столбцов. По какой-то причине он обрабатывает целые числа как строки, а несколько кодов ранее этих значений по-прежнему являются...
3 месяца, 1 неделя назад everestial007
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема