используя pivot_table() для создания столбцов из повторяющихся строк

63
6

Привет всем новичка здесь.

У меня есть panda df с столбцом времени, столбцом id и столбцом, содержащим множество строк, разделенных запятыми, которые иногда повторяются, например

id | Date        | interest
-------------------------
1 | 2016-01-01 | Economic and Financial Affairs, Competition
2 | 2017-05-17 | Energy, Environment
3 | 2017-04-26 | Economic and Financial Affairs, Taxation
4 | 2017-04-21 | Energy, Taxation
5 | 2017-05-10 | Competition, Environment

Я пытаюсь найти способ использования.pivot_tables(), чтобы установить даты как индекс и разные строки, разделенные запятой, в качестве столбцов, подсчитывающих их частоту, чтобы их отобразить.

Желаемый результат:

Date | Econ. and Fin. Affairs| Competition | Energy
----- ------------------- ----------- ------
2016-01-01 | 1 | 1 | 0
2017-05-17 | 0 | 0 | 1
2017-04-26 | 1 | 0 | 0
2017-04-21 | 0 | 0 | 1

И так далее, и так далее.

Спасибо за ваше время

спросил(а) 2021-01-25T17:01:31+03:00 5 месяцев назад
1
Решение
108

df.set_index('Date').interest.str.get_dummies(sep=', ')

ответил(а) 2021-01-25T17:01:31+03:00 5 месяцев назад
Ваш ответ
Введите минимум 50 символов
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема