Поиск одинаковых дат в дублях

Получил DataFrame с дубликатами:

Дата Заявка Ответственный
05.06.2024 3450 Иванов
12.07.2024 3450 Иванов
08.05.2024 1578 Иванов
08.05.2024 1578 Иванов
05.06.2024 3450 Власов
12.07.2024 3450 Власов
10.11.2024 2190 Егоров
10.11.2024 2190 Егоров

Как мне получить строки где даты одинаковы?

Дата Заявка Ответственный
08.05.2024 1578 Иванов
08.05.2024 1578 Иванов
10.11.2024 2190 Егоров
10.11.2024 2190 Егоров

И оставить только по 1 строке?

Дата Заявка Ответственный
08.05.2024 1578 Иванов
10.11.2024 2190 Егоров

Ответы (1 шт):

Автор решения: CrazyElf

Легко:

df_dup = df[df.duplicated()]

Если дубликаты нужно считать не по всем полям, и нужно оставить не первую запись, а последнюю, можно сделать так:

subset=('Заявка', 'Ответственный')
df = pd.read_csv(StringIO(data), sep='\t')
df = df[df.duplicated(subset=subset)]
df = df.drop_duplicates(subset=subset, keep='last')
df
→ Ссылка