Найти все повторяющиеся значения в csv-файле с помощью dask

Автор вопроса: jiezzzzzzzzz

Использую dask для чтения большого (4 гб) csv-файла. Нужно найти в нем все одинаковые значения в одной из колонок. В pandas для этого есть duplicted(), а в dask нет ничего. Как можно реализовать такую функцию?

Источник

БЛОГ НА HUSL

Найти все повторяющиеся значения в csv-файле с помощью dask

Ответы (0 шт):