Статистическая аналитика датасетов

Кто-то знает что это означает в рамках pandas? В смысле задача стоит провести статистическую аналитику датасетов. Это значит надо вывести dtypes, describe просто и тп? Или что-то еще?


Ответы (1 шт):

Автор решения: passant

Это значит "Или что-то еще". Вы сами себе это задание придумали? Если нет, то перед тем, как его задать вам наверняка предварительно объяснили что это такое.

Но если вы проспали эти объяснения - то оказывается есть Гуугл, который дает ответ на любой вопрос. Например, что такое "Статистическая аналитика"

https://analytikaplus.ru/analiz-dannyh-statisticheskie-metody-issledovaniya/

https://corporatefinanceinstitute.com/resources/knowledge/other/descriptive-statistics/

https://ru.wikipedia.org/wiki/Описательная_статистика

и т.д.

А "рамках pandas" означает, что ваши данные должны быть изначально представлены (или преобразованы) в виде (скорее всего) DataFrame пакета Pandas. В рамках этого пакета есть очень много функций и методов, которые позволяют повести описательный статистический анализ данных без самостоятельного написания сложных скриптов. В том числе и метод describe(), но и не только он. Очевидно от вас и требуют представить ваш датасет в указанном виде а потом применить к нему эти самые методы. Я бы на места вашего преподавателя оценивал не то, как вы "просто выведете" нечто в консоль, но и как полно вы опишите данные вашего датафрейма с помощью имеющихся инструментов.

→ Ссылка