Посчитать количество различных вкусов чипсов Doritos

Делаю задачу по анализу данных на pandas

Цель - посчитать количество различных вкусов чипсов Doritos

Моя основная проблема - в датасете есть указание размера упаковки чипсов => чипсы одного вкуса в разной упаковке уже считаются разными вкусами

Что хочется - убрать из NameExample размер упаковки чипсов и получить количество уникальных вкусов (еще бы взять Counter и найти самый частый вкус, но это чуть позже)

# попытался сначала фильтровать по id вкусы, но так не работает
import pandas as pd
import operator
from collections import Counter

def getTasteId(taste):
  return taste.split('#')[0]

df = pd.read_csv('./products.tsv', sep='\t')
df_with_doritos = df[(df.Category == 'Doritos')]
df_with_doritos['TasteID'] = df_with_doritos['NameExample'].apply(getTasteId)
print(dict(Counter(df_with_doritos['TasteID'])))

Ссылка для скачивания датасета - https://dropmefiles.com/fMsGF


Ответы (0 шт):