Посчитать количество различных вкусов чипсов Doritos
Делаю задачу по анализу данных на pandas
Цель - посчитать количество различных вкусов чипсов Doritos
Моя основная проблема - в датасете есть указание размера упаковки чипсов => чипсы одного вкуса в разной упаковке уже считаются разными вкусами
Что хочется - убрать из NameExample размер упаковки чипсов и получить количество уникальных вкусов (еще бы взять Counter и найти самый частый вкус, но это чуть позже)
# попытался сначала фильтровать по id вкусы, но так не работает
import pandas as pd
import operator
from collections import Counter
def getTasteId(taste):
return taste.split('#')[0]
df = pd.read_csv('./products.tsv', sep='\t')
df_with_doritos = df[(df.Category == 'Doritos')]
df_with_doritos['TasteID'] = df_with_doritos['NameExample'].apply(getTasteId)
print(dict(Counter(df_with_doritos['TasteID'])))
Ссылка для скачивания датасета - https://dropmefiles.com/fMsGF