Работа с таблицей Python Pandas

Question

Помогите, пожалуйста, найти ошибку (ошибки)! Дана задача со следующим условием:

"В исходной таблице два столбца с названиями name и score. Напишите программный код, который преобразует исходную таблицу следующим образом: Необходимо удалить те строки, у которых отсутствуют данные в первом столбце (name). Отсутствующие значения во втором столбце (score) необходимо заменить средним по данному столбцу. Результат необходимо сохранить в файл output.csv . Используйте методы read_csv(), dropna(), fillna(), to_csv()."

Моё решение:

import pandas as pd
df = pd.read_csv('input.csv')
df = df.dropna(subset=['name'])
mean_score = df['score'].mean()
df['score'] = df['score'].fillna(mean_score)
df.to_csv('output.csv', index=False)

Answer 1

Взял случайные данные

edgomessilva    345
oyejhon     654
esales  456
emily   456
floid   345
Donyendro   654
Super
Puper
    123
    345
    456

Добавил разделитель и заголовки

df = pd.read_csv('input.csv',delimiter='\t', names=['name','score'])

ваш код работает

            name  score
0  edgomessilva    345.0
1        oyejhon   654.0
2         esales   456.0
3          emily   456.0
4          floid   345.0
5      Donyendro   654.0
6           Super  485.0
7           Puper  485.0

Может у вас данные не корректные. Покажите исходные данные в текстовом виде.

БЛОГ НА HUSL

Работа с таблицей Python Pandas

Ответы (1 шт):