Sklearn, CART , стандартных параметров, библиотеки Pandas, файла data.csv

С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".


Ответы (1 шт):

Автор решения: Beneviento
import pandas as pd
from sklearn.tree import DecisionTreeClassifier

# Загрузка данных из файла data.csv
data = pd.read_csv('data.csv')

# Разделение данных на атрибуты (X) и метки классов (y)
X = data.drop('C', axis=1)
y = data['C']

# Создание и обучение модели дерева классификации
model = DecisionTreeClassifier()
model.fit(X, y)

# Получение коэффициентов значимости атрибутов
feature_importances = model.feature_importances_

# Нахождение максимального коэффициента значимости
max_importance = max(feature_importances)

# Округление значения до 3 знаков после запятой
max_importance_rounded = round(max_importance, 3)

# Вывод максимального значения коэффициента
print(max_importance_rounded)

После загрузки данных, модель дерева классификации обучается, и затем вычисляются коэффициенты значимости атрибутов с использованием feature_importances_. Максимальное значение коэффициента округляется до трех знаков после запятой и выводится на экран.

→ Ссылка