刚好学校的机器学习报告需要自己训练这一两天弄一弄
利用上次学习到的观念还有之前对于pandas操作 将数据整理好
#加载数据
data = pd.read_csv(\'sleep and psychological effects.csv\')
#对label进行编码
label_encoder = LabelEncoder()
data[\'Mood_Impact\'] = label_encoder.fit_transform(data[\'Mood_Impact\'])
#对特徵值转成One-Hot编码
categorical_columns = [\'Gender\', \'Favorite_Book_Genre\']
data = pd.get_dummies(data, columns=categorical_columns, drop_first=True)
#定义特徵和目标变量
X = data.drop(columns=[\'User_ID\', \'Mood_Impact\'])
y = data[\'Mood_Impact\']
#将数据分为测试集和训练集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)
今天先把针对数据的地方做完:)