Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Логистическая регрессия phyton для чайника

cc Ученик (7), открыт 1 неделю назад
Добрый день,у меня есть наборы данных в виде excel файлов для которых мне нужно с помощью логистической регрессии и метода "случайный лес" сделать расчет вероятностей.
Я чайник и не владею языками программирования,можно ли как сделать расчеты с помощью готовых библиотек на github или jupiter ?чтобы просто указывать нужные параметры

файлы excel https://cloud.mail.ru/public/Mt8D/JTw6CtPjN
1 ответ
Gareas123 Профи (519) 1 неделю назад
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier

# Загрузка данных из Excel файла
data = pd.read_excel('путь_к_вашему_файлу.xlsx')

# Разделение данных на признаки и целевую переменную
X = data.drop('Целевая_переменная', axis=1)
y = data['Целевая_переменная']

# Разделение данных на обучающий и тестовый наборы
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание и обучение модели логистической регрессии
log_reg_model = LogisticRegression()
log_reg_model.fit(X_train, y_train)

# Получение вероятностей с помощью логистической регрессии
log_reg_probs = log_reg_model.predict_proba(X_test)[:, 1]

# Создание и обучение модели метода "случайный лес"
rf_model = RandomForestClassifier()
rf_model.fit(X_train, y_train)

# Получение вероятностей с помощью метода "случайный лес"
rf_probs = rf_model.predict_proba(X_test)[:, 1]
ccУченик (7) 1 неделю назад
спасибо за ответ,в какой среде лучше всего запустить ваш код?вместо целевой переменной мне нужно указать столбец где ее прописать в ексель(в ексель это AC)?вместо признака тоже столбцы екселя прописываю (y,z,aa,ab) ? и еще у меня в столбце AC 3 варинта исходя события (0,1,2) модель расчитывает вероятности каждого исхода или ей нужно указывать какой вариант мне нужен?
ccУченик (7) 1 неделю назад
# Разделение данных на признаки и целевую переменную
X = data.drop('Целевая_переменная', axis=1)
y = data['Целевая_переменная']

а где указывать признаки?в обоих строках кода целевая переменная
ccУченик (7) 1 неделю назад
можете дать свой контакт в любом месенджере. ошибки при запуске кода
Похожие вопросы