오답 노트/머신러닝 5

.set_index 메서드와 .reset_index메서드

1)set_index 메서드 열의 label 혹은 열 레이블의 리스트를 입력받는다. set_index 메서드 사용방법 DataFrame.set_index(keys, drop=True, append=False, inplace=False) drop은 인덱스로 세팅한 열을 DataFrame내에서 삭제할지 여부를 결정한다. (선택적 입력 가능) append는 기존에 존재하던 인덱스를 삭제할지 여부를 결정한다. (선택적 입력 가능) inplace는 원본 객체를 변경할지 여부를 결정한다. (선택적 입력 가능) # pandas와 numpy의 import In[2]: import pandas as pd In[3]: import numpy as np # 예제용 배열 선언 In[9]: ex_df=pd.DataFrame([..

딥러닝 -자연어 처리

1.손실 함수(Loss function) 실제값 - 예측값의 차이를 수치화 해주는 함수. 오차가 클수로 ㄱ손실함수의 값은 크고 오차가 작을수록 손실 함수의 값은 작아짐. 회귀에서는 평균 제곱 오차, 분류문제에서는 크로스 엔트로피를 주로 손실함수로 사용한다. 손실 함수의 값을 줄여나가면서 학습하는 방법은 어떤 옵티마이저를 사용하느냐에 따라 달라진다. 여기서 배치(Batch)라는 개념에 대한 이해가 필요하다. 배치는 가중치 등의 매개변수의 값을 조정하기 위해 사용하는 데이터의 양을 말한다. 전체 데이터를 가지고 매개 변수의 값을 조정할 수도 있고 정해준 양의 데이터만 가지고도 매개 변수의 값을 조정할 수 있다. 1) 배치 경사 하강법(Batch Gradient Descent) 배치 경사 하강법(Batch G..

훈련데이터셋 나누기(fit.train_test_split()): 각 parameter들의 의미

전제 조건 1.테스트 세트보다 훈련 세트가 더 많아야 함 2.훈련 데이터 세트를 나누기 전에 골고루 섞어야 한다 골고루 섞이기 위해 필요한 함수 ▼ #골고루 섞이게 만들려면 나와야 하는 함수 np.random.seed(42) index = np.arange(49) np.random.shuffle(index) How? # 훈련데이터 세트 세팅 from sklearn.datasets import load_breast_cancer cancer = load_breast_cancer() x = cancer.data y = cancer.target # 훈련데이터 세트 분할 from sklearn.model_selection import train_test_split x_train, x_test, y_train, y..