혼공학습단/혼자 공부하는 머신러닝+딥러닝

[혼공학습단 10기] 2주차 미션 : Chapter 03

so0_0 2023. 7. 16. 20:58

1주차 미션 우수혼공족이 되서 기분 좋은 한 주를 보낼 수 있었습니다!!! 혼공족장님 감사합니다~!

2주차 과제를 풀기 위해 chapter 03을 열심히 공부했습니다~

 

2주차 미션은 무엇일까요?

[기본 미션]
Ch.03(03-1) 2번 문제 출력 그래프 인증하기
[선택 미션]
모델 파라미터에 대해 설명하기

[기본 미션]


Ch.03(03-1) 2번 문제 출력 그래프 인증하기

코랩을 활용하여 Chapter 03-1의 2번 문제에 대한 실습 화면을 캡처했습니다!

1. 실습을 위해 필요한 라이브러리를 임포트합니다.

  • 넘파이(numpy): 배열 만들기
  • 사이킷런(sklearn): 머신러닝 모델
  • 맷플롯립(matplotlib): 산점도 그리기

2. 데이터를 준비합니다.

농어의 길이(perch_length)를 특성, 농어의 무게(perch_weight)를 타깃으로 하여 농어의 길이를 통해 무게를 예측하는 모델을 만들어 보려고 합니다.

3. 농어 데이터를 훈련 세트(train_input, train_target)와 테스트 세트(test_input, test_target)로 나누어 줍니다.

4. 1차원 배열을 2차원 배열로 바꿔줍니다.

5. k-최근접 이웃 회귀 알고리즘 객체를 생성합니다. 농어의 길이인 x좌표를 만들고 예측에 활용합니다.

6. n_neighbors 매개변수를 통해 이웃의 개수를 지정할 수 있습니다. n_neighbors 매개변수를 1, 5, 10으로 지정해 봅니다. n=1, 5, 10일 때 k-최근접 이웃 회귀 알고리즘을 훈련하고, 농어의 길이에 대한 예측값을 그래프로 그려봅니다.

  • n_neighbors=1 일 때

  • n_neighbors=5 일 때

  • n_neighbors=10 일 때

  • 과대적합: 훈련 세트에서 점수가 굉장히 좋았는데 테스트 세트에서는 점수가 굉장히 나쁜 경우 - 모델이 훈련 세트에 과대적합되었다
  • 과소적합: 훈련 세트보다 테스트 세트의 점수가 높거나 두 점수가 모두 너무 낮은 경우 - 모델이 훈련세트에 과소적합되었다

[선택 미션]


모델 파라미터에 대해 설명하기

모델 파라미터란?

  • 머신러닝 모델이 특성(feature)에서 학습한 파라미터입니다.
  • 예) LinearRegression 클래스의 coef_와 intercept_는 모델 파라미터입니다.
    • coef_: 계수(coefficient)
    • intercept_: 가중치(weight)
  • 모델 기반 학습: 머신러닝 알고리즘은 훈련 과정을 통해 최적의 모델 파라미터를 찾습니다.
  • 사례 기반 학습: k-최근접 이웃은 모델 파라미터가 없습니다.

다음 주는 "Chapter 04. 다양한 분류 알고리즘"에 대해 공부할 예정입니다. 다음 주에 또 만나요^_^


출처: 한빛미디어, 혼자 공부하는 머신러닝+딥러닝