본문 바로가기

NAVER Boostcamp AI Tech5

Day 5. 이진 분류(Binary Classification) 이진 분류 모델주어진 트레이닝 데이터를 사용하여 특징 변수와 목표 변수(두 가지 범주) 사이의 관계를 학습하고, 이를 바탕으로 트레이닝 데이터에 포함되지 않은 새로운 데이터를 사전에 정의된 두 가지 범주 중 하나로 분류하는 모델을 구축하는 과정​1. 데이터 전처리# Donwload dataset from kaggle!kaggle datasets download -d uciml/iris# unzip zip file!unzip iris.zip# 트레이닝 데이터 불러오기import pandas as pddf = pd.read_csv("Iris.csv", sep = ",", header = 0)[["PetalLengthCm", "Species"]]# Iris_data 데이터프레임에서 Species 열의 값이 s.. 2024. 8. 25.
Day 4. 선형 회귀(Linear Regression) 선형 회귀 모델선형 회귀란주어진 트레이닝 데이터를 사용하여 특징 변수와 목표 변수 사이의 선형 관계를 분석하고, 이를 바탕으로 모델을 학습시켜 트레이닝 데이터에 포함되지 않은 새로운 데이터의 결과를 연속적인 숫자 값으로 예측하는 과정선형 회귀 모델에서의 학습이란 주어진 트레이닝 데이터의 특성을 가장 잘 표현할 수 있는 직선 𝑦 = 𝑤𝑥 + 𝑏의 기울기(가중치) 𝑤와 𝑦절편(바이어스) 𝑏를 찾는 과정 을 말한다.오차 : 목표 변수 t와 예측 변수 y의 차이(t-y) 오차의 총합이 최소가 되도록 하는 가중치 𝑤와 바이어스 𝑏를 찾아야 함손실 함수 : 목표 변수와 예측 변수 간의 차이(오차)를 측정하는 함수평균 제곱 오차(MSE) : 오차를 제곱하여 모든 오차를 양수로 변환한 후 더하는 방식신.. 2024. 8. 25.
Day 3. Tensor 연산 및 심화 Tensor들 간의 연결 : cat() 함수b = torch.tensor([[0, 1], [2, 3]])c = torch.tensor([[4, 5]])dim = 0을 기준으로 b와 c 연결d = torch.cat((b, c)) → d = [[0, 1], [2, 3], [4, 5]]dim = 1을 기준으로 b와 c 연결dim = 1을 기준으로 했을 때 b와 c의 크기가 다르므로 reshape 필요e = torch.cat((b, c.reshape(2, 1), 1) → e = [[0, 1, 4], [2, 3, 5]]​Tensor의 크기 확장 : expand(), repeat() 메서드expand() : 주어진 Tensor의 차원 중 일부의 크기가 1일 때, 해당 차원의 크기를 확장 f = torch.tenso.. 2024. 8. 25.
Day 2. Tensor 생성과 조작 Tensor의 생성0과 1로 초기화된 Tensor의 생성0으로 초기화된 Tensor 생성 길이가 5인 1-D Tensor : a = torch.zeros(5)크기가 2x3인 2-D Tensor : b = torch.zeros([2, 3])크기가 3x2x4인 3-D Tensor : c = torch.zeros([3, 2, 4])1으로 초기화된 Tensor 생성 길이가 3인 1-D Tensor : d = torch.ones(3)크기가 3x2인 2-D Tensor : e = torch.ones([3, 2])크기가 3x2x3인 3-D Tensor : f = torch.ones([3, 2, 3])크기와 자료형이 같은 Tensor로 변환 0으로 초기화 : g = torch.zeros_like(e)1로 초기화 : h.. 2024. 8. 25.