본문 바로가기

인공지능(AI) 공부

(6)
[혼공머신] 02-2. 데이터 전처리 도미 데이터 15개, 빙어 데이터 14개를 준비하고 도미와 빙어 데이터를 하나의 데이터로 합친다. 넘파이의 column_stack 함수는 전달받은 리스트를 일렬로 세운 다음 차례대로 나란히 연결하는 함수이다. 예를 들어 np.coloum_stack(([1,2,3], [4,5,6]))이라면 결과는 [[1,4], [2,5], [3,6]]이다. 넘파이의 column_stack 함수를 사용하여 생선 데이터 리스트를 일렬로 세운 다음 차례대로 나란히 연결하여 생선의 길이 데이터와 생선의 무게 데이터를 나란히 붙인다. 넘파이의 ones 함수와 zeros 함수는 각각 원하는 개수의 1과 0을 채운 배열을 만들어주는 함수이다. 넘파이의 concatenate 함수는 배열 2개를 나란히 합치는 함수이다. 넘파이의 ones..
[혼공머신] 02-1. 훈련 세트와 테스트 세트 머신러닝 알고리즘은 크게 지도 학습, 비지도 학습으로 나눌 수 있다. 지도 학습은 인간이 컴퓨터에게 데이터(문제)와 답(타깃)을 넘겨주고 관련된 규칙성을 찾아내도록 하는 학습 방법이다. 비지도 학습은 인간이 컴퓨터에게 데이터(문제)만 넘겨주고 컴퓨터가 알아서 데이터의 특성에 따라 분류하는 학습 방법이다. 지도 학습에서는 데이터와 정답을 입력(input), 타깃(target)이라고 하고, 이 둘을 합쳐 훈련 데이터라고 부른다. 머신러닝 알고리즘의 성능을 제대로 평가하려면 훈련 데이터와 평가에 사용할 데이터가 각각 달라야 한다. 평가를 위해서 다른 데이터를 준비하거나 이미 준비된 데이터 중에서 일부를 떼어 내어 활용하는데 후자의 경우를 더 많이 사용한다. 평가에 사용할 데이터를 테스트 세트, 훈련에 사용되는..
[혼공머신] 01-3. 마켓과 머신러닝 생선 이름을 자동으로 알려주는 머신러닝 프로그램 만들기 먼저 도미 데이터(길이, 무게) 15개를 준비한다.matplotlib의 pylot함수를 사용하여 도미 데이터의 산점도를 그려본다. 다음으로 빙어 데이터(길이, 무게) 14개를 준비한다. 전체적인 데이터의 분포를 알기 위해서 도미와 빙어 데이터의 산점도를 그려본다. 도미와 빙어의 길이 데이터를 리스트 length 변수에, 도미와 빙어의 무게 데이터를 리스트 weight 변수에 넣어준다. 여기서 우리가 사용하는 머신러닝 패키지가 사이킷런인데, 사이킷런은 2차원 리스트로 만들어 데이터를 처리한다. 그러므로 zip 함수와 리스트 내포 구문을 사용하여 length와 weight 리스트를 2차원 배열로 만들어 fish_data를 생성한다. fish_data에 ..
1주차_Google Drive 연동 파일 선택을 눌러 파일을 선택하면 uploaded변수에 들어가게 된다. 해당 URL을 누르면, 액세스 정보에 대한 내용이 나온다. 밑에 있는 허용을 누르면, 코드가 나오는데 이를 복사해서, Enter your authorization code: 부분에 넣어준다. 그러면, gdrive가 코드와 연동이 된 것을 확인할 수 있다. 이 코드를 실행하면, 결과는 나오지 않는다. 내 Google drive를 확인해보면, sample.csv파일이 생성되었다는 것을 확인할 수 있다. sample.csv파일을 열어보면, 랜덤으로 숫자가 삽입된 2차원 배열이 만들어져서 저장이 되었다.
1주차_Colab 기본 기능 확인 텐서플로우는 기본적으로 파이썬을 사용한다. 셀로 구분되어 있지만 순차적으로 같은 변수, 같은 값으로 진행을 하면 위에 있는 값을 받아서 밑에 있는 셀을 실행한다. matplotlib 파이썬 안에서 차트나 그래프를 시각화해주는 라이브러리 많이 쓰이는 라이브러리임으로 알아두는 것이 좋다
1주차_Colab 사양 확인