'coding' 카테고리의 글 목록 (5 Page)

[머신러닝]당뇨병 분류하는 모델

Import 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sb 1. 데이터 확인 컬럼 정보 : Preg=no. of pregnancy Plas=Plasma Pres=blood pressure skin=skin thickness test=insulin test mass=body mass pedi=diabetes pedigree function age=age class=target(diabetes of not, 1:diabetic, 0:not diabetic) 데이터에서 Null데이터는 존재하지 않았지만 (혈압이 0인 사람, 피부두께가 0인사람은 존재하지 않는다.. 상식적으로) 0인 ..

coding/머신러닝 2021. 5. 20. 12:29

[머신러닝]KNN 구매여부 확인

Import 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt 1. 학습 데이터 확인 데이터 크기의 편차가 심해 스케일링과 널데이터는 없지만 학습에 필요없는 데이터를 처리할 것이다. purchased -> 1 구매, 0 구매안함 2. 데이터 전처리 학습데이터 분리 X 는 age와 연봉으로 y 는 구매여부로 놔둠 스케일링 from sklearn.preprocessing import StandardScaler sc = StandardScaler() X = sc.fit_transform(X) traing, test 셋 분리 from sklearn.model_selection import train_test_split X_t..

coding/머신러닝 2021. 5. 19. 22:00

[리눅스] WiringPi의 readall 확인법

이 책 너무 오래전에 출판이 되서 그런가? 오류가 많이 잦은것 같다ㅠ 4장에 들어있는 내용대로 하는것보다 인터넷으로 많은 것을 찾아보고 적용해야하는 경우가 많아.. 생각보다 시간이 많이 걸렸다. 책에 나와있는대로 gpio를 다루기위해 WiringPi를 클론(다운로드)하고 파이썬 파일을 작성하고 실행을 하면 전구가 깜빡거려야하지만... 파일은 오류없이 진행이 되나 전구가 깜빡이지 않아.. 당황했다. 우리조가 잘못 작성하긴 했지만.. 그래도! 하지만 인터넷의 도움을 받아 성공할 수 있었다. 보통 WiringPi는 C언어를 위한 라이브러리라고 말하는데.. 파이썬에서 사용이 가능한 WiringPi2라이브러리가 있다!! https://github.com/Gadgetoid/WiringPi2-Python Wiring..

coding/리눅스 2021. 5. 19. 21:30

[머신러닝]KNN(K-Nearest Neighbor)

KNN K-Nearest Neighbor 이름에서 알수 있듯 가까운 이웃을 확인하여 분류를 하는 classification이다. 다음처럼 카테고리가 레이블링이 되어 있는데이터가 주어졌을 때 새로운 데이터가 들어갔을 때 어떤 데이터로 분류해야 할까? KNN은 내 주위에 K개의 이웃을 확인해 보고 결정한다. 1. 새로운 데이터가 발생 시, Euclidean 거리에 의해서, 가장 가까운 K 개의 이웃의 라벨을 확인한다. 2. 많은 수의 라벨로 새로운 데이터를 분류를 한다 . K의 갯수는 항상 홀수가 좋다. K의 범위에 따라 성능이 좌지우지할 수 있다.

coding/머신러닝 2021. 5. 19. 20:44

[머신러닝]Logistic Regression 구매여부 확인

import import numpy as np import matplotlib.pyplot as plt import pandas as pd 데이터 확인 나이와 연봉으로 분석해서, 물건을 구매할지 안할지를 분류하자 데이터 전처리 나이와 연봉으로 데이터를 학습시키기위해 데이터를 분리하였다. X = df.iloc[:, 2:3+1] y = df.Purchased 1. 스케일링 데이터의 크기를 맞춰주기 위해 정규화 하였다. from sklearn.preprocessing import StandardScaler sc = StandardScaler() X=sc.fit_transform(X) 2. test, traing 셋 분리 from sklearn.model_selection import train_test_spl..

coding/머신러닝 2021. 5. 17. 12:59

[머신러닝]Logistic Regression

2가지로 분류하기 Logistic Regression 이메일 클릭을 할 사람과 안할 사람으로 분류하여 그래프로 나타내기 나이에 따라 이메일을 클릭을 한 사람을 1, 안한 사람을 0으로 바꾸고 그래프를 그려 데이터를 나타낼 때 빨간점인 데이터를 따라 선을 그리면 요러한 모습을 가지게 되는데 sigmoid함수를 이용하여 그래프를 나타낼 수 있다. 위와 같은 식을 가진 regression 을, Logistic Regression이라 한다. 이제 우리는, 이를 가지고 두개의 클래스로 분류할 수 있다. ( 클릭을 한다, 안한다 두개로.) 확률로 나타낼 수 있게 되었다.( p는 확률값을 나타낸다.) 클릭할 확률 20대는 0.7% 30대는 23% 40대는 85% 50대는 99.4% 기준점을 두게되면 클릭을 할지 안할..

coding/머신러닝 2021. 5. 17. 12:29

[머신러닝] Label Encoding / One-Hot Encoding

데이터 전처리 과정으로 위의 데이터 처럼 학습 시킬 데이터에 문자가 들어오게 되면 컴퓨터는 문자를 인식하지 못하기 때문에 카테고리로 판단되는 데이터는, 숫자로 바꿔줄 수 있다. 1. Label Enconding 말그대로 문자열을 ABC 순서대로 라벨링을 해주는 작업을 말한다. from sklearn.preprocessing import LabelEncoder label_X = LabelEncoder() X['Country']=label_X.fit_transform(X['Country']) Country 부분이 0, 1, 2로 라벨링이 되어 있는 모습을 볼수 있다. 2. One-Hot Encoding onehot encoding은 0과 1로 문자열의 컬럼에 표시하는 방식이다. from sklearn.com..

coding/머신러닝 2021. 5. 17. 11:52

[머신러닝]Multiple Linear Regression

여러 변수가 올때 linear Regression구하는 식 Import import numpy as np import matplotlib.pyplot as plt import pandas as pd 학습 데이터 확인하기 데이터에 null데이터가 없다는 것을 확인했다. 인덱스 3의 State는 문자열로 되어있으므로 onehot인코딩을 써야한다. 숫자로 되어있는 데이터들의 크기가 들쑥날쑥하다. 학습데이터 전처리 1. 내가 예측하고 싶은 부분은 Profit이므로 y로 넣어주고 나머지는 X X = df.iloc[:,:3+1] y = df.Profit 2. 문자열을 One-Hot 인코딩 from sklearn.compose import ColumnTransformer from sklearn.preprocessin..

coding/머신러닝 2021. 5. 17. 11:05

gold_honeybadger

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

coding

추가 정보

인기글

최신글

페이징

티스토리툴바