'데이터분석' 카테고리의 글 목록 (10 Page)

back propagation을 이용하여 회귀식 개선하기 #loss #cost

1. loss 이용 2. cost 이용 3. 차이(1) 정의(2) 적용

데이터분석/딥러닝 2020.08.05

시작값이 y=1/2x인 직선을, 타겟함수 y=2x로 만들기. 1. x,y=(10,20)일때의 loss함수를 구하고 loss함수의 미분값을 구한다. 2. 미분계수 L'(⍬)는 음수이므로 최종적으로 원래 세타값 1/2에 a*300이 더해지면서 기울기가 개선된다.

데이터분석/딥러닝 2020.08.03

회귀분석의 종류 #logistic#multi variable#single variable

1. 로지스틱 회귀(Logistic regression) * 회귀분석식을 구하고 활성함수로 한번 변환 2. 단순 선형 회귀(single variable linear regression) * 변수가 한개 3. 다중 선형회귀(Multi variable linear regression) * 변수가 여러개 4. 다항 회귀(polynomial regression) * 변수가 다차원

데이터분석/분석-지도학습 2020.08.02

loss function와 cost function 차이

1. loss function하나의 데이터에 대한 실제값(y)과 예측값(y-hat)의 차이 2. cost function전체 데이터의 오차, Loss function의 평균

데이터분석/딥러닝 2020.08.02

자코비안 메트릭스

미분을 하는데 네가지 경우가 있다. 1. 스칼라함수를 스칼라변수로 미분하는경우2. 스칼라함수를 벡터변수로 미분하는경우3. 벡터함수를 스칼라변수로 미분하는경우 4. 벡터함수를 벡터변수로 미분하는경우행이 함수, 열이 변수를 나타낸다. 즉 1행 1열은 1번째함수를 1번째 변수로 편미분한값2행 1열은 2번째함수를 1번째 변수로 편미분한값,1행 2열은 1번쨰 함수를 2번째 변수로 편미분한 값을 뜻한다. * 출처 강의 : 패스트캠퍼스 - 수학적으로 접근하는 딥러닝논문 : https://arxiv.org/pdf/1802.01528.pdf

데이터분석/딥러닝 2020.08.01

퍼셉트론 구현

1. 외출여부 판단 퍼셉트론 함수# 1. 신호의 총합과 외출 여부를 반환하는 Perceptron 함수를 완성하세요.def Perceptron(x_1,x_2,w_1,w_2): # bias는 외출을 좋아하는 정도로 -1로 설정되어 있습니다. bias = -1 # 입력 받은 값과 편향(bias)값을 이용하여 신호의 총합을 구하세요. output = w_1*x_1+w_2*x_2+bias # 지시한 Activation 함수를 참고하여 외출 여부(0 or 1)를 설정하세요. # 외출 안한다 : 0 / 외출 한다 : 1 if output>0: y = 1 else: y=0 return output, y # 값을..

데이터분석/딥러닝 2020.07.06

차원축소후 k-means 클러스터링

1. 차원축소하기(pca) : 여러가지 att가 존재할 때 내가 원하는만큼 차원을 축소 # [차원축소하기 PCA] import sklearn.decomposition import matplotlib.pyplot as plt import numpy as np def main(): X, attributes = input_data() pca_array = normalize(X) pca, pca_array = run_PCA(X, 2) visualize_2d_wine(pca_array) def input_data(): f = open("data/attributes.txt", 'r') attributes = [] while True: line = f.readline().strip("\n") if not line: ..

데이터분석/분석-비지도학습 2020.07.05

하드클러스터링과 스프트클러스터링

1. 하드 클러스터링 : 하나의 데이터가 정확히 하나의 군집에 할당하는 것 -> hierarchical clustering, k-means, dbscan, optics 2. 소프트 클러스터링 : 하나의 데이터가 다수의 군집에 할당하는 것 -> topic models, fcm, soft k-means

데이터분석/분석-비지도학습 2020.07.05

추론및 가설검정

1. 이항분포 # [이항분포] import numpy as np import matplotlib.pyplot as plt import scipy as sp from scipy import stats # 이항분포 생성 n, p = 10, 0.3 stat_bin = sp.stats.binom(n, p) # 그리기 fig, ax = plt.subplots() #확률밀도함수 x_axis = np.arange(n + 1) plt.bar(x_axis, stat_bin.pmf(x_axis)) plt.show() fig.savefig("pmf_plot.png") #확률질량함수 x_axis = np.arange(n + 1) plt.bar(x_axis, stat_bin.cdf(x_axis)) plt.show() fig.s..

데이터분석/통계 2020.07.04

확률

# [중복 순열] from itertools import product from itertools import combinations_with_replacement # 중복순열 re_per = list(product(['A', 'B','C','D','E'], repeat = 3)) re_per_num = len(re_per) print(re_per) print(re_per_num) # [중복 조합] from itertools import product from itertools import combinations_with_replacement # 중복조합 re_com = list(combinations_with_replacement(['A','B','C','D','E'], 3)) re_com_num = ..

데이터분석/통계 2020.07.03

통계 자료 요약

# [백분위수 구하기] from statistics import variance, stdev import numpy as np coffee = np.array([202,177,121,148,89,121,137,158]) #백분위수 cf_quant_20 = np.percentile(coffee, 20) cf_quant_80 = np.percentile(coffee, 80) print("20 Quantiles : ", cf_quant_20 ) print("80 Quantiles : ", cf_quant_80 ) #IQR q75, q25 = np.percentile(coffee, [75, 25]) cf_IQR = q75-q25 print("Inter quartile range:",cf_IQR) 20 Quant..

데이터분석/통계 2020.07.03

데이터 시각화 (그래프 그리기)#pandas#numpy

# [도수분포표] import pandas as pd import numpy as np # drink 데이터 drink = pd.read_csv("drink.csv") # 전체 참석 횟수를 확인하는 도수분포표 drink_tab = pd.crosstab(index = drink["Attend"], columns = "count") print("전체 참석 횟수를 확인하는 도수분포표") print(drink_tab) #누가 몇 번 참석했는지 알 수 있는 도수분포표 drink_who = pd.crosstab(index = drink["Attend"], columns = drink["Name"]) print("누가 몇 번 참석했는지 알 수 있는 도수분포표") print(drink_who) # [원형 그래프] im..

데이터분석/시각화 2020.07.02

자료의 형태

1. 수치형 자료 : 실수로 측정이 가능한 자료형 (키, 몸무게, 시험점수, 나이) (1) 연속형 자료 : 원주율, 시간, 키, 몸무게 등.. (2) 이산형 자료 : 시험점수, 나이, 동영상 조횟수 등.. 2. 범주형 자료 (1) 명목형 척도(nominal) : 구분할 수 있는 척도 (ex 혈액형, 성별) (2) 서열 척도 (ordinal) : 순서 관계를 밝혀주는 척도 (등수, 직위, 학력) (3) 등간 척도 (interval) : 덧셈 뺄셈이 가능한 척도, 배는 불가능 (섭씨 화씨온도, 시간) (4) 비율척도 (ratio): 비율로도 계산이 가능한 척도 (절대온도, 성적, 키, 무게, 인구수, 길이 수량 등등)

데이터분석/통계 2020.07.02

나이브베이즈 분류 #나이브 베이즈#확률통계

1. 나이브 베이즈 확률 def main(): sensitivity = float(input()) prior_prob = float(input()) false_alarm = float(input()) print("%.2lf%%" % (100 * mammogram_test(sensitivity, prior_prob, false_alarm))) def mammogram_test(sensitivity, prior_prob, false_alarm): p_a1_b1 = sensitivity # p(A = 1 | B = 1) p_b1 = prior_prob # p(B = 1) p_b0 = 1-prior_prob # p(B = 0) p_a1_b0 = false_alarm # p(A = 1|B = 0) p_a1 = p..

데이터분석/분석-지도학습 2020.06.30

회귀분석 #사이킷런#넘파이#numpy#scikit-learn

1. 점찍기 x,y점들을 matplot라이브러리를 이용하여 점찍기 # [점그리기] import matplotlib.pyplot as plt import numpy as np # 1. x,y값 X = [8.70153760, 3.90825773, 1.89362433, 3.28730045, 7.39333004, 2.98984649, 2.25757240, 9.84450732, 9.94589513, 5.48321616] Y = [5.64413093, 3.75876583, 3.87233310, 4.40990425, 6.43845020, 4.02827829, 2.26105955, 7.15768995, 6.29097441, 5.19692852] plt.scatter(X, Y) # (x, y) 점그리기 plt.show(..

데이터분석/분석-지도학습 2020.06.28

[RNN] LSTM으로 감성분석

1. tensorflow kerasimport tensorflow as tffrom tensorflow.keras import layersfrom tensorflow.keras.datasets import imdbfrom tensorflow.keras.preprocessing import sequence 2. 최대 단어 개수와 길이# 최대 단어의 개수max_features = 10000 # 최대 단어 길이 (한번의 인풋당 들어갈 단어의 수)maxlen = 200 # num_word : 빈도가 높은 상위 max_features개 단어만 사용함.# skip_top : 빈도가 높은 상위 단어 0개 제외(input_train, y_train), (input_test, y_test) = imdb.load_da..

데이터분석/딥러닝 2020.06.27

RNN종류

(1) vanilla mode : input, output 사이즈 조절, image classification(2) sequence output ex) image captioning : 이미지를 하나 받고 그에 대한 설명 등(3) sentiment outputex) sentiment analysis : 문장이 주어지고 그에 대한 긍정, 부정 판별(4) sequene input and sequece output ex) machine traslation : 번역(5) synced sequence input and outputex) 비디오 해석

데이터분석/딥러닝 2020.06.27

RNN 과정

데이터분석/딥러닝 2020.06.27

데이터분석 203

티스토리툴바

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28