머신러닝 썸네일형 리스트형 [머신러닝] 6개 assay에 대한 모델을 한번에 만들기 위해 for문 안에 모델 fit 함수를 쓰고 score를 예측하면 수월하게 실행이 안된다. ac50 classification 모델을 만드는 중 6개 assay에 대해서 각각 model1(SVM poly), model2(SVM RBF), model3(RF) 로 학습을 시키고 test set에 대한 결과를 얻어내기 위해 다음과 같이 코드를 짰다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 from sklearn.svm import SVC from sklearn.ensemble import RandomForestClassifier for i in assays : X_all = X[ dataframe[i].isnull() == False ] Y_all= data.. 더보기 [Tox21_data_challenge]TPR FPR by threshold Threshold = 0.0 [[ 73 0] [537 0]] TPR = 1.0 FPR = 1.0 acc = 11.96 =============================================== Threshold = 0.1 [[ 69 4] [208 329]] TPR = 0.95 FPR = 0.39 acc = 65.24 =============================================== Threshold = 0.2 [[ 64 9] [118 419].. 더보기 conda명령어로 패키지 설치가 안된다?? CondaUpgradeError: This environment has previously been operated on by a conda version that's newer than the conda currently being used. A newer version of conda is required. target environment location: C:\ProgramData\Anaconda3\envs\test current conda version: 4.5.12 minimum conda version: 4.6뭐냐 도데체 안되는거냥?? 해결책-->remove those # conda version: lines in conda-meta/history 원하는 환경에서 이와같이 시행해 주면 된다. 더보기 Blas GEMM launch failed 에러해결 InternalError: Blas GEMM launch failed : a.shape=(10, 500), b.shape=(500, 500), m=10, n=500, k=500 [[{{node dense_1/MatMul}}]] [[{{node metrics/mean_absolute_error/Mean_1}}]] c: cd \Program Files\NVIDIA Corporation\NVSMI nvidia-smigpu를 사용하고 있는 프로세스가 어떤 것이 있는지 확인한다. 더보기 Linear Regression의 cost 최소화 알고리즘의 원리 설명 Hypothesis 와 Cost를 다음과 같이 정의하였다. 우리의 모델이 대략 이런 형태를 띠고 있다. 이것에 기반하여 모델이 실제 데이터와 얼마나 다른가 (가설의 값과 실체 값의 차이의 제곱의 평균) cost(W,b)를 최소화 시키는 W,b의 값을 우리가 가지고 있는 데이터를 통해서 구해보자는 것이 Linear Regrssion의 목표이다. Hypothesis를 간략화 해보자 W값에 따른 그래프를 그려보면 와 같은 그래프가 나오게 된다. cost가 최소화되는 점을 기계적으로 찾아내는 못적이다. 여기서 많이 사용되는 알고리즘이 gradient descent algorithm이다.Gradient descent algorithm(경사를 내려가는 알고리즘)- cost function을 최소화 시킨다.- 주어진.. 더보기 Tensorflow로 간단한 Linear Regression 구현(2) (1)에서의 코드와는 약간 다르다.tf.placeholder를 사용해서 구현했다.placeholder사용시 원하는 데이터를 feed_dict를 통해서 바로 넣어줄 수 있다는 장점이 있다.1234567891011121314151617181920212223import tensorflow as tfW = tf.Variable(tf.random_normal([1]), name = 'weight')b = tf.Variable(tf.random_normal([1]), name= 'bias') X = tf.placeholder(tf.float32, shape=[None])Y = tf.placeholder(tf.float32, shape=[None]) hypothesis = X * W + b cost = tf.redu.. 더보기 Tensorflow로 간단한 linear regression 구현(1) 세상의 많은 데이터들은 선형적인(Linear한) 관계를 띈다. 예를 들어보자. 공부시간과 시험점수의 관계, 키와 몸무게의 관계, 집의 크기와 집값의 관계 등이 있다. 선형 관계를 띠는 두 데이터의 관계를 H(x) = Wx + b라고 가정한다. 이 가정과 실제 값과의 차이 를 최소화 시켜야 한다다. cost를 다음과 같이 정의하고 이것을 최소화 시킬 것이다. 제곱을 하는 이유는 차이를 양수로 표현해 주고 차이가 클때 패널티를 많이 주기 위해서이다.cost 가 가장 작아지는 w,b를 가지는것 이것이 학습의 목표이다. 123456789101112131415161718192021222324252627import tensorflow as tf #tensorflow를 tf로 import 한다. x_train = [.. 더보기 머신러닝 시작하기 1.1 머신러닝 소개머신러닝이란 무엇일가요? 한마디로 정의할 수 있습니다 "데이터를 이용해서 정의되지 않은 패턴을 컴퓨터로 학습하여 결과를 만들어내는 학문 분야" 머신러닝은 3가지가 합쳐져서 만들어진 분야입니다.1. 데이터 : 머신러닝은 알고리즘이 아닌 데이터 학습을 통해 실행 동작이 바뀝니다.2. 패턴인식 : 사용자가 일일히 정해놓은 패턴이 아닌 데이터를 보고 패턴을 추립니다.3. 컴퓨터를 이용한 계산 : 응용수학이나 통계학과 달리 머신러닝은 단순히 수학적인 모델의 구축이나 증명에만 그치는 것이 아니라 실제 데이터에 대해 계산해서 결과를 만들어낸다는 점에서 전산학의 한 분야로 볼 수 있다. 1.2 머신러닝을 이해하는 데 필요한 배경지식- 수학(선형대수, 미분, 통계 확률)- 프로그래밍 1.3 머신러닝 .. 더보기 이전 1 다음