목록분류 전체보기 (100)
nathan_H
참고 블로그 및 자료 - https://ratsgo.github.io/machine%20learning/2017/03/26/tree/ 의사결정나무(Decision Tree) · ratsgo's blog 이번 포스팅에선 한번에 하나씩의 설명변수를 사용하여 예측 가능한 규칙들의 집합을 생성하는 알고리즘인 의사결정나무(Decision Tree)에 대해 다뤄보도록 하겠습니다. 이번 글은 고려대 강필성 교수님 강의와 김성범 교수님 강의를 참고했음을 먼저 밝힙니다. 그럼 시작하겠습니다. 모델 소개 의사결정나무는 데이터를 분석하여 이들 사이에 존재하는 패턴을 예측 가능한 규칙들의 조합으로 나타내며, 그 모양이 ‘나무’와 같다고 해서 의사결정나무라 불립니다. 질문을 ratsgo.github.io 순천향대학교 정영섭 교..
https://ratsgo.github.io/statistics/2017/09/23/MLE/ 블로그와 조현제 님의 자료를 정리했음을 먼저 밝힙니다. MLE Maximum Likelihood Estimation > 모델 파라메터를 observation 에만 의존하여 estimation 예시 모델: Probability density function f 모델의파라메터: θ Observation: X = (x1, x2, …, xn) n: 데이터개수 Likelihood 목표: θ값을estimation 방법: Likelihood 를 최대화 Estimation 수식 각데이터가서로 independent and identical distributed (id)하다는가정하에, Log는 단조증가 함수 인데다가 곱..
참고 블로그 - https://darkpgmr.tistory.com/106 - https://ratsgo.github.io/from%20frequency%20to%20semantics/2017/04/06/pcasvdlsa/ 기저 벡터 공간 V에 대하여 임의의 벡터 집합 S가 서로 '1차 독립' 이면서 V를 '생성'하면 S를 V의 기저라고 한다. 1차 독립(선형 독립) 서로가 선형의 곱으로 표현 x 2-dimensional 좌표계(x, y 축) V1 = (1, 0) V2 = (0, 1) V1과 V2는 서로 1차 독립이면서 좌표계의 모든 벡터를 1차 결합을 통해 표현 가능. 3D좌표계의 기저는? -> x, y, z축 고유값, 고유벡터 고유벡터 -> 선형 변화 A에 의한 변환 결과가 자기 자신의 상수배가 되는..
예전에 처음 완벽한 공부법이라는 책을 봤을때 "무슨 완벽한 공부법이 어딨어" 하고 관심을 가지지 않았을때가 떠오른다. 하지만 현재는 공부, 학습의 중요성을 깨닫고 완공이라는 책을 재독하고 이번 서평은 필사를 통해 내용을 요약하고 내 생각을 덧붙일려고 한다. 1장. 믿음 “성장은 믿음에서부터 나온다.” 성장형 사고방식 고정형 사고방식. ->말 그대로 성장형 사고 방식은 성장을 하는 것을 목적에 둔 사고 방식으로 노력만 한다면 언제든지 성장 할 수 있다는 믿음을 가지고 노력하고 끊임 없이 도전하는 사고방식을 말한다. 반면에 고정형 사고방식은 자신의 한계를 정하고 지능, 능력 등을 탓을 하면 도전을 두려워하고 성장이 멈춘 사고 방식을 말한다. 뇌 가속성 -> 성장형 사고방식의 과학적 근거가 되는 뇌 가속성은 ..
Feature와 Model에 들어가기 앞어 Machine Learning과 Deep Learnig에 어떻게 구현이 되는지 보면 사실 Deep Learnig은 Machine Learning범주 안에 포함되어 있는 학습 방법중 하나이다. 그래도 굳이 차이점이라면 Machine Learning은 Feature을 직접 만들어 학습시키고 분류하고 결과를 낸다면 Deep Learnig은 feature도 기계가 스스로 만들어 학습시키고 분류해 결과을 낸다는 점이라고 볼 수 있다. *이 부분에 대해서 사실 나도 학부생이고 이제 공부를 시작해 깊은 지식이 없어 틀릴 수도 있으니 참고 바라고 틀렸다면 피드백을 주면 수정하겠다. Feature 그럼 이제 Machine Learning에 있어 중요한 Feature 에 대한 개..
다양한 방법으로 ML모델을 만들었다면 그 모델을 평가하는 방법에 대해 알아보고자 한다. 들어가기 전에 이 내용은 순천향대학교 정영섭 교수님의 수업 및 수업자료가 많이 들어가 있다는 점을 참고 바란다. 평가를 위한 데이터 분배 * Trian/ Test * Trian/Validation/ Test * k-fold cross-Validation 우선 평가에 있어 데이터는 항상 학습용 데이터, 테스트용 데이터로 나눠서서 평가를 진행한다. 그 중에서 k-fold cross- Validation에 대해 잠깐 알아볼까 한다. k-fold cross Validation. k-fold cross Validation은 위에 그림처럼 1. 훈련 데이터를 부분 집합으로 나눈다 2. 순차적으로 폴드를 테스트 세트로 하고 나머지..
체인즈 그라운드 독서모임 "씽큐베이터"에 떨어지면서 나의 부족함을 많이 느꼈다. 사실 나의 실력에 대한 확신이 없어 합격의 자신이 없었다. 그래서 예상대로 "씽큐베이터"에 떨어지고 "어떻게 하면 실력을 키우고 성장하기 위한 독서를 할수 있을까" 고민하던 중 유튜브 체인즈 그라운드 채널에서 신영준 박사님의 "남는 독서"에 관한 영상을 보고 "제대로된 독서 남는 독서를 하자!" 마음을 먹었고 재독과 서평을 작성하기로 했다. 그래서 내가 읽었던 책중에 기억에 좀 남고 정말 좋았던 책과 고영성 작가님 추천책중 읽었던 책 위주로 재독을 하고 짧든 길든 서평을 시작하였다. 확실히 재독을 하니 처음에 읽었던 때와 들어오는 부분이 많이 달랐고 처음에는 좋았던 부분이 다시 보니 오히려 별로 였던 부분도 있어 놀라웠다. ..
이 책은 내가 데이터 분석, 개발 부분에 관심이 생기면서 읽은 책이였는데 기계와 인간의 협업에 관해 정말 흥미롭게 해석했던 기억이 많이 나 재독을 하게 되었고 처음에 읽었을때 보다 다가오는 부분과 새롭게 느껴지는 부분이 많아 의식의 흐름대로 서평을 작성해보았다. 데이터 자본주의 “우리가 저녁식사를 기대할 수 있는 건, 푸줏간 주인, 빵집 주인의 자비심 덕분이 아니라, 그들이 자기 이익을 챙기려는 생각 덕분이다.” - 애덤 스미스- -> 개체의 이기심은 전체의 이타심으로 전환되어 종의 유기적인 모둠이 사회를 형성하여 결과적으로 종의 생존 가능성을 높여줬다. “더 나아가 개체의 활동이 협력을 통해 조직화 되는 순간, 각자의 전문성의 혜택은 집단으로 확산된다.(공진화)” “시스템은 쉽게 지치 지도 않고, 가격..