목록[대외활동]/[데이터 청년 캠퍼스] (19)
개발자로 후회없는 삶 살기
서론 머신러닝 기반 분석 이론 학습 및 실습을 진행합니다. 본론 실습 머신러닝 개념과 기초 분석(충북대 교수님 강의) -> 하신 서비스 : 상담원이 받은 전화 데이터로 소비자들이 어떤 프로모션을 제일 좋아할까 -> 노트북을 팔면 가격을 낮추는거? 마우스를 껴주는 걸 좋아할까?? 이런 프로모션 예측 등을 하셨단다./ - 머신러닝 데이터마이닝 개요 ★ 인공지능이든 머신러닝이든 전부 데이터이다 알파고가 수만번의 대전으로 깨지면서 배운 거다/ -> 데이터는 2가지 정량(숫자), 정성(글자)/ 데이터를 라벨을 실수로 하지 말고 적정, 적정이하, 적정이상으로 라벨링하고 이하 이하 이상이 좋은지 이상 적정 이하가 좋은 지를 봐라 -> ★수치형 연속 데이터를 범주형 연속 데이터로 만들기 = 상식적으로 생각해봐도 실수형..
서론 통계 기반 데이터 분석 이론 학습 및 실습을 진행합니다. 본론 실습 - 통계적 가설 검정 ->통계적 마인드로 타이타닉의 생존자와 사망자의 차이를 알아보자 = 불확실한 가설을 수학으로 검증해보자/ ※ 통계 p가 0.05보다 크면 귀무가설이다, 작으면 대립가설이다 -> 그러니 검정마다 귀무가설이 뭔지를 알아야한다/ - 귀무가설 1) 정규성 검정 : 데이터셋이 정규분포를 따른다. 2) 등분산 검정 : 두 집단의 모양이 비슷하다(모분산이 일치한다) 3) 독립 t검정 : 이 속성으로는 두 집단의 차이를 확인할수없다(이 집단의 차이가 없다) -> 따라서 등분산이랑, 독립 t는 집단을 두개로 만들어야하고 대립가설(두 집단의 차이를 볼 수 있는)이 되는 요소를 찾아야함/ 4) 이원 카이 검정 : 두 변수 사이에 ..
서론 20일 뒤에는 위 기업의 데이터 부서와 실제 데이터를 가지고 프로젝트를 하게된다. 민폐끼치지 않기 위해 최선을 다해서 교육을 듣자 본론 1일차 - 실무에 대한 관점 1. 실무에 가면 데이터가 잘 있을 거라고 생각하지 마라 -> 투입된 회사나 기관에 데이터가 있는지 보는 것부터 데이터 분석, 컨설턴트의 임무이다 > 상사가 요구하는 것은 데이터를 전문적으로, 상식적으로 상용화 가능한가 불가능한가이므로 그러한 데이터가 존재하는 가 알아보는 것부터 데이터 분석가의 일이다/ + 프로젝트에 맞는 데이터를 구할 수 있는지 얼마 만에 데이터를 구할 수 있는지 판단 하는 것부터 일이다 -> 공공기관이나 카드, 통신 업체에 데이터를 부탁할 수도 있기에 데이터를 구하는데도 시간이 걸린다./ + 우리 회사가 어떤 데이터..