개발자로 후회없는 삶 살기

[22.08.02]데이터 청년 캠퍼스 PART.Project 4, 5일차(목표 구체화) 본문

[대외활동]/[데이터 청년 캠퍼스]

[22.08.02]데이터 청년 캠퍼스 PART.Project 4, 5일차(목표 구체화)

몽이장쥰 2022. 12. 15. 19:26

서론

데이터 청년 캠퍼스 Project 4, 5일차 내용입니다.

 

본론

- 목표 구체화에 관하여

교수님께서 말씀해 주셨습니다. 기업에서 프로젝트를 진행하면 목표를 정하고 타당성을 분석하는 것이 7할입니다. 지금 벌써 목표 구체화만 몇 번째인지 모르겠습니다. 하지만 프로젝트 초기에 이를 제대로 명확하게 해 놓지 않으면 나중에 더욱 골치 아픈 상황이 나옵니다. 

 

+ 또한 우리 프로젝트는 내가 그 동안 해오던 개발 프로젝트도 아니고 가공된 제공 데이터로 하는 데이터 분석 프로젝트도 아니며 친숙한 주제도 아닙니다. 기업이 직접 수집한 실제 데이터이고 주제 또한 스마트 팩토리에 관련한 것입니다.

 

∴ 목표 구체화에 심여를 기울일 필요가 충분합니다!

 

=> 구체화(리드 타임과 수주 리스트에 반영된 계획 생산 관점으로!)

왼쪽 : 경영지표/ 오른쪽 : 생산실적

 

하지만 지금 하는 구체화는 달라진 점이 있습니다. 전에 했던 구체화는 데이터를 받지 않고 공장 순회와 임원 미팅만 진행한 것뿐이었지만 지금은 데이터를 본 후에 각자 생각한 목표를 얘기해 보는 시간입니다. 총 리드타임과 공정별 테크타임을 제외한 데이터를 받았습니다. 6월 한 달치만 받았지만 데이터의 모양을 볼 수 있다는 점에서는 충분함을 느꼈습니다.

 

※ 이제부터 엑셀 파일 이름이 많이 나오는데 파일 풀 네임을 쓰기 보다 (폴더명 파일 번호)로 대체하겠습니다. ex) 01.공정별 생산제품_6월 = 경영지표 1번

 

1. 경영지표 2, 3번을 붙여서 idle / down을 줄이는 해결 방안을 제시하자

 

+ 2번과 3번 데이터 셋을 활용하여 각 설비 중에 많은 부품을 생산하는 지표를 보고 (assy, 부품, 파트 등등) 최적의 Run time과 idle time의 비율을 추천하자!/

-> 내 생각 : 데이터 셋 2번에 설비별로 많이 생산한 제품이 있습니다. > 생산 지표를 보고 생산을 많이 하는 설비의 run time, idle time을 추천하자/

 

2. 경영지표 4, 7번을 연결하면 고객사별 수주량에 따른 제품 상태를 파악할 수 있을 것 > 이를 통해 평균적으로 수주가 들어왔을 때 생산 대기 상태와 진행 상태가 얼마만큼 있는지 알 수 있을 것이다.

-> 내 생각 : 수주는 3391개 받았는데 진행과 대기는 1282개입니다. 그러면 아직 시작도 안한게 2000개인가? > 수주량에 비해 시작한 게 적다는 것일 수도 있습니다. ∴ 수주량이 더 많습니다 -> 계획적으로 생산을 조절할 필요가 있습니다.

+ 평균적으로 수주가 들어왔을 때 대기와 진행이 얼만큼이고 최종 출고량이 생산실적조회 2번을 보면 나와있습니다. 그러면 수주가 이만큼 들어왔는데 최종 출고량은 그에 비해 얼마만큼이니 생산을 더하던가 수주를 덜 받던가라고 제안할 수 있습니다.

-> 위 목표는 데이터만 보고 데이터 분석적인 방법으로 목표를 생각해 보았고 아래는 산업 공학적인 공장 내부 환경을 개선하는 방향으로 생각해 보았습니다.

 

3. 공정에서의 사진을 찍어서 작업자의 불필요한 이동 시간(=동선 활용)과 작업자 배치 위치를 개선하자

 

4. 불량, 양품을 사진을 찍어서 이상치 탐지하자 -> 내 생각 : 다산이 가지고 있는 불량 기준을 통해서 불량 퍼센트를 낮춰보자/

5. 작업 환경을 사진을 찍어서 위험한 상황이 오면 미리 예측하여 사고를 예방해보자 -> 하지만 이 목표는 공장에 계속 방문하여 전문가분들께 설비 정보를 알아야 합니다. 이 목표는 지도학습으로 데이터 라벨이 수반됩니다.

6. 후처리는 공정이 끝난 후에 하는 잔 작업입니다. 이것을 기계화하고 싶은데 비용이 부족합니다. 아세이 재고 정리 공간을 전산화, 스마트화 해보자

 

 

※ 추가로 목표 1, 2를 해결하고자 군집화를 떠올렸기에 관련 선행 연구를 읽어 보았습니다. 목표 1, 2가 기업에서 제시한 주된 목표이기 때문에 이를 우리의 목표로 잡는 것이 필요하다고 생각되었기에 시도하였습니다. 

 

데이터마이닝을 활용한 수주생산시스템의 공정계획방안

 

데이터마이닝을 이용한 수주생산시스템의 공정계획방안

The manufacturing industry with Make-to-Order production system is difficult to decide the standard information for the product and the demand is variable to estimate. In this paper, we concerned with the process planning method using data mining in the ma

www.kci.go.kr

 

 

 

 

 

 

 

 

5일차

- 데이터 분석을 위한 데이터 확인

사실 데이터 분석이 아니라 데이터 확인이 더 시급했습니다. 지금까지는 캐글이나 데이콘에서 제공하는 엑셀 데이터를 툴에 불러와서 분석을 했었습니다. 예쁘게 잘 가공된 데이터이고 하나의 엑셀에 통합되어 있기에 데이터프레임으로 보면 한눈에 알아보기 쉬웠습니다. 

 

> 하지만 우리 프로젝트는 실제 기업이 측정한 데이터로 컬럼도 제각각이고 위의 이미지만 봐도 13개로 나뉘어있습니다. 따라서 데이터가 담긴 엑셀을 확인하는 것이 필요하였고 나는 이것을 '엑셀보기'라고 정의하겠습니다.

 

 

엑셀 보기.hwp
1.38MB

 

 

이 엑셀 파일을 보면 분리되어 있는 엑셀 파일들을 캡처해서 하나의 파일에 모아 한눈에 알아볼 수 있게 하는 목적으로 제작하였습니다. 만드는 과정에서 위에 잡은 구체화 목표대로 목표에 필요한 엑셀 파일 몇 번, 몇 번을 뽑아서 따로 붙여놓았습니다.( ex) 1번 목표 idle, down을 줄이는 해결방안 제시를 위해 경영지표 2, 3번을 붙여 놓았습니다.)

 

★★ 느낀점 ★★

지금 생각해 보면 분명 파일 여러 개를 띄워서 한눈에 볼 수 있게 만든 별도의 툴이 있을 수 있습니다. 하지만 엑셀 파일을 한 눈에 알아보기 쉽게 모아야 한다고 생각한 것과 모은 것에 의의와 배움이 있습니다. 데이터를 받기 전에 추상적인 목표를 잡고 데이터를 받은 후 파악하며 추상적인 목표에 맞게 '엑셀 보기'를 만들면 추상적인 목표를 구체적인 목표로 만들기 좋을 것 같습니다.

 

=> 데이터 확인 결과

엑셀 보기 질문 리스트.txt
0.01MB

 

두 폴더의 엑셀 데이터를 파악하며 궁금했던 질문거리와 중요포인트를 정리하였습니다.

 

 

- 목표 구체화 머신러닝 version

일단은 머신러닝(리드타임 회귀 모델 개발)을 하기로 마음을 먹었으니 여러 가지 목표를 나열해 보았습니다. 여기에는 기업이 원하는 목표도 있고 우리가 따로 정한 목표도 있습니다. 

=> 다양한 목표

1. 리드 타임 조정/ 수주 리스트 기반 계획 생산
2. 컴퓨터 비전 활용(작업자들의 동선, [불량, 양품 탐지], 사고 예방 등)
3. 생산으로 얻은 수익을 원인 분석하여 향후 수주 방향성 예측 
4. 산업 공학적 지식을 활용하여 공정 시뮬레이션

 


나는 기업이 원하는 공정 순서 스케쥴링, 수주 리스트 기반 계획 생산을 해결하고 싶었습니다. > 해결하고자 하는 목표가 생기면 관련 선행 연구를 엄청 많이 찾아보고 과거에는 어떤 생각을 했고 어떻게 해결하려고 했나를 통해 인사이트를 구해봅니다.

-> 그것을 우리 프젝에 적용한다면 수주 정보에 수량, 납기일 등이 포함되어 있을 거고 이것을 모델의 입력 데이터로 넣어 유사 그룹을 찾을 수도 있고 입력 데이터에 해당 고객의 과거 수주 이력과 제품 공정 시간이 있을 테니 in & out 테이터를 붙여서 입력에 넣어 유사 제품을 찾을 수 있지 않을까? = 군집화 사용 방안

-> 하지만 팀원 : "그래서 도대체 뭘 하고자 하는 거야?? 이해가 안 돼, 뭐를 통해 뭐를 얻을 수 있는 건지 정리해 줘"

 

팀원이 내가 군집화로 하려고 하는 최종 목표가 무엇인지 잘 모르겠다는 답변을 주었습니다. 여기서 또 내 주장을 하는 법을 배웠습니다.(팀 프로젝트로 얻는 배움일 것입니다.)

 

> 새로운 입력이 있습니다. 근데 과거 14개의 군집을 보니 새로운 입력과 비슷한 군집은 공정순서나 in & out을 이렇게 했었고 그랬더니 최종 출고나 수입, 설비 idle 비율이 이러이러했습니다. 군집에 다 라벨링을 하고 만약 그러한 군집이 긍정적인 라벨이었다면 입력으로 넣은 공정 순서가 정당하다고 할 수 있습니다.

 

> 반면에 부정이었다면 독립변수 값을 다른 긍정적인 군집과 비슷하게 바꿔야 합니다.라는 것이 내가 군집화를 통해 얻고자 하는 목표입니다.

-> 팀원 : "그렇다면 어떻게 할 건데?" 

 

목표는 전달했습니다. 이걸 팀원들에게 타당성 있게 주장하려면 입력과 출력을 명확하게 제시하여 가능성을 보여주고 도전해 볼 만한 가치가 있음을 어필해야 합니다! 


1. 독립변수가 뭔지
2. 그에 따른 결과물, 출력값이 뭔지!

 

위 두 개를 명확하게 제시하여 팀원의 의견을 들어보겠습니다!

 

Comments