개발자로 후회없는 삶 살기

네이버 부스트캠프 AI Tech 9주차 회고 본문

[AI]/[네이버 BoostCamp 회고]

네이버 부스트캠프 AI Tech 9주차 회고

몽이장쥰 2024. 1. 5. 08:43

서론

객체 탐지 레벨 2 미션에서 배운 것을 기록합니다. 이번주는 EDA와 데이터 클리닝에 집중했습니다.

 

본론

- 객체 탐지의 데이터 클리닝

레벨 1 미션에서 크게 느낀 것은 데이터 클리닝의 중요성입니다.

 

라벨링 오류 수정
배경 제거

위 항목 등이 이미지 분류 문제에서 하면 좋은 클리닝 기법들이었습니다.

 

🚨 객체 탐지에서 좋은 데이터란?

정확한 Localization
라벨링 규칙의 일관성

분류 문제에서 좋은 데이터는 명확했습니다. 정답이면 T, 거짓이면 F로 제대로 라벨링 되어 있으면 되는 것이었습니다. 하지만, 탐지 영역에서 좋은 데이터가 무엇일까 모르겠던 찰나, 팀원들과 토의를 통해 위처럼 정의할 수 있었습니다.

 

✅ 객체 탐지에서 데이터 클리닝

팀 전원이 데이터를 열어서 데이터에 대한 의견을 제시하고 규칙을 정하였습니다. 

 

떨어진 담배 꽁초는 어떻게 할까?
사람도 이해 못 하는 건 라벨링하는 의미가 있을까?

제가 혼자 데이터를 살펴 볼 때는 이러한 이슈들이 있었는데, 팀원 모두 모여 의견을 펼치니 상당히 많은 이슈가 있었고 이에 따른 다양한 라벨링 규칙을 세울 수 있었습니다.

 

결론

데이터 클리닝의 중요성은 레벨 1때부터 깨달았지만, 이렇게 제대로 작업해 본 것은 이번이 처음이었기에 실전에서 사용할 수 있는 많은 팁을 배울 수 있었다고 생각합니다.

Comments