개발자로 후회없는 삶 살기

네이버 부스트캠프 AI Tech 12주차 회고 본문

[AI]/[네이버 BoostCamp 회고]

네이버 부스트캠프 AI Tech 12주차 회고

몽이장쥰 2024. 1. 25. 11:57

서론

레벨 2, 3 프로젝트를 병행하며 한 주를 회고합니다.

 

본론

- 팀원들과 원활한 협업을 위한 프로젝트 셋팅(Jira)

레벨 3 프로젝트 일정 관리를 위해 Jira를 팀에 제안했습니다. 하지만, 사용 경험이 부족했기에 팀원들에게 제 경험을 전달하기 위한 세미나를 진행했습니다.

 

-> 자아 성찰 ✅

요즘 부스트캠프 팀원들에게 상당히 많은 정보 공유를 하고 있는 것 같습니다. 촉박한 커리큘럼 내에서 시간을 할애하면서까지 세미나를 하고 자료를 만들고 있습니다. 과거의 저는 지식 공유를 블로그 혹은 구두로 하는 것이 전부였습니다. 팀원들에게 도움이 되는 것을 즐기고 있는 것을 새삼 깨달으며, 더 성숙한 개발자로 전진하고 있는 것 같아 기분이 좋습니다.

 

- 데이터 제작 대회의 목적

-> 데이터 제작 대회? ✅

AI에게 데이터가 가장 중요하다는 사실은 수십 번 넘게 들어서 이미 알고 있는 사실이었습니다. 하지만, 항상 주어진 데이터를 사용하여 전처리하고 증강하는 것 외에 데이터를 수집하고 제작해 본 경험이 없었습니다.

 

-> 데이터가 있는 데 굳이 제작까지 해야 하나? 🚨

AI 서비스를 개발하는 현업에서는 데이터가 주어지지 않고 기획안만 존재합니다. 무에서 유를 만들어야 하는 상황이기에 서 데이터 없이는 AI를 개발할 수 없기에 데이터 제작은 반드시 필요하다고 합니다.

 

[https://www.blog.solutionquant.com/pipeline-220321/]

학생, 교육생 수준에서 현업의 사정을 몰랐는 데 데이터 제작이 서비스 개발 프로세스에 들어간다는 것을 깨달았습니다.

 

-> 이번 대회로 얻어갈 것

초기 데이터로 모델 성능을 확인하고 부족한 데이터 추가
데이터가 부족할 때 전처리, 증강으로 모델 성능 개선
데이터를 추가하는 것이 현업에서는 어떤 Cost가 들지 고민

대회에서는 100장의 데이터로 시작하여 모델 성능을 개선해야 합니다. 현업에서는 서비스를 운영하는 도중 데이터를 추가로 수집하거나, 처음부터 대용량의 데이터를 수집하는 것이 상당한 Cost일 수 있습니다. 이번 대회로 현업의 이슈를 직접적으로 경험해 볼 수 있을 것입니다.

Comments