개발자로 후회없는 삶 살기

[22.09.01] [기획] adv 1~4주차(팀 빌딩) 본문

[대외활동]/[BOAZ]

[22.09.01] [기획] adv 1~4주차(팀 빌딩)

몽이장쥰 2022. 12. 15. 19:43

서론

근래 팀 프로젝트를 하며 프로젝트 시작 전에 Frame(프로젝트 기틀)을 잡아야 한다는 생각을 했습니다. 이를 위해 adv때 잡은 Frame을 생각해 보겠습니다.

 

본론

1주차

- 팀 빌딩

📢 팀빌딩이 진행되는 4주차까지 연세대학교 신촌캠퍼스에서 대면으로 세션이 진행되며, 팀 구성 및 변경이 가능합니다.

📢 1주차에 진행되는 발표는 각자 3분 내외로 진행될 예정입니다. 발표자료는 ppt 파일로 준비

 

=> 아이디어 thinking

1. 아이디어를 얻은 곳 포트폴리오를 돋보이게 하는 머신러닝 프로젝트

 

포트폴리오를 돋보이게 하는 8가지 AI/머신 러닝 프로젝트 - 데이터 인텔리전스.

데이터 과학 분야에서 경력을 쌓기 시작했거나 이미 노련한 실무자라면 적극적으로

zephyrnet.com

-> 솔직히 참신한 아이디어가 떠오르지 않았고 BOAZ 면접 때 말한 드론이나 스마트 팜은 실현 가능성과 관심을 끌 수 없다고 판단됐습니다.


-> 따라서 위 블로그의 내용 중 사람 얼굴 이미지를 받아서 기분을 판단한다는 내용에서 이미지 검색 기능을 생각했습니다.(이때 친구와 부모님의 도움이 컸습니다.)

 

2. 프로젝트 주제

사람이 스케치 그림을 그리면 실제 이미지로 복원해서 관련 유사 도메인 객체를 추천하는 것 > 키워드가 생각이 안 나거나 키워드로 검색했는데 원하는 결과가 안 나올 때 필요성을 느꼈습니다.(만약 프로젝트를 하게 된다면 업로드란이 필수적일 것이라고 예상됩니다.)

 

3. 프로젝트 발표

[분석ADV_1주차 발표](https://docs.google.com/presentation/d/1lDo5A-oU5ACjMgxsT4mcoH3Jy6e4bMmp/edit#slide=id.p1

 

위에 팀 빌딩에서 말했듯이 팀 빌딩을 위한 발표 자료를 만들어야 했으며 내가 생각한 개요는 (주제/ 구현이 안된다면?/ 필요한 것/ 참고 문헌) 이었습니다. 여기서 안 된다면?을 넣은 게 좋다고 생각되는데 내가 단상에 올라가서 어필을 해야 하는 상황이므로 구체적으로 뭐가 필요하고 뭐가 어려운지 말하는 것이 좋았다고 생각합니다.

 

-> 발표를 위해 필요한 것이 뭐가 있을까라는 생각을 위의 개요로 구성해 봤습니다.

 

 

2주차

📢 2주차에는 주제 구체화입니다!

 

- 아이디어 구체화

아이디어 구체화란 1주차에서 구상한 아이디어를 좀 더 확실하고 이해하기 쉽게 동아리원분들께 설명하는 것으로 2주차의 어필이 6개월 프로젝트 흐름을 구성하기 때문에 프로젝트 전체를 결정 짓는다고 생각할 수 있을만큼 엄청 중요한 사항입니다.

 

-> ★나는 1주차에서 생각을 굳혔다 보니 주제와 관련된 방향으로 정보를 알아볼 수 있었고 따라서 유용한 결과와 관련 선행 연구 및 서비스를 쉽게 알아볼 수 있었습니다!!!★ 유사 이미지 검색

 

유사 이미지 검색 시스템 구축하기 : 클리앙

OpenAI에서 발표한 CLIP이라는 모델을 이용하여 이미지 검색과 관련된 기능을 만들고 있습니다. (CLIP에 대한 소개는 https://www.clien.net/service/board/useful/16480158?od=T31&po=0&category=0&groupCd=CLIEN 를 참고해 주

www.clien.net

 

 

- 2주차 발표 자료에 들어가야 하는 내용

이 또한 내 생각을 더욱 강화하는데 필요한 부분이자 사람들에게 이해를 돕기 위한 디딤돌이 됩니다. 나는 뭐가 들어가야 할지 모르는 부족한 상태였는데 공동대표진께서 선정한 사항(아래 이미지)을 참고하여 내용을 채울 수 있었습니다!! 이런 표준 틀을 항상 기억하자(서론>본론>결론/ 상태 다이어그램 등등이 표준입니다.)

 

 

=> 위의 필수 항목을 고려한 아이디어 구체화 2주차 아이디어 구체화

 

- 이때 꼭 필요한 것

1) 사람들은 1주차에서 대충 내 의도를 알기에 또 의도를 설명할 필요는 없습니다. 실제로 가능할지 "타당성 분석과 구체적인 구현 프로세스"를 보여야 합니다. -> e.g. 선행 연구가 많습니다, 유명 기업이 사용 중입니다, 내가 어느 정도 실력이 있습니다. 등등


2) 흥미 : 주제가 재밌어야 하고 복잡하면 안 됩니다. 실제로 구현을 하면 엄청난 복잡성을 가질 수 도 있지만 아이디어 제안 과정에서는 어려움보단 흥미를 끌어야 합니다. 실제 우리 팀원들은 의류라는 상품이 상업화가 매우 잘 되어있다고 생각했고 GAN과 추천시스템에 재미를 느껴서 참여하게 되었다고 했습니다.


3) 반드시 주제에 필요한 내용 : 내 주제로 예를 들면 추천시스템이 없으면 GAN을 하든 뭘 하든 의미가 없다고 판단되어 추천시스템부터 먼저 성공하고 GAN을 하자고 했습니다, 또는 이미지 업로드가 수반된다 등등

-> 위를 통해 프로젝트를 구체화하는 법과 사람들의 흥미를 끄는 프로젝트를 생각하는 법을 배워서 현재 4명의 팀원과 아이디어를 실현하고 있는 상황입니다.

 

4주차

- GAN과 추천시스템을 동시에 공부

한 주동안 하나의 주제만 공부하는 것은 시간 낭비라고 생각되어 GAN은 논문을 1개씩 읽어오기로 하고 추천시스템은 엘라스틱 서치와 구글 비전 API 팀으로 나눠서 조사해 보고 둘 다 너무 어렵다면 4명이 하나에 몰두하는 방식으로 하기로 했습니다. (여기서 간과한 점 : 1. 목표, 2. 난이도, 3. 모델 프로세스)

 

-> 대학원생 동아리원이 알려준 프로젝트를 위한 논문 읽는 법 : 1차로 관련 검색으로 나온 논문을 엄청 많이 읽어봅니다, 이때 엄청 많이 읽을 것이기 때문에 구체적으로 읽을 필요는 없고 내 것과 비슷한지만 보면 됩니다. 2차에서 1차에서 추린 내용을 깊게 읽습니다.

 

> 그때 추린 것들의 코드를 돌려볼 텐데 내 컴퓨터에서 돌릴 수 있는 규모인지 확인해야 하고 없다면 규모를 작게 조정해야 하는지, 필요한 데이터 셋을 구할 수 있는지 등을 빨리 생각해 봐야 합니다. (데이터, ai 프로젝트에서 모델 규모와 데이터가 타당성 분석의 주축입니다.)

 

- 엘라스틱 서치 조사

1. 네이버 엘라스틱 서치 이미지 검색 네이버 엘라스틱 서치

 

2. 엘라스틱 서치 이미지 검색 딥패션 이미지 검색

 

[번역] Similarity Search and Similar Image Search in Elasticsearch

유사 이미지 검색 분야 관련 블로그 글을 번역 & 실제 테스트하는 내용의 포스팅입니다. "원본 링크 [출처] https://medium.com/@kumon/how-to-realize-similarity-search-with-elasticsearch-3dd5641b9adb" 효율적으로 큰 차

soyoung-new-challenge.tistory.com

 

3. 코사인 유사도 기반 유사 이미지 추출 구글 코랩 유사 이미지 튜토리얼

 

Copy of image-search.ipynb

Run, share, and edit Python notebooks

colab.research.google.com

-> 결과 : 쉽게 되는 게 하나도 없다. 역시 만만하게 생각한 내 잘못입니다 ∴ 타당성 검증이 반드시 필요합니다.(GAN, 추천시스템 둘 다 타당성 검증 기간을 길게 잡고 확인해 봐야 합니다.)

 

 

결론

- 느낀 점 : 주제를 정하니 범위는 좁아지지만 시야는 집중되어 확실히 나아갈 방향이 보입니다. 교수님과 학교 선배님들은 이런 것을 다 알기에 내가 직접 알기를 원하셨을 거고 조금씩 조금씩 알려주면서 습득을 도와주셨을 것입니다!! 이번 프로젝트 구체화와 팀 빌딩으로 프로그램을 기획하고 구상하는 방법을 배웠습니다.

 

 

참고

구글 유사 이미지 검색 튜토리얼

딥패션 이미지 검색

네이버 엘라스틱 서치

Comments