목록[인턴]/[Annotation-AI] (4)
개발자로 후회없는 삶 살기
서론5월 말에 국가 기관에 시연을 하기 위해 한국어 ChatPDF를 개발하는 과제를 받았습니다. 현재까지 진행 상황을 정리합니다. 본론1. ChatGPT API 키로 직접 Chat PDF 어플리케이션 만들기2. 텍스트 넣으면 요약, 분석해서 답해주는 LLM 조사 - ChatGPT API 키로 직접 Chat PDF 어플리케이션 만들기1) PyPDF2로 pdf에서 텍스트 추출reader = PdfReader("/content/sample2.pdf")raw_text = ""for i, page in enumerate(reader.pages): text = page.extract_text() if text: raw_text += textraw_text[:1000]원하는 PDF 경로를 지정..
서론 매주 수요일 본부장님과 사업 본부 인원들이 본부장님이 던지시는 주제에 답변을 하는 형식으로 직무 교육을 하기로 했습니다. 이를 요약 정리합니다. 본론 - 1주차 -> 주제 논리적 생각에 대하여 1. 논리적 생각이란 뭘까? 사업이란 무엇이라고 정의해야할 때 누구는 주어진 비즈니스 문제를 해결해야하는 것, 누구는 이윤을 창출하는 행위, 누구는 돈 받고 일하는 것이라고 생각한다. -> 정답 논리적인 생각이란 '다양한' 것이 엉켜있는 실타레로 우리는 '다양한' 것이 무엇인지 알아봐야한다. 논리적 생각은 다양한 것을 논리적으로 구조화하는 것이다. -> 논리적으로 생각하는 방법 1. 구조화 논리에 대해서 다양한 의견이 나오고 가설들만 난무할 텐데 의견에 대한 대응 답변도 다양할 것이다. 한 식당이 장사가 되지..
서론 현재 진행하고 있는 koalpaca와 별도로 kobert를 조사하라는 임무를 받았습니다. kobert는 임베딩 모델 위주로 알아보라 하셨습니다. 이를 조사하고 학습한 과정을 정리하고 발생한 이슈를 적습니다. 본론 1. kobert 임베딩 task 2. kobert-koquard MRC task 3. kobert 다중 분류 task 4. koalpaca 환경 구축 5. koalpaca 학습 데이터 구축 6. koalpaca 훈련 및 이슈 - kobert 임베딩 task(참고 1) etri의 kobert를 fine tuning한 모델입니다. 임베딩과 관련된 task를 할 수 있습니다. 1) 문장 유사도 2) Clustering - kobert-koquard MRC task(참고 2) 처음에는 koqua..
서론 첫 번째 과제는 AnnoWiz(자동 AI 라벨링 툴) 라벨링 결과를 정량적 지표로 추출하는 것입니다. 소프트웨어에 탑재된 모델 결과와 Mmdetection의 SOTA 모델 결과를 비교하면 소프트웨어를 사용하는 고객의 신뢰성을 보장할 수 있을 것입니다. 또한, 모든 과제는 부서원들께 PT 형식으로 발표하게 될 것이라고 했습니다. 교수님께 부여받는 AI 과제도 하고 매니저님께 받는 개발 미션도 하며, 이를 발표까지 하는 정말 좋은 인턴 경험이 될 것 입니다. 본론 1. mmdetection 결과 csv로 저장 2. vs code python 디버깅 조사 및 수행 - Mmdetection 결과로부터 Top-N Accuracy 추출 => 미션 1) test.py를 샘플 이미지에 대해 돌렸을 때 나오는 각 ..