김지후 | 머신러닝 엔지니어 포트폴리오

ABOUT ME

👤 이름: 김지후 🎂 생년: 1999년

🧭 신념: 모델의 성능은 복잡한 알고리즘이 아닌 데이터의 질에서 결정된다.

🙋 자기소개:

저는 모델의 성능은 복잡한 알고리즘보다 데이터의 질에서 결정된다고 믿습니다. 다양한 도메인의 데이터를 이해하고, 의미 있는 데이터를 수집·분석해 실질적인 가치를 창출하는 일을 좋아합니다. 문제 해결에 적합한 전략을 제안할 수 있는 데이터 중심 AI 엔지니어를 지향합니다.

🔗 Portfolio:

👉 포트폴리오 페이지로 이동

키워드:

#ML #CV #Object Detection #LLM #NLP #데이터사이언스 #RAG #프롬프트엔지니어링

📄 자격증

운전면허 1종보통 (2018.02)
TOEIC Speaking IM3 (2025.04)

EDUCATION

경희대학교 국제캠퍼스
2018.03 ~ 2024.02

학부: 생체의공학부 졸업 / 학점: 3.4 / 4.3
한국의료기기안전정보원 (RA)
2024.07 ~ 2024.08

과정: RA 중기과정 3차 수료
UPSTAGE AI Lab
2024.11 ~ 2025.06

과정: 6기 부트캠프 수료

SKILLS

💻 Hard Skills

기술	숙련도	활용 경험
Python	★★★★☆	다양한 프로젝트에서 데이터 전처리, 시각화, 모델 구현 Pandas, Numpy, Matplotlib, TQDM 등 주요 라이브러리 실습
C++	★★☆☆☆	학부 과정에서 알고리즘, 포인터 및 기초 구현 실습
PyTorch	★★★★☆	CNN/AutoEncoder 기반 모델 개발 및 실험 (문서 분류, 이상 탐지 등)
TensorFlow	★★★☆☆	일부 프로젝트 텐서플로우로 진행
Wandb	★★★★★	실험 자동화 및 시각화, sweep 기능 활용하여 실험 비교
OpenCV	★★★★☆	문서 분류 프로젝트에서 이미지 전처리 및 시각화 문서 내 노이즈 제거, 회전 보정 등 실험 수행
LangChain	★★★☆☆	RAG 시스템 구현 시 프롬프트 구성 및 문서 검색에 활용 Solar API와 연계하여 응답 흐름 설계 경험
Huggingface	★★★☆☆	KoBART 기반 요약 모델 파이프라인 구현
Git / GitHub	★★★★☆	Gitflow 전략을 적용해 팀 프로젝트 협업 및 코드 관리
Notion / Slack	★★★★☆	실험 기록 및 팀 커뮤니케이션 도구로 사용

🧠 Soft Skills

항목	설명
🎤 커뮤니케이션	마술 동아리 부회장으로서 공연 기획 및 팀 협업을 조율한 경험
📏 데이터 최적화 전략	목적에 맞게 데이터 크기 및 형식을 조정하고 변환 전략을 설계한 경험
🔍 문제 해결 능력	다양한 예외 상황을 구조적으로 분석하고 해결한 트러블슈팅 경험
🤝 GitFlow 협업 경험	브랜치 전략을 기반으로 팀원과의 협업과 코드 리뷰 경험 보유
🗂️ 문서화	작업 내용을 문서로 정리해 팀에 공유하고, 프로젝트 완료 후 GitHub Pages 기반 포트폴리오에 상세 페이지 작성

📄 PROJECT 1: 문서 이미지 분류

산업 전반(금융, 의료, 보험 등)에 존재하는 다양한 문서 이미지를 분류하는 프로젝트였습니다. 데이터 증강, 객체 탐지, sinogram 변환, 앙상블 등 다양한 시도를 했으며, 실험적 접근과 분석 중심의 전략을 통해 최종 리더보드 1위를 달성했습니다.

📅 기간: 2025.02.14 ~ 2025.02.25

👥 팀원: 총 5명

🧑‍💻 역할: Sinogram 실험 주도, 데이터 증강 및 EDA, YOLO 실험 참여

🛠️ 사용 기술: Python, torchvision, Wandb, ResNet50, EfficientNet-B3, YOLOv12

📊 workflow

🛠 주요 기능

✔ 다양한 문서 증강 기법(Augraphy, Albumentations) 적용

✔ Radon 변환 기반 Sinogram 실험 및 성능 분석

✔ YOLOv12로 타이틀 탐지 → 이미지 특징 보완

✔ Soft Voting 기반 앙상블 적용

단일 모델로는 문서 유형 간 경계가 애매한 경우 성능이 불안정해지는 문제가 있었기 때문에, ResNet50, EfficientNet-B3 등 서로 다른 아키텍처의 예측 확률을 평균하는 Soft Voting 기반 앙상블을 적용했습니다.

서로 다른 모델이 각기 다른 특징을 잘 포착함으로써, 오탐률이 높던 문서에서도 안정적인 예측 결과를 도출할 수 있었고, 전체 정확도를 향상시키는 데 기여했습니다.

또한 YOLO 기반 키워드 탐지 결과까지 반영하는 이중 앙상블 구조로 확장하여 최종 모델을 구성했습니다.

🐛 트러블슈팅

✔ 회전된 문서 대응 → sinogram 변환 기반 전처리 실험

배경: 학부 시절 Radon 변환을 이용해 CT 이미지의 sinogram 변환 및 역변환 코드를 작성한 경험이 있었습니다.

문제: test 데이터에 회전된 문서가 다수 포함되어 있었고, traing 데이터는 대부분 정방향으로만 존재했습니다.

가설: sinogram은 회전·이동에 불변성을 갖고, 노이즈도 주파수 기반으로 정리되므로 일반 이미지보다 robust할 수 있다고 판단했습니다.

결과: 전처리로는 효과가 있으나, 일반 CNN은 sinogram 특성을 학습하지 못해 성능 저하 발생. Radon-domain CNN 등 특화 구조 또는 증강용으로의 활용이 더 적합하다는 결론에 도달했습니다.

✔ 특정 문서에서 높은 오탐률 발생 → YOLOv12 기반 키워드 탐지로 보완

문제: 증강 데이터를 충분히 확보한 이후에도, 진단서·소견서 등 특정 문서 유형에서 높은 오탐률이 지속적으로 발생했습니다.

접근: 사람은 보통 문서 상단의 '진단서', '확인서' 등 키워드를 기준으로 문서 유형을 판단합니다. 이 점에 착안해, YOLOv12를 이용해 해당 키워드를 객체 탐지하고 분류 보조 정보로 활용하는 전략을 도입했습니다.

실행: 기본 분류 모델로는 ResNet과 EfficientNet을 사용하고, 특정 문서에 한해 YOLO 기반 재분류를 적용하는 이중 앙상블 구조를 설계했습니다.

결과: 정확도 0.8615 → 0.9832로 비약적인 성능 향상 달성.

🌟 성과

✔ wandb sweep을 통한 하이퍼파라미터 자동 탐색
✔ 최종 리더보드 1위 달성

🔗 참고 링크

📄 상세 설명 문서: 프로젝트 상세 설명 링크
📁 GitHub 저장소: github.com/KJH121212/Document_Type_Classification.git

🧾 PROJECT 2: 정부지원금 추천 챗봇

정부의 다양한 보조금 및 서비스 정보를 실시간으로 제공하는 챗봇 프로젝트입니다. 사용자의 입력을 바탕으로 RAG(Retrieval-Augmented Generation) 구조를 활용해 관련 혜택을 추천합니다. Solar API를 통해 최신 데이터에 접근하며, 사용자 맞춤형 추천 결과를 생성하는 데 초점을 맞췄습니다.

📅 기간: 2025.03.01 ~ 2025.04.15

👥 팀원: 총 4명

🧑‍💻 역할: 데이터 수집 파이프라인 설계, Solar API 연동, RAG 파이프라인 구현, 프롬프트 설계

🛠️ 사용 기술: Python, LangChain, FAISS, Streamlit, Solar API

📊 workflow