๐Ÿ“ ํŒ€ ํ”„๋กœ์ ํŠธ: [ํ™”ํ•™ ๊ณต์ • ์ด์ƒ ํƒ์ง€ ์‹œ์Šคํ…œ]

๐Ÿ“ ํ”„๋กœ์ ํŠธ ๊ฐœ์š”

ํ™”ํ•™ ๊ณต์ • ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ •์ƒ/๋น„์ •์ƒ ์ƒํƒœ๋ฅผ ํƒ์ง€ํ•˜๋Š” ์ด์ƒ ํƒ์ง€ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•œ ํ”„๋กœ์ ํŠธ์ž…๋‹ˆ๋‹ค. ์„ผ์„œ(xmeas_*)์™€ ์ œ์–ด ๋ณ€์ˆ˜(xmv_*) ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ค์–‘ํ•œ ๋น„์ง€๋„ ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๋ชจ๋ธ์„ ์‹คํ—˜ํ•˜๊ณ  ๋น„๊ตํ–ˆ์œผ๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‹จ์œ„์˜ ํ›„์ฒ˜๋ฆฌ๋ฅผ ํ†ตํ•ด ์‹ค์ „ ํ™œ์šฉ์„ฑ์„ ๋†’์ด๊ณ ์ž ํ–ˆ์Šต๋‹ˆ๋‹ค.

โฑ๏ธ ๊ธฐ๊ฐ„ ๋ฐ ์ธ์›

๊ธฐ๊ฐ„: 2025.04.23 ~ 2025.05.06

์ธ์›: ์ด 5๋ช…

๐Ÿ›  ๊ธฐ์ˆ  ์Šคํƒ

ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด ๋ฐ ๋„๊ตฌ: Python, Jupyter Notebook

์‚ฌ์šฉ ๋ชจ๋ธ: Isolation Forest, One-Class SVM, AutoEncoder, Deep SVDD

์‹คํ—˜ ๊ด€๋ฆฌ: wandb

๐Ÿ”ง ํ•ต์‹ฌ ๊ธฐ๋Šฅ

๐Ÿ“Š ์‹œ์Šคํ…œ ์›Œํฌํ”Œ๋กœ์šฐ

RAG ์‹œ์Šคํ…œ ์›Œํฌํ”Œ๋กœ์šฐ

โ–ฒ ์ „์ฒด ๋ชจ๋ธ๋ง ํŒŒ์ดํ”„๋ผ์ธ

๐Ÿง‘โ€๐Ÿ’ป ๋‚ด๊ฐ€ ๊ธฐ์—ฌํ•œ ๋ถ€๋ถ„

๐Ÿ› ํŠธ๋Ÿฌ๋ธ”์ŠˆํŒ…

๐Ÿ“Œ ์ค‘๋ณต ์ •๋ณด ๋ฐ ์ฐจ์›์˜ ์ €์ฃผ

- ๋ฌธ์ œ: ์„ผ์„œ(xmeas)์™€ ์ œ์–ด ๋ณ€์ˆ˜(xmv) ๊ฐ„ ๋†’์€ ์ƒ๊ด€๊ด€๊ณ„๋กœ ์ธํ•œ redundant feature๊ฐ€ ์กด์žฌํ•˜๊ณ , feature ์ˆ˜๊ฐ€ 40๊ฐœ ์ด์ƒ์œผ๋กœ ๊ณ ์ฐจ์› ํ•™์Šต์˜ ์–ด๋ ค์›€์ด ๋ฐœ์ƒํ•จ

- ํ•ด๊ฒฐ: xmv๋Š” ๋ฐ˜๋“œ์‹œ ์œ ์ง€, xmeas๋Š” ์ƒ๊ด€๊ด€๊ณ„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•„ํ„ฐ๋ง. xmeas-xmeas๋Š” ํ•˜๋‚˜ ์ œ๊ฑฐ, xmeas-xmv๋Š” xmv ์œ ์ง€

- ์ธ์‚ฌ์ดํŠธ: ๋‹จ์ˆœํžˆ feature ์ˆ˜๋ฅผ ์ค„์ด๊ธฐ๋ณด๋‹ค๋Š” ๋„๋ฉ”์ธ ์ง€์‹ ๊ธฐ๋ฐ˜์˜ ์„ ํƒ์ด ์ค‘์š”ํ•จ

๐Ÿ“Š ์ƒ๊ด€๊ณ„์ˆ˜ EDA
์ƒ๊ด€๊ณ„์ˆ˜ ๊ทธ๋ž˜ํ”„

โ–ฒ ์ƒ๊ด€๊ณ„์ˆ˜ ๊ทธ๋ž˜ํ”„

์ƒ๊ด€๊ณ„์ˆ˜ 0.9์ด์ƒ์ธ ๋ณ€์ˆ˜๋“ค

โ–ฒ ์ƒ๊ด€๊ณ„์ˆ˜๊ฐ€๊ฐ€ 0.9 ์ด์ƒ์ธ ๋ณ€์ˆ˜๋“ค์„ xmeas-xmeas, xmeas-xmv, xmv-xmv 3๊ฐ€์ง€ ์ข…๋ฅ˜๋กœ ๋‚˜๋ˆ„์–ด์„œ ์‹œ๊ฐํ™”

๐Ÿ“Œ Scaler/์ƒ๊ด€๊ณ„์ˆ˜ threshold ๋ฌด์˜๋ฏธ

- ์‹คํ—˜: Standard / MinMax / Robust Scaler๋ฅผ ๋น„๊ตํ•˜๊ณ , ์ƒ๊ด€๊ณ„์ˆ˜ ๊ธฐ์ค€๋„ 0.8๊ณผ 0.9๋กœ ์‹คํ—˜ํ•จ

- ๊ฒฐ๊ณผ: scaler๋Š” ์„ฑ๋Šฅ์— ํฐ ์ฐจ์ด๋ฅผ ๋ณด์ด์ง€ ์•Š์œผ๋ฉฐ, threshold ์กฐ์ • ์—ญ์‹œ ์ œ๊ฑฐ feature ์ˆ˜๋‚˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ์˜๋ฏธ ์žˆ๋Š” ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š์Œ

- ๊ฒฐ๋ก : ๊ธฐ๋ณธ ์„ค์ • ์œ ์ง€๊ฐ€ ํ•ฉ๋ฆฌ์ ์ด๋ฉฐ, feature ์กฐํ•ฉ๊ณผ ๋ชจ๋ธ ๊ตฌ์กฐ๊ฐ€ ์„ฑ๋Šฅ์— ๋” ์˜ํ–ฅ ํผ

๐Ÿ“Š scaler/correlation ๋น„๊ต ์‹คํ—˜ (wandb)
์ƒ๊ด€๊ณ„์ˆ˜์— ๋”ฐ๋ฅธ accuracy ์ฐจ์ด

โ–ฒ ์ƒ๊ด€๊ณ„์ˆ˜0.8๊ณผ 0.9 ๋น„๊ต ๊ฒฐ๊ณผ: ์œ ์˜๋ฏธํ•œ acc ๋ณ€ํ™” ์—†์Œ.

scaler์— ๋”ฐ๋ฅธ accuracy ์ฐจ์ด

โ–ฒ scaler ๋ณ„ acc ๋น„๊ต: ์œ ์˜๋ฏธํ•œ ๋ณ€ํ™” ์—†์Œ

๐Ÿ“Œ Data Augmentation ์‹คํŒจ

- ์‹œ๋„: ๋žœ๋ค feature ์ œ๊ฑฐ, ๋…ธ์ด์ฆˆ ์ถ”๊ฐ€, ์—ฐ์† ๋ณ€๋™ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ทน๋‹จ๊ฐ’ ๋ฐ ์—ฐ์† ์ด์ƒ์น˜๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜์—ฌ ์ด์ƒ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์„ ์‹œ๋„ํ•จ.

- ๊ฒฐ๊ณผ: ์ƒ์„ฑ๋œ ์ด์ƒ์น˜๋Š” ์‹ค์ œ test ๋ฐ์ดํ„ฐ์™€ ๋ถ„ํฌ๊ฐ€ ๋‹ฌ๋ž์œผ๋ฉฐ, t-SNE ์‹œ๊ฐํ™” ๊ฒฐ๊ณผ์—์„œ๋„ test์™€์˜ ์œ ์‚ฌ์„ฑ์ด ๋–จ์–ด์ง€๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚˜ augmentation ์ „๋žต์€ ์‹คํŒจํ•จ.

๐Ÿ“Š t-SNE ๋น„๊ต ์‹œ๊ฐํ™”
t-SNE: test-train ๋น„๊ต

โ–ฒ test ๋ฐ์ดํ„ฐ ๋‚ด๋ถ€์— train๊ณผ ๋ช…ํ™•ํžˆ ๊ตฌ๋ณ„๋˜๋Š” ํด๋Ÿฌ์Šคํ„ฐ๋“ค์ด ๋‹ค์ˆ˜ ์กด์žฌํ•จ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Œ.

t-SNE: test-train-aug ๋น„๊ต

โ–ฒ aug ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ–ˆ์„ ๋•Œ, test์™€์˜ ๊ตฌ๋ถ„์ด ์˜คํžˆ๋ ค ๋” ๋ถˆ๋ช…ํ™•ํ•ด์ง€๊ณ  aug ๋ฐ์ดํ„ฐ๊ฐ€ ๋ณ„๋„๋กœ ๊ตฐ์ง‘ํ™”๋˜๋Š” ํ˜„์ƒ์ด ๋‚˜ํƒ€๋‚จ.

๐Ÿ“Œ simulation-run ๊ฐ„์˜ ์ด์ƒ์น˜ ํ›„์ฒ˜๋ฆฌ

- ๊ด€์ฐฐ: ๋”ฅ๋Ÿฌ๋‹ ๋ฐ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ๊ฒฐ๊ณผ๋ฅผ t-SNE๋กœ ์‹œ๊ฐํ™”ํ•œ ๊ฒฐ๊ณผ, ์ผ๋ถ€ ์˜ˆ์ธก๋œ ์ด์ƒ์น˜๊ฐ€ train ๋ฐ์ดํ„ฐ์˜ ์ •์ƒ ๊ตฐ์ง‘ ๋‚ด๋ถ€์— ํฌํ•จ๋˜์–ด ์žˆ๋Š” ํ˜„์ƒ์ด ๋‹ค์ˆ˜ ํ™•์ธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

- ๋ฌธ์ œ: ์ด๋Ÿฌํ•œ ์œ ํ˜•์˜ ์ด์ƒ์น˜๋Š” ๊ธฐ์กด ์ด์ƒ ํƒ์ง€ ๋ชจ๋ธ์ด ์ •์ƒ ๋ฐ์ดํ„ฐ๋กœ ์ž˜๋ชป ํŒ๋‹จํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์—ˆ์œผ๋ฉฐ, ๊ทธ๋กœ ์ธํ•ด ์˜ˆ์ธก ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฐœ์ƒํ–ˆ์Šต๋‹ˆ๋‹ค.

- ํ•ด๊ฒฐ: test ๋ฐ์ดํ„ฐ๋Š” 1 set์— 50๊ฐœ์˜ run์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค๋Š” ์ ์— ์ฐฉ์•ˆํ•ด, ๊ฐ run ๋‚ด ์ด์ƒ์น˜๊ฐ€ ์ผ์ • ๋น„์œจ(์˜ˆ: 5%) ์ด์ƒ์ผ ๊ฒฝ์šฐ ํ•ด๋‹น run ์ „์ฒด๋ฅผ ์ด์ƒ์น˜๋กœ ํŒ๋‹จํ•˜๋Š” ํ›„์ฒ˜๋ฆฌ ์ „๋žต์„ ์ ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

- ๊ฒฐ๊ณผ: ํ›„์ฒ˜๋ฆฌ ์ „๋žต ์ ์šฉ ์ดํ›„, train ๋ฐ์ดํ„ฐ ๊ตฐ์ง‘ ๋‚ด๋ถ€์— ์ˆจ๊ฒจ์ ธ ์žˆ๋˜ ์ด์ƒ์น˜๋„ ํšจ๊ณผ์ ์œผ๋กœ ํƒ์ง€๋˜์—ˆ๊ณ , ์ „์ฒด์ ์ธ ์˜ˆ์ธก ์ •ํ™•๋„๋„ ๋ˆˆ์— ๋„๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

- ์ธ์‚ฌ์ดํŠธ: ๊ฐœ๋ณ„ ์ƒ˜ํ”Œ ๋‹จ์œ„๋ณด๋‹ค ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‹จ์œ„(run ๋‹จ์œ„)๋กœ ํŒ๋‹จํ•˜๋Š” ๋ฐฉ์‹์ด ์‹ค์ œ ์‚ฐ์—… ํ™˜๊ฒฝ์—์„œ์˜ ์ด์ƒ ํƒ์ง€์— ๋ณด๋‹ค ์ ํ•ฉํ•˜๋ฉฐ, t-SNE์™€ ๊ฐ™์€ ์‹œ๊ฐํ™” ๊ธฐ๋ฒ•์ด ํƒ์ง€ ์‹คํŒจ์˜ ์›์ธ์„ ํŒŒ์•…ํ•˜๋Š” ๋ฐ ๋งค์šฐ ์œ ์šฉํ•˜๋‹ค๋Š” ์ ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ“Š AutoEncoder ์‹œ๊ฐํ™” ๊ฒฐ๊ณผ ๋ฏธ๋ฆฌ๋ณด๊ธฐ

โ–ฒ t-SNE ์‹œ๊ฐํ™” ๊ฒฐ๊ณผ: ์ผ๋ถ€ ์˜ˆ์ธก๋œ ์ด์ƒ์น˜๊ฐ€ ์ •์ƒ train ๋ฐ์ดํ„ฐ ๊ตฐ์ง‘ ๋‚ด๋ถ€์— ํฌํ•จ๋˜์–ด ์žˆ๋Š” ๋ชจ์Šต

๐Ÿ” ์ „์ฒด ํ™”๋ฉด์œผ๋กœ ๋ณด๊ธฐ

๐ŸŒŸ ํŒ€ ์„ฑ๊ณผ

์ตœ์ข… ๋ฆฌ๋”๋ณด๋“œ ๊ฒฐ๊ณผ

โ–ฒ ์ตœ์ข… ๋ฆฌ๋”๋ณด๋“œ ๊ฒฐ๊ณผ: F1-score ๊ธฐ์ค€ 1์œ„ ๊ธฐ๋ก

๐Ÿ’ก ๊นจ๋‹ฌ์€ ์ 

์ด๋ฒˆ ํ”„๋กœ์ ํŠธ๋ฅผ ํ†ตํ•ด ๋‹จ์ˆœํžˆ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ๊ฒƒ๋ณด๋‹ค ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ๊ณผ ๋„๋ฉ”์ธ ๊ตฌ์กฐ๋ฅผ ์ดํ•ดํ•˜๊ณ  ๋ฐ˜์˜ํ•˜๋Š” ์ „๋žต์ด ํ›จ์”ฌ ๋” ํฐ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์ฒด๊ฐํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์ „์ฒด์ ์ธ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์™€ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๊ณ ๋ คํ•œ feature selection, ๊ทธ๋ฆฌ๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‹จ์œ„์˜ ํ›„์ฒ˜๋ฆฌ๋Š” ์‹ค์ œ ์‚ฐ์—… ํ™˜๊ฒฝ์—์„œ๋„ ์‘์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐฉ์‹์ด์—ˆ์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ ํ”„๋กœ์ ํŠธ ๋„์ค‘ ๊ฐ€์žฅ ์ธ์ƒ ๊นŠ์—ˆ๋˜ ์  ์ค‘ ํ•˜๋‚˜๋Š” train ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ๋‚ด๋ถ€์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์ด์ƒ์น˜์˜ ์กด์žฌ์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฏธ์„ธ ์ด์ƒ์น˜๋Š” ์ •์ƒ ๋ฐ์ดํ„ฐ์™€ ๊ฑฐ์˜ ์œ ์‚ฌํ•œ ํŠน์„ฑ์„ ๊ฐ€์ง€์ง€๋งŒ ์‹ค์ œ๋กœ๋Š” ์‹œ์Šคํ…œ ์ด์ƒ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒฝ์šฐ๋กœ, ๊ธฐ์กด ์ด์ƒ ํƒ์ง€ ๋ชจ๋ธ์ด ์ด๋ฅผ ์ •์ƒ์œผ๋กœ ์˜ค์ธํ•  ์œ„ํ—˜์ด ํฌ๋ฉฐ, ํƒ์ง€ ์„ฑ๋Šฅ์„ ์ €ํ•˜์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์—์„œ ๋งค์šฐ ๊นŒ๋‹ค๋กœ์šด ๋ฌธ์ œ์˜€์Šต๋‹ˆ๋‹ค.

์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ ์šฉํ•œ run ๋‹จ์œ„ ํ›„์ฒ˜๋ฆฌ ์ „๋žต์€ ์ƒ˜ํ”Œ ๋‹จ์œ„๋กœ๋Š” ํฌ์ฐฉ๋˜์ง€ ์•Š๋˜ ์ด์ƒ์น˜๋ฅผ ๋ณด์™„ํ•˜๊ณ , ์‹ค์ œ ์šด์˜ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋” ์ ํ•ฉํ•œ ํƒ์ง€ ๊ฒฐ๊ณผ๋ฅผ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค๋Š” ์ค‘์š”ํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ์ œ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ wandb๋ฅผ ํ™œ์šฉํ•œ ์‹คํ—˜ ๊ธฐ๋ก ๋ฐ ์‹œ๊ฐํ™”๋Š” ํ”„๋กœ์ ํŠธ ํšจ์œจ์„ฑ๊ณผ ๊ฐ€์‹œ์„ฑ์„ ํฌ๊ฒŒ ๋†’์—ฌ์ฃผ์—ˆ์œผ๋ฉฐ, ํ–ฅํ›„ ๋‹ค์–‘ํ•œ ํ”„๋กœ์ ํŠธ์—์„œ๋„ ๋ฐ˜๋ณต ํ™œ์šฉํ•˜๊ณ  ์‹ถ์€ ์œ ์šฉํ•œ ๋„๊ตฌ์ž„์„ ๋А๊ผˆ์Šต๋‹ˆ๋‹ค. ๋‹จ์ˆœํ•œ ์„ฑ๋Šฅ ์ˆ˜์น˜ ์ด์ƒ์œผ๋กœ, ๋ฐ์ดํ„ฐ ํ•ด์„๊ณผ ์‹คํ—˜ ์„ค๊ณ„์— ๋Œ€ํ•œ ๊นŠ์ด ์žˆ๋Š” ๊ณ ๋ฏผ์ด ํ•„์š”ํ•จ์„ ๋‹ค์‹œ๊ธˆ ์‹ค๊ฐํ•œ ๊ฒฝํ—˜์ด์—ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”— ์ฐธ๊ณ  ๋งํฌ