2025.11.17 (Day 16) Project: Data Acquisition & Preprocessing
TMDB 데이터 이상치 제거·텍스트 정제 및 ChromaDB Vector DB 구축
TMDB 데이터 이상치 제거·텍스트 정제 및 ChromaDB Vector DB 구축
팀 프로젝트 킥오프 - 영화 흥행 요인 분석 프로젝트 기획서·기술 정의서 작성 및 기술 스택 확정
실시간 로그 스트리밍과 RAG 기반 보안 챗봇을 하나의 Streamlit 앱으로 통합한 모니터링 시스템 구현
LLM과 RAG를 활용한 보안 로그 자동 분석, 위험도 분류, 지리적 공격 시각화 대시보드 구현
LangChain의 RAG 구조와 FAISS 벡터스토어를 활용한 검색 기반 OpenAI Dashboard 구현
Streamlit과 OpenAI API를 연결하여 API Key 보호·입력 검증·보안형 LLM 챗봇 앱 구현
Folium 지도 시각화, Plotly 인터랙티브 그래프, Streamlit 대시보드 구성 실습. 공격 지점·시간대별 패턴 분석을 위한 보안 시각화 파이프라인 구성 방법 정리.
Matplotlib과 Seaborn을 활용한 보안 로그 시각화 기초 학습. 로그인 실패율·지연시간 분석, 사용자별 이상 패턴 탐지, 피벗 기반 히트맵 구성 방법 정리.
Numpy와 Pandas를 활용한 보안 로그 정규화 기초 학습. loadtxt, DataFrame 변환, 결측치 처리, 타입 변환을 통한 로그 전처리 파이프라인 구성 방법 정리.
Numpy & Pandas 기반 로그 적재, 결측값 처리, JSON 변환, 기초 이상 탐지 흐름 학습