RAG 임베딩 온톨로지 한 번에 정리. 검색 증강 생성부터 벡터 DB와 시맨틱 규칙까지
요즘 트렌드에서 자주 같이 등장하는 RAG, 임베딩, 온톨로지를 엔지니어 관점에서 정리해봄 비유로 감을 잡고, 실제 동작에서 어떤 구성요소가 하는 일을 분리해서 보면 이해가 빠름 임베딩 Embedding. 텍스트를 고차원 벡터로 변환 임베딩은 텍스트 같은 비정형 데이터를 컴퓨터가 계산 가능한 수치형 벡터로 매핑하는 기술임 기본 개념은 단어뿐 아니라 문장, 문서, 이미지 같은 다양한 입력을 공통의 의미 공간 semantic space에 배치하는 표현 방식임 흔히 23차원 예시로 설명하지만, 실제 임베딩 차원 수는 모델마다 다르고 수백수천 차원을 쓰는 경우가 많음. 다만 성능이 차원 수만으로 결정되진 않음 유사도 계산은 단순히 숫자 비슷함을 보는 수준을 넘어, 벡터 간 각도를 기준으로 코사인 유사도 Cosine Similarity 같은 지표를 사용해 의미적 거리를 계산함 간단히 말하면 임베딩은 의미를 담아 숫자로 옮기는 도구임 ...