Embedding

All Posts

Published on
2026년 4월 15일
ANN 알고리즘 완전 가이드 2025: HNSW, IVF, Product Quantization, LSH — 벡터 DB의 내부는 어떻게 작동하는가
ann hnsw ivf product-quantization lsh vector-database similarity-search embedding rag llm
Pinecone, Weaviate, Qdrant, pgvector가 수억 벡터에서 밀리초 만에 유사 항목을 찾는 비결. HNSW, IVF, Product Quantization, LSH 등 ANN 알고리즘의 수학과 구현을 720줄로 깊이 있게 파헤친다.
Published on
2026년 4월 15일
RAG 실전 완전 가이드: 검색, 임베딩, 벡터 DB, Fine-tuning의 경계 (2025)
rag llm ai vector-db embedding fine-tuning deep-dive series
LLM에 외부 지식을 붙이는 가장 실용적인 패턴, RAG. 2025년 시점에서 임베딩 모델 선택, 청킹 전략, 벡터 DB 선택, Rerank, Hybrid Search, 그리고 Fine-tuning과의 경계까지. Notion AI와 Claude의 검색 아키텍처를 해부하고, 한국어 RAG의 특수성과 비용·지연시간 최적화 체크리스트를 한 호흡에 정리합니다.
Published on
2026년 4월 13일
Advanced RAG 파이프라인 완전 가이드 2025: 청킹 전략, 리랭킹, 에이전틱 RAG, 평가
rag retrieval-augmented-generation chunking reranking agentic-rag evaluation langchain llamaindex embedding llm 2026-04 2026-04-13
Advanced RAG의 모든 것! 문서 청킹 전략(Semantic/Recursive/Agentic), 리랭킹(Cohere/ColBERT/Cross-encoder), Query Transformation, 에이전틱 RAG(Self-RAG/CRAG), Multi-modal RAG, 평가(RAGAS/TruLens), 프로덕션 최적화.
Published on
2026년 4월 13일
Vector Database 완전 가이드 2025: 임베딩, 유사도 검색, Pinecone/Weaviate/Qdrant/pgvector
vector-database embedding similarity-search pinecone weaviate qdrant pgvector chromadb hnsw ai-infrastructure 2026-04 2026-04-13
Vector DB의 모든 것! 벡터 임베딩 원리, 유사도 검색(코사인/유클리드/내적), 인덱싱 알고리즘(HNSW/IVF/PQ), Pinecone vs Weaviate vs Qdrant vs Milvus vs pgvector 비교, 하이브리드 검색, 필터링, 프로덕션 운영, 성능 벤치마크.
Published on
2026년 3월 18일
Embedding 모델 선택 완전 가이드: OpenAI부터 오픈소스까지 2025년 기준
Embedding 임베딩모델 RAG AI개발 OpenAI BGE 벡터검색
2025년 기준 주요 임베딩 모델들을 MTEB 벤치마크 기준으로 비교하고, 언어/예산/프라이버시/규모에 따른 실전 선택 가이드를 제공합니다. OpenAI, Cohere, BGE-M3, E5 등 핵심 모델 완벽 정리.
Published on
2026년 3월 17일
LLM, Tool Calling, Embedding 벤치마크 완전 분석: 각 벤치마크가 측정하는 것
LLM 벤치마크 MMLU MTEB BFCL Embedding Tool-Calling 문서파싱
MMLU, HellaSwag, HumanEval, BFCL, MTEB 등 주요 AI 벤치마크들이 정확히 무엇을 측정하는지, 각 점수의 의미와 한계, 그리고 실제 활용 시 어떤 벤치마크를 참고해야 하는지 완전히 분석합니다.
Published on
2026년 3월 17일
RAG 시스템 완전 정복: 검색 증강 생성의 모든 것
rag retrieval-augmented-generation llm vector-database langchain embedding 2026-03 2026-03-17
RAG(검색 증강 생성) 시스템을 완전히 마스터하는 가이드. 기본 RAG부터 고급 Self-RAG, Corrective-RAG, HyDE까지, 벡터 데이터베이스, 임베딩 모델, 청킹 전략, 리랭킹까지 실전 예제로 구축합니다.
Published on
2026년 3월 13일
임베딩 모델 완전 가이드: 벡터 검색·RAG·Sentence Transformers 실전 활용
llm embedding vector-search rag sentence-transformers semantic-search 2026-03 2026-03-13
임베딩의 기본 개념부터 주요 모델 비교(OpenAI, Cohere, BGE, E5, GTE, Jina), Sentence Transformers 활용, 벡터 데이터베이스(Pinecone, Weaviate, Milvus, Chroma, FAISS) 인덱싱 전략, 유사도 검색, RAG 파이프라인 통합, 파인튜닝, MTEB 벤치마크 평가까지 임베딩 모델의 모든 것을 실전 코드와 함께 체계적으로 다룹니다.
Published on
2026년 3월 11일
RAG 파이프라인 프로덕션 구축 가이드: 벡터 DB 선택부터 청킹·리랭킹·평가까지
llm rag vector-database retrieval embedding 2026-03 2026-03-11
RAG(Retrieval-Augmented Generation) 파이프라인의 프로덕션 구축을 체계적으로 다룹니다. 임베딩 모델 비교, 벡터 DB 선택(Pinecone·Milvus·Weaviate·Qdrant·Chroma), 청킹 전략, 하이브리드 검색, 리랭킹, RAGAS 평가 메트릭, 장애 대응까지 실전 운영 노하우를 제공합니다.
Published on
2026년 3월 9일
Qdrant 벡터DB 운영 및 사용 방법 총정리 — 컬렉션 설계부터 RAG 연동까지
database qdrant vector-database embedding similarity-search rag
Qdrant 벡터DB의 핵심 개념부터 컬렉션 설계, 인덱스 전략, 필터링, RAG 파이프라인 연동, 운영 모니터링까지 실전에서 바로 쓸 수 있는 가이드를 정리했습니다.
Published on
2026년 3월 2일
PostgreSQL + pgvector 벡터 검색 실전 가이드: RAG부터 하이브리드 검색까지
postgresql pgvector vector-search embedding rag similarity-search hnsw ivfflat hybrid-search database
PostgreSQL pgvector 확장으로 벡터 유사도 검색을 구현한다. 설치부터 HNSW/IVFFlat 인덱스, 하이브리드 검색(벡터+전문검색), RAG 파이프라인 통합까지 실전 코드 포함.

Embedding

embedding (11)