비용 걱정 없이 Open Source Large Language Models(LLMs)을 활용하여 소비자 분쟁조정 사례집에 대한 질의응답(QA) 시스템을 구현합니다.
200페이지 분량의 한국어 PDF 문서를 허깅페이스의 sbert 한국어 임베딩 모델을 활용하여 Chroma 벡터스토어에 저장합니다.
한국어 임베딩 모델의 토크나이저를 기준으로 청크 단위로 분할합니다.
문서 데이터에서 필요 정보를 추출해서 메타데이터에 추가하고, 메타데이터를 활용하여 문서 검색 단계에서 필터링하는 방법을 Chroma DB 기준으로 설명합니다.
랭체인(LangChain), 올라마(Ollama), 람마3(llama3) 모델과 큐원2(qwen2) 모델을 사용합니다.
실습파일(Github) : zrr.kr/FHpk
Негізгі бет 한국어 임베딩 기반 오픈소스 LLM 질의응답 RAG 구현 (PDF 문서) - 랭체인(LangChain), 올라마(Ollama), 허깅페이스(Huggingface)
No video
Пікірлер: 12