Негізгі бет 한국어 임베딩 기반 오픈소스 LLM 질의응답 RAG 구현 (PDF 문서) - 랭체인(LangChain), 올라마(Ollama), 허깅페이스(Huggingface)

No video

Күн бұрын

한국어 임베딩 기반 오픈소스 LLM 질의응답 RAG 구현 (PDF 문서) - 랭체인(LangChain), 올라마(Ollama), 허깅페이스(Huggingface)

Рет қаралды 2,537

비용 걱정 없이 Open Source Large Language Models(LLMs)을 활용하여 소비자 분쟁조정 사례집에 대한 질의응답(QA) 시스템을 구현합니다.
200페이지 분량의 한국어 PDF 문서를 허깅페이스의 sbert 한국어 임베딩 모델을 활용하여 Chroma 벡터스토어에 저장합니다.
한국어 임베딩 모델의 토크나이저를 기준으로 청크 단위로 분할합니다.
문서 데이터에서 필요 정보를 추출해서 메타데이터에 추가하고, 메타데이터를 활용하여 문서 검색 단계에서 필터링하는 방법을 Chroma DB 기준으로 설명합니다.
랭체인(LangChain), 올라마(Ollama), 람마3(llama3) 모델과 큐원2(qwen2) 모델을 사용합니다.
실습파일(Github) : zrr.kr/FHpk

Жүктеу

Пікірлер: 12

@user-ke8sv1eq2c
27 күн бұрын
선댓 후 시청합니다. 잘 볼게용
@pandas-data-studio
27 күн бұрын
감사합니다^^
@musicphimhan7530
Ай бұрын
좋은 정보 감사합니다.
@pandas-data-studio
Ай бұрын
감사합니다!
@francisggum5
Ай бұрын
하나의 pdf 파일내에 동일한 구성의 문서 구조로 다양한 주제가 계속 반복되는 구조에서 하나의 주제에 대해서만 쪽집게 처럼 조회 할 수 있는 기능을 구현하고 싶었는데요. 제가 원하던 정답에 많이 근접 했네요!! 너무 감사드립니다!
@pandas-data-studio
Ай бұрын
감사합니다^^
@user-ji4mi1gi3z
Ай бұрын
감사합니다! 인프런에도 랭체인 최신내용 업데이트 될까용? 구매 또는 후원하고싶네요 ㅎㅎ
@pandas-data-studio
Ай бұрын
감사합니다!! 인프런에 RAG 강의를 기획하고 있는데 잘 준비하겠습니다^^
@myungkoo802
Ай бұрын
안녕하세요? 아주 가치있는 내용을 잘 정리하여 공유해주셨습니다. 감사합니다. 혹시 깃허브주소나 소스파일 공유받을 수 있나요? 혼자서 실행해보면 훨씬 도움이 될 거 같습니다.
@pandas-data-studio
Ай бұрын
안녕하세요. 동영상 설명에 깃헙 링크를 연결해 두었습니다. 감사합니다!
@myungkoo802
Ай бұрын
@@pandas-data-studio 아 네, 모바일에서는 안보였는데 Pc에서는 보이네요. 감사합니다. 좋은 강의 거듭 감사드려요.
@pandas-data-studio
Ай бұрын
감사합니다^^