Mr. Know-All (2) – 2023.8

[Mr. Know-All 2호 – 2023년 8월]

 

llm 연동 ai앱을 하다보면, 기업 내부 데이터에 접근하는 요구가 거의 필수 적입니다. 기업 내부 데이터를 llm 학습하는데 제공하지 않을 것이니. 이런 데이터는 다양한 양식의 문서나 데이터베이스에서 관리될 것이다. 우선 pdf 형식 파일에 저장된 것부터 처리해 보자는거다.

 

https://www.youtube.com/watch?v=TLl1R2irR4Y

OpenAI API Key, LangChain, Streamlit을 사용한다. Streamlit을 사용하고 있어 ui 코드가 짧으니 접근하기 쉽다.

벡터스토어로 FAISS를 사용한다.

 

 https://www.youtube.com/watch?v=rIV1EseKwU4

벡터스토어로 ChromaDB를 사용한다. 영상과 관련된 레파지토리는 이거 같다.  https://github.com/AIAnytime/Search-Your-PDF-App

유투버 깃헙에 다른 참조할 것들도 많다. https://github.com/AIAnytime

설명도 잘 해 준다. 시간이 주어지면 설명 내용도 정리하고 싶다.

 

https://github.com/InsightEdge01/ChainlitPDFchatBot

ui에 대한 설정이 여러 가지 있다.

 

https://github.com/InsightEdge01/ChainlitPDFchatBot

미리보기 기능이 있다.

 

 https://www.youtube.com/watch?v=hvFTqKOaHAs

https://github.com/RajKKapadia/DLAI-Langchain

다른 곳에서 다루지 않는 랭체인 클래스들을 다룬다.

 

https://www.youtube.com/watch?v=wytCkiUh_Ys

기술 스택이 좀 다르네.

너무 많이 나온다. 걸르고 걸른건데 지금도 많다. 하나만 보기를 추천한다면, 이거 보고 아래 레파지토리 코드 이해하고, 나머지 관련 영상들은 모두 지웠다. 더 이상 이 주제는 보지 않는다.

https://github.com/mayooear/gpt4-pdf-chatbot-langchain

About the Author
(주)뉴테크프라임 대표 김현남입니다. 저에 대해 좀 더 알기를 원하시는 분은 아래 링크를 참조하세요. http://www.umlcert.com/kimhn/

Leave a Reply

*