생성형 AI 시대 뉴테크프라임은?
0 Comment
gpt에 열광하는 지금 ai 관련 사업을 하시는 분들은 세 가지 중 하나를 선택하는 거 같다.
1. 돈도 많이 들고 어렵지만, chatgpt와 같은 base llm을 만든다.
2. llama2와 같은 오픈소스 llm을 파인튜닝 해서 자체 llm을 만든다.
3. llm 보유 기업이 제공하는 llm api 연동 ai 앱을 만든다.
1번은 돈이 엄청 많이 든다. 전 세계적으로 극히 일부만 살아남는다. 국가 주도를 하고 싶은 국가에서 그나마 살아남을 수 있다. 국가들은 자국 언어로 된 데이터로 사전 훈련된 llm을 원한다.
2번은 오픈llm이 아니라면, 소수 기업을 대상으로 1번에서 성공한 기업들이 제공할 것이기에, 이것도 부르는 돈이 만만치 않을 것 같다.
3번은 기업 데이터가 유출될 위험이 있기 때문에, 기업 데이터를 철저하게 보장한다는 aws와 같은 클라우드 서비스를 사용할 것이다. 그런데 그걸 어떻게 믿을 수 있느냐의 문제가 있다.
여력이 부족한 중소 기업들은 어떻게 gpt와 같은 모델을 사용해서 기업 업무를 할까? 고민스럽다.
ai 업계도 이 시장을 그냥 바라보고 있지는 않고 있다. 현재 제시되는 수준은 3번을 선택하는데, 기업 보유 데이터는 벡터화하고 벡터화된 데이터는 클라우드 벡터 데이터스토어(데이터베이스)에서 관리하도록 하는 방법이다.벡터 스토어로 관리되는 데이터와 관련된 데이터는 여기서 검색해서 연동된 llm에게 프롬프트의 컨텍스트 항목으로 전달된다. 연동된 llm은 증강지식이란 그럴듯한 이름으로 이 데이터를 포함해서 응답을 만든다.
구글이나 openai나 네이버와 같은 llm 보유하고 클라우드도 있는 기업은 2번에 집중해서 여력이 되는 큰 기업들 정도를 대상으로 하고 있는 것으로 보인다. 그렇다면 그런 여력이 없지만 해야 되겠다라고 하는 수 많은 기업들은 증강 된 3번 방법을 선택할 것이다.
이런 시장에 뭐가 있나를 살펴보면, 지금 시점에서 라마인덱스(https://www.llamaindex.ai/)와 파인콘(https://www.pinecone.io/)이 있다.
뉴테크프라임은 증강 된 3번에 참여해서, 기술적으로 라마인덱스와 파인콘에 전력투구하려 한다.