AIPilotSmarteasy 사용해 보기 – 나 교수와 업무 시작 (20240928) – Ai2’s Molmo shows open source can meet, and beat, closed multimodal models
0 Comment
AI2의 Molmo, 오픈 소스 멀티모달 모델의 가능성 입증
이 기사는 AI2에서 개발한 오픈 소스 멀티모달 AI 모델인 Molmo를 소개하며, 거대 기업 중심의 AI 생태계에 변화를 가져올 가능성을 조명합니다. Molmo는 작고 무료이며 완전한 오픈 소스임에도 불구하고, Google, OpenAI, Anthropic 등의 최첨단 모델과 동등한 성능을 보여줍니다.
핵심 내용:
- Molmo의 기능: ChatGPT와 같은 챗봇이 아닌 시각적 이해 엔진으로, 이미지를 보고 이해하고 설명하거나 질문에 답할 수 있습니다.
- Molmo의 차별점: 기능 자체보다는 적은 데이터와 컴퓨팅 파워로 높은 성능을 달성하는 방식에 있습니다. GPT-4o, Gemini 1.5 Pro, Claude-3.5 Sonnet 등과 비슷한 성능을 내면서도 크기는 1/10에 불과합니다.
- Molmo의 핵심 기술: 엄선되고 주석이 달린 60만 개의 고품질 이미지 데이터셋을 사용하여 훈련되었습니다. 수십억 개의 이미지를 사용하는 다른 모델과 달리, 데이터의 질에 집중하여 효율성을 높였습니다. 또한, 사람들이 이미지를 보고 말로 설명하는 방식을 활용하여 더욱 풍부하고 실용적인 이미지 설명을 생성합니다.
- Molmo의 혁신적인 기능: 이미지에서 관련 부분을 “가리키는” 기능을 통해 새로운 제로샷(zero-shot) 작업을 수행할 수 있습니다. 웹 인터페이스에서도 웹사이트 코드를 보지 않고도 페이지 탐색, 양식 제출 등의 작업을 이해하고 수행할 수 있습니다.
- Molmo의 중요성: 완전한 무료 오픈 소스이며 로컬에서 실행 가능할 정도로 작다는 점입니다. 개발자와 크리에이터는 거대 기술 기업의 허가나 비용 없이 AI 기반 앱, 서비스, 경험을 만들 수 있습니다. AI2는 데이터, 클리닝, 주석, 훈련, 코드, 체크포인트, 평가 등 모든 개발 과정을 공개하여 접근성을 높였습니다.
기사의 시사점:
Molmo는 오픈 소스 AI 모델의 가능성을 보여주는 중요한 사례입니다. 거대 기술 기업들이 자본과 인력을 기반으로 AI 개발을 주도하는 상황에서, Molmo는 오픈 소스 커뮤니티의 잠재력을 보여주고 AI 기술의 민주화에 기여할 수 있음을 시사합니다. 또한, 적은 데이터와 컴퓨팅 파워로 높은 성능을 달성하는 Molmo의 접근 방식은 향후 AI 연구 및 개발에 중요한 영향을 미칠 것으로 예상됩니다. 거대 기업 중심의 AI 생태계에 변화를 가져올 촉매제 역할을 할 수 있을지 주목됩니다.
Molmo by Ai2 페이지에 AI Pilot Smarteasy Giant Step 이미지를 전달하니 아래와 같이 이야기 하네요. 한국어로 설명해 달라고 했습니다. 한 단어 제대로 안 보이는 거 빼고는 잘 응답하는 것으로 보입니다.
“AI Pilot Smart Easy”라는 이름의 기술 또는 서비스를 소개하는 포스터입니다. 포스터는 “Giant Step”라는 문구와 함께 “In your work, take giant leaps with the power and vigor of a giant”라는motivational slogan을 사용합니다. 포스터의 중심에는 거대한 신인형 인물이 있습니다. 신인형은 강력한 몸매와 생각하는 자세를 취합니다. 신인형의 무릎에 앉아있는 것은 정상적인 크기인 사람입니다. 신인형은 생각하는 자세를 취하며, 무릎에 앉은 사람을 바라봅니다. 배경에는 풍경이 그려져 있습니다. 하늘은 파란색이며, 많은 구름이 있습니다. земля는 주황색이며, 땔산들이 있습니다. 포스터는 기술적 또는 서비스적 내용을 강조하기 위해 상상력이 풍부한, 동화 같은 미술 스타일을 사용합니다. 이 포스터는 사용자가 기술을 사용하여 성취할 수 있는 큰 목표나 성취물을 상상하도록 독려합니다. “Giant Step”라는 이름은 기술이 사용자의 업무에서 큰 진전을 가능하게 한다라는 것을 강조합니다.