머신러닝 운영(MLOps) 플랫폼 VESSL 소개 — GPU 도입부터 학습/개발/배포 플랫폼을 한번에!

6 min readOct 28, 2024

안녕하세요 VESSL AI 팀 입니다.

VESSL AI는 기업 및 인공지능(AI) 개발자가 대규모로 AI / LLM 모델을 빠르게 구축, 운영할 수 있게 해주는 end-to-end MLOps 플랫폼 ‘VESSL’을 제공합니다. 별도의 복잡한 환경 설정 없이도 VESSL을 통해 무엇을 할 수 있는지 이번 글을 통해 알아보세요.

“MLOps 환경과 GPU 인프라 구성을 한번에”

VESSL AI가 여러분의 GPU 사용의 어려움을 해결해 드립니다!

1. 머신러닝 플랫폼 (ML Platform)

: 인프라와 AI 애플리케이션들 사이의 운영 라이프사이클을 하나의 플랫폼에서 관리할 수 있도록 제공합니다.

2. 관리가 쉬움 (Easy Management)

: 학습, 배포, 자동화의 각 단계를 한 플랫폼 내에서 지원하여 코드 기반으로 체계적으로 관리할 수 있습니다.

3. 비용 최적화 (Cost Optimization)

: 전 세계 최저 수준의 GPU 사용 비용을 머신러닝 플랫폼과 함께 제공하여, 비용 효율적인 연구가 가능하며 향후 기타 프라이빗/퍼블릭 인프라상에서도 일관된 워크플로우를 통해 연구를 할 수 있습니다.

4. 기술 지원 (Tech Support)

: VESSL AI의 GPU Cluster 제공 기업들은 국내에 상주하고 있어, 기술 지원이 필요할 경우 바로 응대 가능합니다.

5. 서비스 이용의 신속성 (Fast GTM)

: 장비/도구 도입 뿐만 아니라 학습시간이 줄어들어서 연구자들이 빠르게 연구를 시작할 수 있도록 돕습니다.

“LLM 시장에 맞추어 MLOps 환경과 GPU 인프라 구성을 한 번에 해드립니다.”

VESSL AI 서비스의 대표 특징 2가지

1. 학습/추론/배포 등을 위한 플랫폼을 제공합니다.

2. 클러스터링/오케스트레이션 (예. 쿠버네티스) 기능 및 GPU를 제공합니다.

1) 온프레미스(*에어갭) 환경에서 GPU 및 AI/ML 플랫폼을 활용할 수 있습니다

온프레미스 데이터센터에서 GPU를 사용하세요.
이미 구매하셨거나 구매 예정인 데이터 센터 내 GPU를 쓰실 수 있습니다.

2) GPU와 머신러닝 플랫폼 (ML Platform)을 한 번에 도입 가능합니다.

VESSL에서 관리하는 클라우드에서 GPU를 사용하세요.
A100은 1시간당 1.8 달러로 합리적으로 사용하실 수 있습니다. (*시기 마다 변동되며 별도 문의 필요)

3) 퍼블릭 클라우드와 연동하고 관리할 수 있습니다.

퍼블릭 클라우드에서 GPU를 사용하고 연동할 수 있습니다.
아마존 웹 서비스 (AWS, Amazon Web Services), 구글 클라우드 플랫폼 (GCP, Google Cloud Platform) 등 CSP(클라우드 서비스 제공자)에 따라 다른 지불 금액 및 서비스를 제공합니다.

*에어갭(Air-Gapped) 환경은 외부 네트워크와 완전히 차단된 시스템을 의미합니다.

VESSL AI 서비스의 주요 대상

1. 연구원

- 최신 주요 LLM 모델 실행을 원하는 분

- 모델 학습 및 상태 모니터링을 원하는 분

- 모델 배포 및 운영을 원하는 분

- 파이프라인 기반 관리를 원하는 분

2. 관리자/플랫폼 팀

- 저렴하고 신속한 GPU 도입 및 최적화, 관리 비용 절감을 원하는 분

- 데이터셋과 모델 자원 통합 관리를 원하는 분

- RBAC 기반 사용자 관리 및 자원 관리를 원하는 분

- 온프레미스 및 퍼블릭 클라우드로 확장 지원을 원하는 분

VESSL AI 서비스의 도입 효과

• 아마존웹서비스(AWS) 대비 절반 이상 저렴한 PaaS 서비스, 로컬 클라우드를 활용 할 수 있습니다.

• 다양한 클라우드와 리전(region)을 활용하여 GPU 부족 문제를 효과적으로 해결하며, 스팟 인스턴스(Spot Instance) 등을 탄력적으 로 활용할 수 있습니다.

사용자 관리 및 자원할당, 성능 모니터링을 한번에 할 수 있으며 연구자들이 수많은 도구의 재교육을 지원합니다.

90%: 직접 구매 대비 더 빠른 환경 구축

- 연구자들을 위한 MLOps로 프로세스 변경 필요 없이 확장할 수 있습니다.

50%: 비용 절감

- GPU + MLOps 플랫폼 제공

30%: 퍼블릭 클라우드 대비 더 빠른 환경 구축

- 대부분의 AI 팀은 학습용 물리 GPU 서버를 같이 활용하고 있으며, 실제 환경 운영을 위 해 클라우드를 같이 활용합니다.

30% : 운영/교육비 추가 감소

- On-prem / 타 Public 클라우드 확장 시 동 일한 Platform 이용 가능

“MLOps 플랫폼 VESSL의 플랜 2가지”

-개인을 위한 베이직 플랜 & 기업을 위한 엔터프라이즈 플랜

MLOps 플랫폼 VESSL은 2가지 플랜으로 구성됩니다.

1) 베이직 플랜

대상: MLOps의 기능을 활용하고 싶은 개인

• VESSL 실행, 서비스 및 파이프라인 기능을 모두 이용할 수 있음

• 유연하게 사용할 수 있으며, 사용한 양만큼 지불할 수 있음

• 시간당 $1.80부터 시작하는 NVIDIA A100 80G 인스턴스

2) 엔터프라이즈 플랜

대상: MLOps의 모든 기능 활용 + 고급 보안 및 전담 지원이 필요한 조직

• 엔터프라이즈급 보안 기능 및 보장된 SLA

• 예약된 GPU 인스턴스 및 스토리지

• 온보딩을 포함한 전담 지원 및 맞춤형 MLOps 서비스

자주 묻는 질문

질문1/ VESSL은 사용량을 어떻게 계산하나요?

- VESSL 런(Run), 서비스(Service) 및 Pipeline(파이프라인)의 총 워크로드 시간을 계산합니다.

질문 2/ 크레딧은 유효기간이 끝나면 없어지나요?

- 네, 크레딧은 만료됩니다. 구매한 모든 크레딧의 유효기간은 1년입니다. Enterprise 요금제의 경우 만료 기간이 연장된 대량 크레딧을 구매할 수 있습니다.

질문 3/ 추가 크레딧을 살 수 있나요?

- 네, 조직 > 설정 > 청구 및 요금제 페이지를 방문하거나 VESSL AI 영업팀( sales@vessl.ai)으로 문의하세요.

질문 4/ 맞춤형 인보이스를 제공 받을 수 있나요?

- 네, 기업 고객을 위한 맞춤형 인보이스를 제공합니다. 자세한 내용은 VESSL AI 영업팀(sales@vessl.ai)에 문의하세요.

“MLOps 플랫폼 VESSL 도입에 관심이 있다면?”

sales@vessl.ai에 문의주세요.

“더 자세히 살펴보고 싶다면?”

[VESSL AI] VESSL 서비스 소개 자료.pdf

Edit description

bit.ly

머신러닝 운영(MLOps) 플랫폼 VESSL 소개 — GPU 도입부터 학습/개발/배포 플랫폼을 한번에!

[VESSL AI] VESSL 서비스 소개 자료.pdf

Edit description

Written by VESSL AI

No responses yet