높은 충실도의 합성 데이터 를 사용하여 ML 모델 개발

합성 데이터 세트 (Synthetic Datasets)는 사용자가 카메라, 레이더, 레이더 및 고화질 3D 세계에서 생성된 기타 센서 데이터를 사용하여 머신 러닝(ML) 모델의 견고성을 향상시킬 수 있도록 합니다. 사용자는 다양한 액터, 행동 및 환경 조건을 가진 수백만 개의 레이블이 지정된 샘플을 생성할 수 있습니다.

주요 특징

센서 하드웨어를 나타내도록 조정된 검증된 센서 모델 라이브러리. 카메라, 레이더, 레이더 등 지원
오류가 없는 (error-free) 실측 자료 (GT) 레이블을 프로그래밍 방식으로 생성, 기존 파이프라인과 통합할 수 있는 유연한 주석 형식
작업 도메인에 대한 도메인 랜덤화 또는 사용자 지정을 지원하는 자산 및 절차적으로 생성된 3D 월드
필요한 데이터를 쉽게 정의할 수 있는 고급 데이터셋 정의 언어 (definition language) 및 시각적 편집기
통계 보기, 필터링 및 데이터 내보내기를 위한 데이터셋 관리 도구
신속한 데이터셋 생성, 탄력적인 확장성 및 손쉬운 협업을 지원하는 클라우드 우선 (Cloud First) 인프라

ML 개발 가속화

모델 결과를 통합하고 데이터를 자동으로 생성하여 실패 사례를 다룹니다. 확장 가능한 합성 데이터 생성을 통해 데이터 희소성 문제, 클래스 불균형 및 기타 편견을 신속하게 해결합니다.

광선 추적 반사 및 복잡한 실외 조명 조건이 있는 합성 카메라 데이터
자동차 도메인을 넘어 웨어하우스, 농장 등에 대한 지원

세밀한 주석을 사용한 기계 학습

시맨틱 분할, 깊이 및 광학 흐름과 같은 고밀도 레이블을 프로그래밍 방식으로 생성하고 훈련합니다. 실제 데이터는 얻을 수 없거나 매우 비용이 많이 듭니다.

픽셀 단위 시맨틱 세그멘테이션
픽셀당 깊이
픽셀당 광학 흐름 (optical flow)

작업 영역 (task domain) 확장

전이 학습 (transfer learning)을 위해 합성 데이터를 활용하여 새로운 지역, 클래스 또는 센서 하드웨어로 빠르게 확장합니다. 교통 표지판과 같은 지역별로 특화된 에셋을 사용하여 실제 데이터에 대한 의존도를 낮추면서 운영을 안전하게 확장합니다.

합성 데이터 (synthetic data)와 함께 레이블 제공

합성 데이터로 자동 레이블링 학습을 통해 수동 데이터 레이블링의 효율성과 정확성을 향상시킵니다. 레이블이 지정된 합성 데이터를 활용하여 실제 데이터에 대한 준지도 학습을 시작합니다.

프로그래밍 방식으로 생성된 2D 경계 상자(노란색), 3D 경계 볼륨(보라색) 및 차선 표시(녹색)

ML 팀의 효율성 향상

어플라이드의 클라우드 우선 툴은 사용자가 ML 팀 전체에서 쉽게 데이터를 정의, 생성 및 관리할 수 있도록 지원합니다.

고급 언어, 로그 또는 시나리오에서 데이터 세트 생성

ML 모델 교육을 확장하고 출시 기간 단축

실 데이터 보완

실제 데이터가 희박하거나 수집하기 어려운 경우 합성 데이터를 보충 자료로 사용

데이터 레이블링 비용 절감

크고 다양한 합성 데이터 세트를 활용하여 실제 데이터에 레이블을 다는 데 소요되는 시간과 리소스 최소화

데이터 수집 가속화

실제 데이터 수집에 비해 몇 달이 아닌 며칠 내에 생성된 합성 데이터를 통해 ML 팀의 출시 시간 단축