728x90
반응형

블로그 : 

https://zzsza.github.io/mlops/2018/12/28/mlops/

 

머신러닝 오퍼레이션 자동화, MLOps

MLOps 춘추 전국 시대 정리 자료를 정리한 글입니다 최초 작성했던 글을 2021년 6월에 모두 수정했습니다 키워드 : MLOps, MLOps란, MLOps 정의, MLOps 플랫폼, MLOps 엔지니어, MLOps 뜻, MLOps pipeline, MLOps framewo

zzsza.github.io

 

MLOps를 왜 할까?

- 모든 도구는 결국 핵심기능과 더 나은 퍼포먼스 혹은 비용절감으로 통한다.

 

1. drift

- 모델의 고유하면서 고질적인 문제이긴 한데, model drift, data drift가 발생한다. 이를 발생할 때마다 데이터 하나하나를 처다보고 있을 수 없기 때문에 해결할 수 있는 효율적인 Data pipeline이 필요하다.

 

2. 인건비 절감

- 반복되는 개발소요를 interactive centric ai로 uiux에 의한 개발로 풀어낼 수 있다. 흔히 ai researcher가 억대 연봉이라 하는데 프로세스화 시킨다면 진입장벽을 낮춰 인력요구수준을 낮출 수 있을 것이다.

 

3. data 비용절감

- 데이터 수집조차도 비용이다. 실무에서 많이 느끼는 것은 양계장, 양식장의 직원과 협업하기 위해 그들에게 AI의 원리, 가용범위, 데이터수집기 품질관리, 라벨링 방식등을 계속 교육, 설득, 주입 시켜야 했다는 것이다. 도메인과 AI와의 갭이 있다. 현실을 데이터로 이끌어내는 것이 만만치 않았다.

 

- 수집된 데이터를 전처리하고 라벨링하는 비용도 만만치 않다. 이부분만 따로 때어놔도 제품이 될진데, 본연의 모델개발을 위해서라면 모델개발을 위한 일련의 과정에서 빠질 수 없다. 한 클래스당 최소 3만개, 권장 5~8만개는 학습 시켜야 한다. 그리고 성능 좋았다는 모델들 들어보면 현장에서 들어온 데이터 중에 경계선 라벨링 개선했다고 한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형

+ Recent posts