블로그 :
https://zzsza.github.io/mlops/2018/12/28/mlops/
MLOps를 왜 할까?
- 모든 도구는 결국 핵심기능과 더 나은 퍼포먼스 혹은 비용절감으로 통한다.
1. drift
- 모델의 고유하면서 고질적인 문제이긴 한데, model drift, data drift가 발생한다. 이를 발생할 때마다 데이터 하나하나를 처다보고 있을 수 없기 때문에 해결할 수 있는 효율적인 Data pipeline이 필요하다.
2. 인건비 절감
- 반복되는 개발소요를 interactive centric ai로 uiux에 의한 개발로 풀어낼 수 있다. 흔히 ai researcher가 억대 연봉이라 하는데 프로세스화 시킨다면 진입장벽을 낮춰 인력요구수준을 낮출 수 있을 것이다.
3. data 비용절감
- 데이터 수집조차도 비용이다. 실무에서 많이 느끼는 것은 양계장, 양식장의 직원과 협업하기 위해 그들에게 AI의 원리, 가용범위, 데이터수집기 품질관리, 라벨링 방식등을 계속 교육, 설득, 주입 시켜야 했다는 것이다. 도메인과 AI와의 갭이 있다. 현실을 데이터로 이끌어내는 것이 만만치 않았다.
- 수집된 데이터를 전처리하고 라벨링하는 비용도 만만치 않다. 이부분만 따로 때어놔도 제품이 될진데, 본연의 모델개발을 위해서라면 모델개발을 위한 일련의 과정에서 빠질 수 없다. 한 클래스당 최소 3만개, 권장 5~8만개는 학습 시켜야 한다. 그리고 성능 좋았다는 모델들 들어보면 현장에서 들어온 데이터 중에 경계선 라벨링 개선했다고 한다.
'기획PM > 시장기술조사' 카테고리의 다른 글
CNAS Understanding China's AI Strategy - Gregory C. Allen FINAL 2.15.19 (0) | 2023.04.14 |
---|---|
Machine Learning Operations (MLOps): Overview, Definition, and Architecture Review (0) | 2023.02.13 |
테스트 (0) | 2022.07.14 |
Hidden Technical Debt in Machine Learning Systems 논문 리뷰 (0) | 2022.06.28 |
MLOps - Definitions, Tools and Challenges Review || arXiv:2201.00162v1 [cs.LG] 1 Jan 2022 (0) | 2022.06.01 |