개발 관련 공부11 bagging(배깅)이란? ※[오늘의 공부]앙상블에서 중요한 bagginng(배깅)에 대해 공부해보고자 한다. ▶ 배깅이란앙상블의 핵심 키워드는 다양성이다. 다양성에는 데이터의 다양성과 모델의 다양성 2개가 존재하는데 배깅의 경우 데이터의 다양성을 주제로 한다.Bagging(Bootstrap Aggregating)이란 기존 학습 데이터로부터 랜덤하게 ‘복원추출’하여 동일한 사이즈의 데이터 세트를 여러개 만들어 앙상블을 구성하는 여러 모델을 학습시키는 방법이다. ※ 복원 추출 예시 * 여기서 bootstrap은 복원추출로 만들어진 새로운 데이터 세트이다. * 우리가 원하는 개수만큼 복원추출을 통해 Bootstrap을 생성이 가능하다.▶ bootstrap 효과 (1) 학습관점: 데이터가 갖는 분포를 좋은 쪽으로 왜곡시킴. -> .. 2024. 12. 25. Ensemble(앙상블)이란? [오늘의 공부]내가 인공지능을 처음 접했을 때부터 자주 사용하는 앙상블 알고리즘에 대해 공부해보고자 한다. ▶ 앙상블이란여러 개의 분류기를 생성하고, 그 예측을 결합함으로써 보다 정확한 예측을 도출하는 기법이다. ▶ 개요특정 알고리즘이 모든 데이터에 대한 성능 즉, 분류나 예측을 진행할 때 항상 1등인 알고리즘은 존재할까? 라는 궁금증이 생겼다.조사를 해보니 JMLR에 발표한 논문 중 121개의 데이터 세트를 171개의 알고리즘(boosting 제외)으로 30번 학습을 한 결과가 있는데 결론을 말하자면, 상대적으로 RF, SVM 계열이 높게 나오긴 했으나 절대적으로 성능이 좋은 알고리즘은 없다는 것을 보여준다.결론적으로 최적의 알고리즘은 문제의 목적, 데이터의 형태 등을 종합적으로 고려하여 선택해야 하며.. 2024. 12. 17. Docker 이해하기 [오늘의 공부]요즘 인공지능 관련 분야 뿐만 아니라 여러 분야에서 사용하고 있는 Docker(이하, 도커)에 대해 공부해보고자 한다.도커는 컨테이너 기술을 기반으로 한 일종의 가상화 플랫폼입니다. 컨테이너에는 라이브러리, 시스템 도구, 코드, 런타임 등 소프트웨어를 실행하는데 필요한 모든 것이 포함되어 있다. ▶ 도커의 필요성기존에 사용하던 가상 머신(VM)은 사용하기 위해 OS를 설치해야 했고, 이미지 안에 OS가 포함되어 있기 때문에 용량이 매우 크고 속도가 느리다는 단점이 있다.이에 비해 반가상화보다 더 경량화된 방식을 사용하는 도커는 OS 전체를 가상화하지 않고 컨테이너라는 리눅스 커널 레벨에서 제공하는 가상 공간을 사용하여 월등한 속도로 동작하며, 리눅스 컨테이너를 기반으로 이미지를 편리하게 관.. 2024. 12. 3. 이전 1 2 3 다음