상세정보
미리보기
XGBoost와 사이킷런을 활용한 그레이디언트 부스팅
- 저자
- 코리 웨이드 저/박해선 역
- 출판사
- 한빛미디어
- 출판일
- 2022-04-11
- 등록일
- 2023-04-13
- 파일포맷
- PDF
- 파일크기
- 7MB
- 공급사
- 예스이십사
- 지원기기
-
PC
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
캐글 우승자들의 머신러닝 우승 비법이자 현존하는 가장 우월한 머신러닝 모델 XGBoost이 책은 기본적인 머신러닝과 판다스부터 사용자 정의 변환기, 파이프라인과 희소 행렬로 새로운 데이터의 예측을 만드는 강력한 XGBoost 모델 튜닝까지 모두 다룬다. 또한 XGBoost의 탄생 배경과 XGBoost를 특별하게 만드는 수학적 이론과 기술, 물리학자와 천문학자가 우주를 연구하는 사례 연구까지 다양한 XGBoost의 흥미로운 이야기와 캐글 마스터들의 우승 비법까지 소개한다. 마지막으로 더 확실한 이해를 위해 원서에는 없는 친절하고 상세한 역자 노트와 다른 그레이디언트 부스팅 라이브러리를 배울 수 있는 한국어판만의 부록을 추가하여 내용을 더욱 가득 채웠다. 이 책 한 권이면 복잡한 XGBoost 개념을 완벽하게 이해하고 제품을 위한 머신러닝을 구축해볼 수 있게 된다. 그레이디언트 부스팅을 현업에 적용해보고 싶은 머신러닝 엔지니어나 캐글 대회를 준비하고 있는 캐글 도전자에게 훌륭한 안내서가 되어줄 것이다.
저자소개
수학과 예술 분야 석사이고 버클리 코딩 아카데미(Berkeley Coding Academy)의 설립자이자 이사로 전세계 10대들에게 머신러닝과 인공지능을 가르치고 있습니다. 또한 코리는 버클리 고등학교 독립 학습 프로그램의 수학 분야 의장으로서 프로그래밍과 고등 수학을 가르치고있습니다. 기초적인 자연어 처리를 가르치며, 패스스트림(Pathstream)과 데이터 과학 커리큘럼을 개발하고, 투워드 데이터 사이언스(Towards Data Science), 스프링보드(Springboard), 미디엄(Medium)에 통계학과 머신러닝 글을 기고합니다. 『The Python Workshop』(Packt, 2019)의 공동 저자이기도 합니다.
목차
CHAPTER 0 코딩 환경 설정0.1 아나콘다0.2 주피터 노트북 사용하기0.3 XGBoost0.4 버전PART 1 배깅과 부스팅CHAPTER 1 머신러닝 개요1.1 XGBoost 소개1.2 데이터 랭글링1.3 회귀 모델 만들기1.4 분류 모델 만들기1.5 마치며CHAPTER 2 결정 트리2.1 결정 트리 소개2.2 결정 트리 알고리즘2.3 분산과 편향2.4 결정 트리 하이퍼파라미터 튜닝2.5 심장 질환 예측하기 - 사례 연구2.6 마치며CHAPTER 3 배깅과 랜덤 포레스트3.1 배깅 앙상블3.2 랜덤 포레스트 살펴보기3.3 랜덤 포레스트 매개변수3.4 랜덤 포레스트 성능 높이기 - 사례 연구3.5 마치며CHAPTER 4 그레이디언트 부스팅에서 XGBoost까지4.1 배깅에서 부스팅까지4.2 그레이디언트 부스팅 작동 방식4.3 그레이디언트 부스팅 매개변수 튜닝4.4 빅 데이터 다루기 - 그레이디언트 부스팅 vs XGBoost4.5 마치며PART 2 XGBoostCHAPTER 5 XGBoost 소개5.1 XGBoost 구조5.2 XGBoost 파라미터 최적화5.3 XGBoost 모델 만들기5.4 힉스 보손 찾기 - 사례 연구5.5 마치며CHAPTER 6 XGBoost 하이퍼파라미터6.1 데이터와 기준 모델 준비6.2 XGBoost 하이퍼파라미터 튜닝6.3 조기 종료 적용6.4 하이퍼파라미터 결합6.5 하이퍼파라미터 조정6.6 마치며CHAPTER 7 XGBoost로 외계 행성 찾기7.1 외계 행성 찾기7.2 오차 행렬 분석하기7.3 불균형 데이터 리샘플링7.4 XGBClassifier 튜닝7.5 마치며PART 3 고급 XGBoostCHAPTER 8 XGBoost 기본 학습기8.1 여러 가지 기본 학습기8.2 gblinear 적용하기8.3 dart 비교하기8.4 XGBoost 랜덤 포레스트8.5 마치며CHAPTER 9 캐글 마스터에게 배우기9.1 캐글 대회 둘러보기9.2 특성 공학9.3 상관관계가 낮은 앙상블 만들기9.4 스태킹9.5 마치며CHAPTER 10 XGBoost 모델 배포10.1 혼합 데이터 인코딩10.2 사용자 정의 사이킷런 변환기10.3 XGBoost 모델 만들기10.4 머신러닝 파이프라인 구성하기10.5 마치며APPENDIX A (한국어판 부록) 다른 그레이디언트 부스팅 라이브러리A.1 LightGBMA.2 사이킷런의 히스토그램 기반 그레이디언트 부스팅A.3 CatBoost