상세정보
미리보기
Must Have 머신러닝·딥러닝 문제해결 전략
- 저자
- 신백균 저
- 출판사
- 골든래빗
- 출판일
- 2022-04-13
- 등록일
- 2023-04-13
- 파일포맷
- PDF
- 파일크기
- 33MB
- 공급사
- 예스이십사
- 지원기기
-
PC
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
문제해결 방식에 정답은 없어도 패턴은 있다이 책에는 수많은 캐글 수상자의 노트북을 리팩터링하며 찾아낸 공통된 패턴이 담겨 있다. 이 책과 함께 체계적인 머신러닝·딥러닝 문제해결 프로세스를 숙달해보자. 단순 따라하기에서 벗어나 어떤 점을 분석해야 하는지, 분석 결과를 어떻게 적용하는지, 이 기법이 왜 유용하고 어떻게 활용하는지까지 친절하게 알려준다. 기본이 몸에 익으면 새로운 문제가 주어져도 쉽게 응용할 수 있다. 엄선한 7가지 대회와 별책부록인 〈공략집〉을 통해 기본기와 문제해결 능력을 확실하게 길러준다.
저자소개
KAIST 산업및시스템공학과 졸업 후 한국생산성본부에서 직무교육 기획 및 운영을 담당하는 전문위원입니다. 세계 랭킹 0.18%의 캐글 노트북 엑스퍼트(Expert)이며, 월 평균 6만여 명이 방문하는 데이터 분석/머신러닝 관련 기술 블로그를 운영하고 있습니다. 참여자 1,200명 이상인 머신러닝 관련 오픈 채팅방의 운영진이기도 합니다.
목차
[1부] 머신러닝 레벨업의 지름길, 캐글01장 왜 캐글인가?__1.1 왜 캐글을 해야 하는가?__1.2 캐글 구성요소__1.3 캐글러 등급__학습 마무리02장 캐글 정복 첫걸음__2.1 캐글 가입__2.2 경진대회 참여__2.3 주피터 노트북 설정__2.4 결과 제출하기__2.5 컨트리뷰터 되기__2.6 예제 코드 캐글 노트북 복사하기__학습 마무리03장 문제해결 프로세스 및 체크리스트__3.1 머신러닝 문제해결 프로세스__3.2 머신러닝 문제해결 체크리스트__3.3 딥러닝 문제해결 프로세스__3.4 딥러닝 문제해결 체크리스트04장 데이터를 한눈에 : 주요 시각화 그래프__4.1 데이터 종류__4.2 탐색적 데이터 분석과 그래프__4.3 수치형 데이터 시각화__4.4 범주형 데이터 시각화__4.5 데이터 관계 시각화[2부] 머신러닝 문제해결05장 다시 살펴보는 머신러닝 주요 개념__5.1 분류와 회귀__5.2 분류 평가지표__5.3 데이터 인코딩__5.4 피처 스케일링__5.5 교차 검증__5.6 주요 머신러닝 모델__5.7 하이퍼파라미터 최적화06장 [경진대회] 자전거 대여 수요 예측 ★☆☆__6.1 경진대회 이해__6.2 경진대회 접속 방법 및 세부 메뉴__6.3 탐색적 데이터 분석__분석 정리 및 모델링 전략__6.4 베이스라인 모델__6.5 성능 개선 I : 릿지 회귀 모델__6.6 성능 개선 II : 라쏘 회귀 모델__6.7 성능 개선 III : 랜덤 포레스트 회귀 모델__학습 마무리__실전 문제07장 [경진대회] 범주형 데이터 이진분류 ★★☆__7.1 경진대회 이해__7.2 탐색적 데이터 분석__분석 정리 및 모델링 전략__7.3 베이스라인 모델__7.4 성능 개선 I__7.5 성능 개선 II__학습 마무리__실전 문제08장 [경진대회] 안전 운전자 예측 ★★☆__8.1 경진대회 이해__8.2 탐색적 데이터 분석__분석 정리 및 모델링 전략__8.3 베이스라인 모델__8.4 성능 개선 I : LightGBM 모델__8.5 성능 개선 II : XGBoost 모델__8.6 성능 개선 III : LightGBM과 XGBoost 앙상블__학습 마무리09장 [경진대회] 향후 판매량 예측 ★★★__9.1 경진대회 이해__9.2 탐색적 데이터 분석__분석 정리 및 모델링 전략__9.3 베이스라인 모델__9.4 성능 개선__9.5 머신러닝 경진대회를 마치며__학습 마무리[3부] 딥러닝 문제해결10장 다시 살펴보는 딥러닝 주요 개념__10.1 인공 신경망__10.2 합성곱 신경망(CNN)__10.3 성능 향상을 위한 딥러닝 알고리즘11장 [경진대회] 항공 사진 내 선인장 식별 ★☆☆__11.1 경진대회 이해__11.2 탐색적 데이터 분석___분석 정리 및 모델링 전략__11.3 베이스라인 모델__11.4 성능 개선___학습 마무리12장 [경진대회] 병든 잎사귀 식별 ★★☆__12.1 경진대회 이해__12.2 탐색적 데이터 분석___분석 정리 및 모델링 전략__12.3 베이스라인 모델__12.4 성능 개선___학습 마무리___실전 문제13장 [데이터셋] 흉부 엑스선 기반 폐렴 진단 ★★☆__13.1 경진대회 이해__13.2 탐색적 데이터 분석___분석 정리 및 모델링 전략__13.3 베이스라인 모델__13.4 성능 개선___학습 마무리부록 A 캐글 생활백서__A.1 피처 요약표__A.2 메모리 절약을 위한 데이터 다운캐스팅__A.3 디버깅을 위한 간단한 팁__A.4 훈련된 모델 저장하고 불러오기