728x90
파이썬의 scikit-learn 라이브러리를 활용한 머신러닝 스터디를 진행면서 아래 순서대로 정리해보려고 한다.
- 소개
- 왜 머신러닝인가?
- 왜 파이썬인가?
- scikit-learn
- 필수 라이브러리와 도구들
- 파이썬 2 vs 파이썬3
- 머신러닝 애플리케이션을 만들기 위한 소프트웨어 버전
- 첫 번째 머신러닝 모델 : 붓꽃의 품종 종류
- 요약
- 지도학습
- 분류와 회귀
- 일반화, 과대적합, 과소적합
- 지도 학습 알고리즘
- 분류 예측의 불확실성 추정
- 요약 및 정리
- 비지도 학습과 데이터 전처리
- 비지도 학습의 종류
- 비지도 학습의 도전 과제
- 데이터 전처리와 스케일 조정
- 차원 축소, 특성 추출, 매니폴드 학습
- 군집
- 요약 및 정리
- 데이터 표현과 특성 공학
- 범주형 변수
- 구간 분할, 이산화 그리고 선형 모델, 트리 모델
- 상호작용과 다항식
- 일변량 비선형 변환
- 특성 자동 선택
- 전문가 지식 활용
- 요약 및 정리
- 모델 평가와 성능 향상
- 교차 검증
- 그리드 서치
- 평가 지표와 측정
- 요약 및 정리
- 알고리즘 체인과 파이프라인
- 데이터 전처리와 매개변수 선택
- 파이프 라인 구축하기
- 그리드 서치에 파이프라인 적용하기
- 파이프라인 인터페이스
- 전처리와 모델의 매개변수를 위한 그리드 서치
- 모델 선택을 위한 그리드 서치
- 요약 및 정의
- 텍스트 데이터 다루기
- 문자열 데이터 타입
- 예제 애플리케이션 : 영화 리뷰 감성 분석
- 텍스트 데이터를 BOW로 표현하기
- 불용어
- tf-idf로 데이터 스케일 변경하기
- 모델 계수 조사
- 여러 단어로 만든 BOW(n-그램)
- 고급 토큰화, 어간 추출, 표제어 추출
- 토픽 모델링과 문서 군집화
- 요약 및 정리
- 마무리
- 머신러닝 문제 접근 방법
- 프로토타입에서 제품까지
- 제품 시스템 테스트
- 나만의 추정기 만들기
- 더 배울 것들
- 마치며
reference
http://www.hanbit.co.kr/store/books/look.php?p_code=B6119391002
728x90
'머신러닝(Machine Learning)' 카테고리의 다른 글
2-2 일반화, 과대적합, 과소적합 (0) | 2017.09.27 |
---|---|
2-1 분류와 회귀 (0) | 2017.09.19 |
1-5 파이썬 2 vs 파이썬 3 (0) | 2017.09.18 |
1-6 머신러닝 애플리케이션을 만들기 위한 소프트웨어 버전 (0) | 2017.09.16 |
1-2 왜 파이썬인가? (0) | 2017.09.16 |