머신러닝(Machine Learning)

파이썬 라이브러리를 활용한 머신러닝 요약

leebaro 2017. 9. 16.
728x90

파이썬의 scikit-learn 라이브러리를 활용한 머신러닝 스터디를 진행면서 아래 순서대로 정리해보려고 한다.




  1. 소개
    1. 왜 머신러닝인가?
    2. 왜 파이썬인가?
    3. scikit-learn
    4. 필수 라이브러리와 도구들
    5. 파이썬 2 vs 파이썬3
    6. 머신러닝 애플리케이션을 만들기 위한 소프트웨어 버전
    7. 첫 번째 머신러닝 모델 : 붓꽃의 품종 종류
    8. 요약
  2. 지도학습
    1. 분류와 회귀
    2. 일반화, 과대적합, 과소적합
    3. 지도 학습 알고리즘
    4. 분류 예측의 불확실성 추정
    5. 요약 및 정리
  3. 비지도 학습과 데이터 전처리
    1. 비지도 학습의 종류
    2. 비지도 학습의 도전 과제
    3. 데이터 전처리와 스케일 조정
    4. 차원 축소, 특성 추출, 매니폴드 학습
    5. 군집
    6. 요약 및 정리
  4. 데이터 표현과 특성 공학
    1. 범주형 변수
    2. 구간 분할, 이산화 그리고 선형 모델, 트리 모델
    3. 상호작용과 다항식
    4. 일변량 비선형 변환
    5. 특성 자동 선택
    6. 전문가 지식 활용
    7. 요약 및 정리
  5. 모델 평가와 성능 향상
    1. 교차 검증
    2. 그리드 서치
    3. 평가 지표와 측정
    4. 요약 및 정리
  6. 알고리즘 체인과 파이프라인
    1. 데이터 전처리와 매개변수 선택
    2. 파이프 라인 구축하기
    3. 그리드 서치에 파이프라인 적용하기
    4. 파이프라인 인터페이스
    5. 전처리와 모델의 매개변수를 위한 그리드 서치
    6. 모델 선택을 위한 그리드 서치
    7. 요약 및 정의
  7. 텍스트 데이터 다루기
    1. 문자열 데이터 타입
    2. 예제 애플리케이션 : 영화 리뷰 감성 분석
    3. 텍스트 데이터를 BOW로 표현하기
    4. 불용어
    5. tf-idf로 데이터 스케일 변경하기
    6. 모델 계수 조사
    7. 여러 단어로 만든 BOW(n-그램)
    8. 고급 토큰화, 어간 추출, 표제어 추출
    9. 토픽 모델링과 문서 군집화
    10. 요약 및 정리
  8. 마무리
    1. 머신러닝 문제 접근 방법
    2. 프로토타입에서 제품까지
    3. 제품 시스템 테스트
    4. 나만의 추정기 만들기
    5.  더 배울 것들
    6. 마치며



reference

http://www.hanbit.co.kr/store/books/look.php?p_code=B6119391002



728x90