AI/머신러닝 - 예제7 [머신러닝 - 예제] Hotel 데이터셋 - 랜덤 포레스트 1. Hotel 데이터셋 주제: 이 손님은 예약을 취소할까? 이번 데이터셋의 출처는 kaggle이다. 1-1. 데이터 분석 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt hotel_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/hotel.csv') # 요약 정보 hotel_df.info() output>> RangeIndex: 119390 entries, 0 to 119389 Data columns (total 32 columns): # Column Non-Null Count Dtype --- ------.. AI/머신러닝 - 예제 2023. 12. 29. [머신러닝 - 예제] 손글씨 데이터셋 - 서포트 벡터머신(SVM) 1. digits digits 데이터셋은 사이킷런에서 제공한다. scikit learn의 digits dataset은 UCL ML hand-written digits datasets의 copy라고 한다. https://archive.ics.uci.edu/dataset/80/optical+recognition+of+handwritten+digits UCI Machine Learning Repository This dataset is licensed under a Creative Commons Attribution 4.0 International (CC BY 4.0) license. This allows for the sharing and adaptation of the datasets for any pur.. AI/머신러닝 - 예제 2023. 12. 28. [머신러닝 - 예제] Human Resource 데이터셋 - 로지스틱 회귀 1. 로지스틱 회귀 로지스틱 회귀는 둘 중 하나를 결정하는 문제(이진 분류)를 풀기 위한 대표적인 알고리즘이다. 2. hr 데이터셋 hr 데이터셋은 직원정보와 승진여부에 대한 데이터이다. 직원 데이터를 통해 승진여부를 예측해보자. import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import datetime as dt hr_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/hr.csv') # 요약 정보 hr_df.info() output>> RangeIndex: 54808 entries, 0 to 54807 Da.. AI/머신러닝 - 예제 2023. 12. 27. [머신러닝 - 예제] Bike 데이터셋 - 의사 결정 나무 1. bike 데이터셋 어떤 지역의 날씨 정보와 자전거 대여 현황 데이터셋이다. 2. 데이터 전처리 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import datetime as dt bike_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/bike.csv') 2-1. df.info() # info() bike_df.info() output>> RangeIndex: 33379 entries, 0 to 33378 Data columns (total 16 columns): # Column Non-Null C.. AI/머신러닝 - 예제 2023. 12. 26. [머신러닝 - 예제] Rent 데이터셋 - 선형 회귀 1. 선형회귀 선형회귀는 종속변수와 독립변수간의 선형 관계를 모델링하는 방법이다. 주로 예측, 상관분석, 추정하는 문제에 사용한다. 선형회귀 모델링의 결과는 하나의 직선이다. 직선의 주요 특성은 Coefficient(가중치), Intercept(절편)이다. 여기서 가중치는 기울기를 의미한다. 만약 데이터에 비선형적인 관계나 이상치가 많은 경우엔 다른 회귀 모델을 사용해야 한다. 2. Rent 데이터셋 선형회귀를 이해하고 사용하기 위한 예시로 Rent 데이터셋을 사용한다. Rent는 집 렌트에 관련된 데이터셋이다. import numpy as np import pandas as pd import seaborn as sns rent_df = pd.read_csv('/content/drive/MyDrive/K.. AI/머신러닝 - 예제 2023. 12. 25. [머신러닝 - 예제] 타이타닉 데이터셋 - 캐글 데이터셋 1. 타이타닉 데이터셋 타이타닉 데이터셋은 캐글(Kaggle)에서 다운받을 수 있다. https://www.kaggle.com/ Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. www.kaggle.com 1912년 타이타닉호 침몰시 생존한 승객과 사망한 승객의 정보가 담겨있다. 각 승객의 어떤 정보가 생존여부와 관련이 있는지 데이터 분석을 해보자. 2. CSV파일 열기 제공된 데이터는 csv형식이기 때문에 pandas의.. AI/머신러닝 - 예제 2023. 12. 25. [머신러닝 - 예제] 아이리스 데이터셋 - 사이킷런 데이터셋 1. 데이터셋 사이킷런에서는 다양한 데이터셋을 제공합니다. 데이터셋이란 특정한 작업을 위해 데이터를 관련성 있게 모아놓은 것을 말합니다. 사이킷런에서 제공하는 데이터셋은 아래 링크에서 확인하실 수 있습니다. https://scikit-learn.org/stable/modules/classes.html?highlight=datasets#module-sklearn.datasets API Reference This is the class and function reference of scikit-learn. Please refer to the full user guide for further details, as the class and function raw specifications may not be e.. AI/머신러닝 - 예제 2023. 12. 22. 이전 1 다음