일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- deeplearning
- 랭체인
- 딥러닝
- 파이썬웹개발
- pytorch
- 파이썬
- 파이토치
- programmablesearchengine
- fastapi #python웹개발
- OpenAIAPI
- fastapi #파이썬웹개발
- 사이킷런
- 판다스
- 파이토치기본
- sklearn
- HTML
- 판다스 데이터정렬
- fastapi
- 자연어분석
- 비지도학습
- pandas
- 챗gpt
- Python
- konlpy
- MachineLearning
- python 정렬
- langchain
- 머신러닝
- chatGPT
- NLP
- Today
- Total
목록머신러닝 (6)
Data Navigator
Kmeans Clustering 을 활용한 데이터 기반 고객 분류¶ 연령, 소득 수준, 성별에 따른 소비 패턴을 분석하고 분류¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [5]: data = pd.read_csv('Mall_Customers.csv', index_col= 0) In [6]: data.head() Out[6]: Gender Age Annual Income (k$) Spending Score (1-100) CustomerID 1 Male 19 15 39 2 Male 21 15 81 3 Female 20 16 6 4 Female 23 16 77 5 F..
NLP 상품 리뷰 분석¶ In [2]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [3]: data = pd.read_csv('./09. 상품 리뷰 분석(NLP)/yelp.csv', index_col =0) In [4]: data.head() Out[4]: review_id user_id business_id stars date text useful funny cool 2967245 aMleVK0lQcOSNCs56_gSbg miHaLnLanDKfZqZHet0uWw Xp_cWXY5rxDLkX-wqUg-iQ 5 2015-09-30 LOVE the cheeses here. They ..
Logistic Regression을 활용한 소비자 광고 반응률 예측¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [3]: df = pd.read_csv('./03. 광고 반응률 예측 (Logistic Regression)/advertising.csv') df.head(10) Out[3]: Daily Time Spent on Site Age Area Income Daily Internet Usage Ad Topic Line City Male Country Timestamp Clicked on Ad 0 68.95 NaN 61833.90 256.09 Cloned 5t..
02 Linear Regression을 이용한 고객별 연간 지출액 예측(statsmodels 사용)¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [2]: data = pd.read_csv('./02 Linear Regression을 이용한 고객별 연간 지출액 예측/ecommerce.csv') In [3]: data.head() Out[3]: Email Address Avatar Avg. Session Length Time on App Time on Website Length of Membership Yearly Amount Spent 0 mstephenson@fe..
SVM 서포트 백터 머신을 이용해서 외국어 문장 판별하기¶ In [25]: from sklearn import svm, metrics import glob, os.path, re, json In [15]: def check_freq(fname): name = os.path.basename(fname) lang = re.match(r'^[a-z]{2,}',name).group() with open(fname, 'r', encoding='utf-8') as f: text = f.read() text = text.lower() cnt=[0 for n in range(0,26)] code_a = ord('a') #97~ code_z = ord('z') for ch in text: n = ord(ch) #숫자값 ..
Traditional programing VS machine learning 기존의 프로그래밍은 개발자가 프로그래밍을 하고 인풋을 받아 프로그램으로 처리한 후 아웃풋 도출 머신러닝은 인풋과 아웃풋만 사용 중간 프로그래밍은 컴퓨터가 알아서 해줌 인풋데이터와 아웃풋 데이터를 가지고 컴퓨터를 학습시킴 머신러닝의 종류 1. Supervisied Learning 인풋 데이터와 아웃풋 데이터를 모두 컴퓨터에 알려주고 학습을 시키는 것 2. Unsupervised Learning 컴퓨터가 인풋 데이터를 가지고 알아서 아웃풋을 내주는 것 대표적으로 클러스터링이 있음. 데이터에서 비슷한 특성을 가진 것들을 컴퓨터가 알아서 구별해서 분류해줌. e.g. 과일이 가득한 자료에서 무게, 색깔, 크기 등 어떤 특정 조건을 가지고..