'파이썬' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록파이썬 (6)

Data Navigator

[python] python List와 Tuple 데이터 정렬 하기 sort, sorted

List 와 Tuple의 정렬 sort, sorted¶ sort: 리스트와 튜플 자체를 정렬 (return값이 없음)¶ reverse: 내림차순으로 정렬할지에 대한 여부를 결정하는 매개변수 pandas에서 inplace=True로 설정한 것과 같음 sorted: 정렬된 리스트와 튜플을 반환¶ reverse: 내림차순으로 정렬할지에 대한 여부를 결정하는 매개변수 key: 정렬 기준 함수(주로 lambda 함수 사용) sort 함수- 리스트.sort() 형식으로 사용, sort(리스트) 형식은 오류¶ In [4]: L = [1,4,3,5,2,5] L.sort() # 출력이 없고 L자체가 수정됨 In [5]: L Out[5]: [1, 2, 3, 4, 5, 5] In [3]: L = [1,4,3,5,2,5] L..

Python 2021. 4. 11. 09:34

[pandas] groupby를 이용한 조건부 통계

groupby를 활용한 조건부 통계¶ groupby는 조건부 통계량을 계산하기 위한 방법¶분할, 적용, 결합의 3단계로 구성됨¶ 사용 방법: df.groupby(분할 기준 컬럼)[적용 기준 칼럼].집계함수 주요입력: by:분할 기준 컬럼(목록) as_index: 분할 기준 컬럼들을 인덱스로 사용할 것인지 여부 (default: True) 여러 개의 집계 함수나 사용자 정의 함수를 쓰고 싶다면 agg 함수를 사용해야 함 pivot_table과 groupby의 차이점¶ 결과값은 pivot_table과 groupby는 동일함 그러나 출력 값의 형태에 차이가 있으므로 상황에 맞게 구별해 사용 pivot_table은 출력 결과 자체가 결과물인 경우, groupby는 중간 산출물로써 사용 pivot_table은 h..

Python/Pandas 2021. 4. 10. 09:15

[pandas] pivot_table을 이용한 조건별 변수별 통계량 파악

pivot table 조건에 따른 변수들의 통계량 파악¶ pandas.pivot_table 행단위 데이터 프레임을 피벗 테이블로 변환 data: 데이터 프레임 index: 행에 들어갈 조건 columns: 열에 들어갈 조건 values: 집계 대상 컬럼 목록 aggfunc: 집계 함수 In [1]: import os import pandas as pd os.chdir(r"D:\bigdata\jupyter\data_preprocessing\1. 데이터 핸들링\데이터") In [4]: df = pd.read_csv("온라인_판매기록.csv", encoding="ANSI", engine='python') In [5]: df.head() Out[5]: 쇼핑몰 제품 수량 판매금액 쇼핑몰 유형 0 쿠..

Python/Pandas 2021. 4. 9. 09:11

[pandas] merge로 데이터 프레임 합치기

Pandas - merge를 이용한 데이터 프레임 통합¶ merge는 sql의 join과 같은 방식으로 통합된다. In [5]: import os import pandas as pd os.chdir(r"D:/bigdata/jupyter/data_preprocessing/1. 데이터 핸들링\데이터/") merge 기초 In [6]: df1 = pd.read_csv("merge_실습_employee_group.csv", engine="python") df2 = pd.read_csv("merge_실습_employee_hire_date.csv", engine="python") In [7]: df1 Out[7]: employee group 0 Bob Accounting 1 Jake Engineering 2 Lis..

Python/Pandas 2021. 4. 7. 11:07

[sklearn] Logistic Regression을 활용한 소비자 광고 반응률 예측

Logistic Regression을 활용한 소비자 광고 반응률 예측¶ In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [3]: df = pd.read_csv('./03. 광고 반응률 예측 (Logistic Regression)/advertising.csv') df.head(10) Out[3]: Daily Time Spent on Site Age Area Income Daily Internet Usage Ad Topic Line City Male Country Timestamp Clicked on Ad 0 68.95 NaN 61833.90 256.09 Cloned 5t..

Machine Learning, Deep Learning 2021. 1. 22. 23:10

파이썬 코드 효율적으로 짜기 - 20시간을 2초로 바꾼 몇 줄의 코드 수정

for korean in df['description']: if isHangul(korean[0]) == True: isKor = df.loc[df['description'] == korean] KoreanReviews = pd.concat([KoreanReviews,isKor]) else: notKor = df.loc[df['description'] == korean] ForeignReviews = pd.concat([ForeignReviews,notKor]) print('일치: ',len(KoreanReviews['description'].value_counts()), '불일치: ', len(ForeignReviews['description'].value_counts())) 247,519개의 자료를 ..

Python 2021. 1. 13. 07:04

이전 Prev 1 Next 다음

목록파이썬 (6)

Data Navigator

티스토리툴바