일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- HTML
- langchain
- pytorch
- 사이킷런
- chatGPT
- 파이썬
- 비지도학습
- 자연어분석
- fastapi #파이썬웹개발
- fastapi
- pandas
- 판다스 데이터정렬
- 랭체인
- 파이썬웹개발
- konlpy
- deeplearning
- NLP
- fastapi #python웹개발
- python 정렬
- 챗gpt
- 딥러닝
- OpenAIAPI
- 데이터분석
- sklearn
- MachineLearning
- 파이토치
- 머신러닝
- 판다스
- Python
- programmablesearchengine
- Today
- Total
목록전체 글 (93)
Data Navigator

pandas Series 정렬 sort_values(), value_counts, unique¶ sort_values() 사용¶ ascending: 오름차순으로 정렬 key: 정렬 기준 함수(주로 lambda 함수 사용) na_position: 결측이 있는 경우 어디에 배치할 것인지 결정 {first, last} In [1]: import pandas as pd import numpy as np In [2]: S = pd.Series(np.random.randint(1,10,100)) #1과 10 사이의 숫자를 100개 생성 S.iloc[0:3] = np.nan # 0부터 3까지 결측치로 변환 S.head(10) Out[2]: 0 NaN 1 NaN 2 NaN 3 2.0 4 7.0 5 6.0 6 9.0 7..

List 와 Tuple의 정렬 sort, sorted¶ sort: 리스트와 튜플 자체를 정렬 (return값이 없음)¶ reverse: 내림차순으로 정렬할지에 대한 여부를 결정하는 매개변수 pandas에서 inplace=True로 설정한 것과 같음 sorted: 정렬된 리스트와 튜플을 반환¶ reverse: 내림차순으로 정렬할지에 대한 여부를 결정하는 매개변수 key: 정렬 기준 함수(주로 lambda 함수 사용) sort 함수- 리스트.sort() 형식으로 사용, sort(리스트) 형식은 오류¶ In [4]: L = [1,4,3,5,2,5] L.sort() # 출력이 없고 L자체가 수정됨 In [5]: L Out[5]: [1, 2, 3, 4, 5, 5] In [3]: L = [1,4,3,5,2,5] L..

groupby를 활용한 조건부 통계¶ groupby는 조건부 통계량을 계산하기 위한 방법¶분할, 적용, 결합의 3단계로 구성됨¶ 사용 방법: df.groupby(분할 기준 컬럼)[적용 기준 칼럼].집계함수 주요입력: by:분할 기준 컬럼(목록) as_index: 분할 기준 컬럼들을 인덱스로 사용할 것인지 여부 (default: True) 여러 개의 집계 함수나 사용자 정의 함수를 쓰고 싶다면 agg 함수를 사용해야 함 pivot_table과 groupby의 차이점¶ 결과값은 pivot_table과 groupby는 동일함 그러나 출력 값의 형태에 차이가 있으므로 상황에 맞게 구별해 사용 pivot_table은 출력 결과 자체가 결과물인 경우, groupby는 중간 산출물로써 사용 pivot_table은 h..