Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 파이썬웹개발
- 사이킷런
- 챗gpt
- programmablesearchengine
- python 정렬
- MachineLearning
- langchain
- sklearn
- 판다스
- 랭체인
- 파이썬
- 머신러닝
- konlpy
- pytorch
- 비지도학습
- 딥러닝
- 판다스 데이터정렬
- chatGPT
- Python
- fastapi #파이썬웹개발
- HTML
- deeplearning
- OpenAIAPI
- fastapi
- NLP
- 파이토치기본
- 파이토치
- pandas
- fastapi #python웹개발
- 자연어분석
Archives
- Today
- Total
Data Navigator
[R] 한국KBO 자료를 통한 안타(H)과 병살타(GDP)의 회귀분석 본문
과목 : 03.통계 기반 데이터 분석(교과목평가)¶
문제 1. 사례에 대한 통계적 검증을 위한 귀무가설과 대립가설을 세우시오.¶
사례¶
해외여행 도중 어느 뒷골목에서 동전으로 내기를 하는 도박사를 만났다. 앞면이 나오면 A에게 1달러를, 뒷면인 나오면 B에게 1달러를 주는 동전 내기를 A, B가 하기로 했다. 결과는 8회중 7회 뒷면이 나왔다. A는 뒷면이 나오기 쉬운 것 아니냐? 했고 B는 앞면과 뒷면이 나올 확률이 같더라도 우연히 나올 수 있다 고 했다. 이 경우 통계적 검증을 위한 귀무가설과 대립가설을 세우시오.
In [1]:
df = read.csv('../R Test/R_examples/example_kbo2015.csv', stringsAsFactors = TRUE)
In [2]:
head(df)
ranking | team | AVG | G | PA | AB | R | H | X2B | X3B | ⋯ | IBB | HBP | SO | GDP | SLG | OBP | OPS | MH | RISP | PH.BA | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
<int> | <fct> | <dbl> | <int> | <int> | <int> | <int> | <int> | <int> | <int> | ⋯ | <int> | <int> | <int> | <int> | <dbl> | <dbl> | <dbl> | <int> | <dbl> | <dbl> | |
1 | 1 | 삼성 | 0.300 | 102 | 4091 | 3553 | 634 | 1066 | 188 | 19 | ⋯ | 15 | 47 | 650 | 78 | 0.471 | 0.374 | 0.845 | 101 | 0.300 | 0.216 |
2 | 2 | 넥센 | 0.300 | 102 | 4151 | 3620 | 658 | 1085 | 227 | 12 | ⋯ | 13 | 61 | 815 | 79 | 0.498 | 0.374 | 0.872 | 100 | 0.294 | 0.268 |
3 | 3 | 두산 | 0.291 | 99 | 3950 | 3410 | 570 | 991 | 176 | 16 | ⋯ | 17 | 66 | 544 | 95 | 0.438 | 0.368 | 0.806 | 98 | 0.284 | 0.262 |
4 | 4 | NC | 0.288 | 101 | 3994 | 3485 | 591 | 1002 | 205 | 20 | ⋯ | 17 | 74 | 717 | 65 | 0.453 | 0.362 | 0.815 | 101 | 0.296 | 0.274 |
5 | 5 | 롯데 | 0.277 | 104 | 4082 | 3557 | 545 | 985 | 176 | 14 | ⋯ | 16 | 57 | 866 | 105 | 0.444 | 0.356 | 0.800 | 104 | 0.272 | 0.190 |
6 | 6 | SK | 0.276 | 99 | 3888 | 3373 | 476 | 931 | 146 | 9 | ⋯ | 12 | 63 | 720 | 73 | 0.406 | 0.355 | 0.761 | 99 | 0.277 | 0.236 |
안타와 병살타의 상관관계 구하기¶
안타와 병살타의 상관도 : 0.309919809198101¶
In [12]:
cor(df$H, df$GDP)
0.309919809198101
안타와 병살타 산점도 그래프¶
In [13]:
plot(df$GDP~df$H)
In [18]:
lm(GDP~H, data=df)
Call: lm(formula = GDP ~ H, data = df) Coefficients: (Intercept) H 25.06444 0.05505
회귀모델 설명하기 (ex – 안타 10회당 1회 병살타)¶
In [22]:
library(ggplot2)
회귀 모델 그래프¶
In [23]:
ggplot(df, aes(H, GDP)) +
geom_point() +
xlab('안타(H)')+
ylab('병살타(GDP)') +
ggtitle('안타대 병살타 회귀모델 그래프')+
stat_smooth(method=lm, level=0.95)
`geom_smooth()` using formula 'y ~ x'
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]:
'DataAnalysisProject' 카테고리의 다른 글
[NLP, 키워드 빈도 분석] 고양시 관광 관련 인스타그램 수집 자료 분석 (0) | 2021.03.28 |
---|---|
[R] 한국 복지 패널 데이타를 이용한 통계 기반 데이터 분석 (0) | 2021.01.16 |
[R] 통계청 2013년 발표 연령, 남녀, 경력별 월급 데이터셋을 이용한 기술적 분석 (0) | 2021.01.16 |