공부하는 블로그
[통계학의 이해Ⅰ] 3주차 일변량 자료에 대한 수치적 기술통계 -6. 기술통계 실습 (R)-과제 본문
728x90
해당 글은 숙명여자대학교 여인권 교수님의
K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.
과제
과제1
- "hit.txt"의 자료를 불러오기: 연도별 프로야구 최고 타율
- 표본평균, 표본중앙값, 최댓값과 최솟값을 제외한 평균 계산
- 상자그림, 분산, 변동계수 계산
hit <- read.table("hit.txt",header=F , fileEncoding = "CP949", encoding = "UTF-8")
print(paste0("평균: ", mean(hit$V1)))
print(paste0("중앙값: ", median(hit$V1)))
hit_order <- hit$V1[order(hit$V1)]
hit_order <- hit_order[-1] # 최솟값 제거
hit_order <- hit_order[-length(hit_order)] # 최댓값 제거
print(paste0("절사평균: ", median(hit_order)))
boxplot(hit, main = "최고 타율의 분포", ylab = "최고 타율")
print(paste0("분산: ", var(hit$V1)))
print(paste0("변동계수: ", sd(hit$V1)/mean(hit$V1)))
과제2
- 수정된 왜도와 첨도 함수 만들기
# 수정된 왜도, 첨도
adjusted.function <- function(x)
{
n <- length(x)
result <- c(NA,NA)
if (n >= 2)
{
z <- (x-mean(x))/sd(x)
skew <- sum(z^3)*n/((n-1)*(n-2))
kurt <- sum(z^4)*((n*(n+1)/((n-1)*(n-2)*(n-3)))) - 3*((n-1)^2/((n-2)*(n-3)))
result <- c(skew,kurt)
}
return(result)
}
adjusted.function(hit$V1)
※ 강좌는 청강한 것이라 과제 검토받지 못하였습니다. 학습한 내용 기반으로 작성한 것이므로 정답인지 아닌지 알 수 없습니다.
'통계 > 통계학의 이해Ⅰ' 카테고리의 다른 글
[통계학의 이해Ⅰ] 4주차 다변량 자료 기술통계 -2. 비교그림과 산점도 (0) | 2024.01.15 |
---|---|
[통계학의 이해Ⅰ] 4주차 다변량 자료 기술통계 -1. 분할표와 그래프 (2) | 2024.01.15 |
[통계학의 이해Ⅰ] 3주차 일변량 자료에 대한 수치적 기술통계 -5. 수치자료의 형태 (0) | 2024.01.14 |
[통계학의 이해Ⅰ] 3주차 일변량 자료에 대한 수치적 기술통계 -4. 수치자료 분포의 산포2 (2) | 2024.01.14 |
[통계학의 이해Ⅰ] 3주차 일변량 자료에 대한 수치적 기술통계 -3. 수치자료 분포의 산포1 (2) | 2024.01.13 |