공부하는 블로그

[통계학의 이해Ⅰ] 3주차 일변량 자료에 대한 수치적 기술통계 -6. 기술통계 실습 (R)-과제 본문

통계/통계학의 이해Ⅰ

[통계학의 이해Ⅰ] 3주차 일변량 자료에 대한 수치적 기술통계 -6. 기술통계 실습 (R)-과제

young_o-o 2024. 1. 14. 23:18
728x90

해당 글은 숙명여자대학교 여인권 교수님의

K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다.

K-MOOC 사이트 링크 공유합니다.


과제

과제1

  • "hit.txt"의 자료를 불러오기: 연도별 프로야구 최고 타율
  • 표본평균, 표본중앙값, 최댓값과 최솟값을 제외한 평균 계산
  • 상자그림, 분산, 변동계수 계산
hit <- read.table("hit.txt",header=F , fileEncoding = "CP949", encoding = "UTF-8")

print(paste0("평균: ", mean(hit$V1)))
print(paste0("중앙값: ", median(hit$V1)))

hit_order <- hit$V1[order(hit$V1)]
hit_order <- hit_order[-1] # 최솟값 제거
hit_order <- hit_order[-length(hit_order)] # 최댓값 제거
print(paste0("절사평균: ", median(hit_order)))

평균, 중앙값, 절사평균

boxplot(hit, main = "최고 타율의 분포", ylab = "최고 타율")

print(paste0("분산: ", var(hit$V1)))
print(paste0("변동계수: ", sd(hit$V1)/mean(hit$V1)))

boxplot
분산과 변동계수

과제2

  • 수정된 왜도와 첨도 함수 만들기
# 수정된 왜도, 첨도
adjusted.function <- function(x)
{
  n <- length(x)
  result <- c(NA,NA)
  if (n >= 2)
  {
    z <- (x-mean(x))/sd(x)
    skew <- sum(z^3)*n/((n-1)*(n-2))
    kurt <- sum(z^4)*((n*(n+1)/((n-1)*(n-2)*(n-3)))) - 3*((n-1)^2/((n-2)*(n-3)))
    result <- c(skew,kurt)
  }
  return(result)
}

adjusted.function(hit$V1)

수정된 왜도, 첨도

 

※ 강좌는 청강한 것이라 과제 검토받지 못하였습니다. 학습한 내용 기반으로 작성한 것이므로 정답인지 아닌지 알 수 없습니다.