목록공부 (26)
공부하는 블로그
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. 추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다. K-MOOC 사이트 링크 공유합니다. 학습목표 자료들 간의 거리를 이용하여 산포도를 계산하는 방법을 알아본다. 표본분산과 표준편차 모든 자료들 간의 거리의 합을 이용하는 방법은? 거리(distance): 임의의 점 a, b, c에 대해 아래 성질을 만족한다. 해당 거리를 이용하여 자료들 간의 퍼져있는 정도를 알 수 있다. 이러한 성질을 만족하는 D는 수없이 많은데 그 중 우리는 D(a, b) = |a - b|와 D(a, b) = (a - b)^2에 관심을 갖는다. 이..
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. 추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다. K-MOOC 사이트 링크 공유합니다. 학습목표 수치자료의 퍼져있는 정도(산포도)를 나타내는 값 중 두 특정 위치의 정보를 활용한 통계값을 알아본다. 자료의 주요 위치를 파악하고 이상점 유무를 확인하는데 사용되는 상자그림에 대해 알아본다. 산포(dispersion, 퍼짐) 자료들이 얼마나 퍼져 있는지를 나타내는 측도 중심위치가 얼마나 안정적인지에 대한 중요한 정보를 제공 자료가 조밀하게 모임 → 중심위치의 변동성이 작아짐 → 중심위치에 안정 → 중심위치에 대한 신뢰도 ..
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. 추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다. K-MOOC 사이트 링크 공유합니다. 학습목표 수치자료의 중심위치를 나타내는 대체 통계값을 계산하는 방법과 성질을 알아본다. 표본중앙값(sample median, 표본중위수) 자료를 크기순서대로 나열했을 때 중간에 있는 값 순서통계량(order statistics): 표본을 오름차순으로 정렬한 것 x_i: i번쨰로 작은 값 x_1: 최솟값 x_n: 최댓값 예) n = 5일 때, 3번쨰 순서통계량 x_3이 median 예) n = 6일 때, 3번쨰와 4번째 순서통계량의..
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. K-MOOC 사이트 링크 공유합니다. 과제 과제1 "Score.txt"의 자료를 불러오기 (학점자료) 도수분포표 만들기: 도수, 상대도수, 누적상대도수 포함 # score file scan score
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. 추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다. K-MOOC 사이트 링크 공유합니다. 학습목표 수치자료를 범주화 하는 방법을 알아본다. 범주화된 수치자료를 표나 그래프를 이용하여 정리하는 방법을 알아본다. 도수분포표 (Frequency table) 수치자료에 대한 도수분포표 자료의 값이 몇 개로 한정된 경우에는 값을 범주로 처리한다. 자료를 범주화하고 도수분포표를 작성한다. (순서자료 형태로 변환) 도수, 상대도수 + (누적도수 또는 누적상대도수) 표시 관측된 값들을 몇 개의 구간으로 범주화하여 해당 그룹에 속한 ..
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. 추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다. K-MOOC 사이트 링크 공유합니다. 학습목표 효과적인 자료 분석을 위해 자료를 속성에 따라 분류해본다. 자료의 종류와 특성 통계분석 방법은 자료의 속성과 분석 목적에 따라 달라진다. 분석 방법의 적절성: 분석하고자 하는 자료가 분석방법에서 가정한 조건을 얼마나 만족하는지에 따라 결정한다. 자료의 속성에 따른 분류필요 통계학에서는 분석 목적이나 자료 형태에 따라 다양한 형태의 분석 방법을 제공한다. 따라서 분석 방법은 무엇으로 선택하는지가 매우 중요하며 이를 효과적으..
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. K-MOOC 사이트 링크 공유합니다. 학습 목표 자료 분석과 확률 실험을 하기 위한 통계 프로그램인 R과 Rstudio를 설치한다 통계프로그램 상용프로그램 상업적 목적이나 판매 목적으로 만든 프로그램 SAS, SPSS, STATA, Matlab 무료프로그램 R, Python → 일종의 고급 컴퓨터 언어 SAS University Edition → 가상 애플리케이션 (가상 곤간에 해당되는 프로그램 설치 필요) R 설치 (Window 기준 설명) ①R 홈페이지 접속: https://www.r-project.org/ 접속 ② CRAN Mirro..
해당 글은 숙명여자대학교 여인권 교수님의 K-MOOC 통계학의 이해Ⅰ(2019.05.01~2019.08.03) 강의를 수강하며 복습 및 정리하기 위해 작성한 글입니다. 추가적으로 여인권 교수님의 통계학 기본개념과 원리 2판을 참고하였습니다. K-MOOC 사이트 링크 공유합니다. 학습 목표 표본설계 및 표본추출 과정에서 모집단의 구성과 다른 표본이 얻어질 수 있는 문제를 가중치 조정을 통해 해결하는 방법을 알아본다. 예시로 가중치 부여 알아보기 개표방송 지역구: A지역 7만명 투표, B지역 3만명 투표 개표율: A지역 10%, B지역 50% A지역 1번 후보자 득표율 60%, 2번 후보자 40% B지역 1번 후보자 득표율 30%, 2번 후보자 70% → 1번 득표수: 7만x0.1(A 지역 개표율)x0.6(..