통계/1. 기본개념

2. 기술통계 및 추리통계

mansoorrr 2023. 11. 13. 18:22

가. 기술통계

  • 수집한 자료들을 체계적으로 정리하여 특성을 나타내는 것

나. 추리통계

  • 표집통계라고도 불림
  • 가장 이상적인것은 연구하고자 하는대상 모두를 결과를 기록하는 것
  • 하지만 그럴 수 없으니 전체집단(모집단)에서 비슷한 집단을 임의로 뽑은 뒤(표본) 진행
  • 통계치: 표본이 가지고 있는 평균, 표준편차 등과 같은 정보
  • 표본의 통계치를 사용해 '모집단은 이럴것이다'라고 추론하는 방법
  • 전체 집단을 정확하게 대변한다고 할 수는 없음(표본 뽑을때 우연성이 있기 때문)

1) 모집단과 표본

  • 모집단: 연구자의 정의에 의해 성립되는 전체 집단
  • 표본: 모집단에서 추출된 모집단의 부분

출처: https://velog.io/@yuns_u

2) 표본 추출 방법

  • 모집단에서 표본을 추출하는 방법은 확률적 표집과 비확률적 표집으로 나뉨
  • 확률적, 비확률적 표집의 차이
기준 확룔적 표집 비확률적 표집
모집단의 대상들이
표집으로 선택될 확률
동등, 알려져 있음 동등하지 않음, 알려져 있지 않음
표집방법 무작위 임의
모수 추정 가능성 가능 불가능
오차 측정 가능성 가능 불가능
시간과 비용 많이 소요 상대적으로 적게 소요
모집단의 성격과 규모 명확히 정의됨 불명확 또는 정의 불가능
종류 단순무선, 체계적, 층화, 군집, 층화군집 편의, 할당, 목적, 눈덩이
  • 확률적, 비확률적 표집 종류 및 세부내용
구분 특징 표집
방법
세부내용 비고
확률적 표집 연구결과가 반복가능성 높음 단순무선표집 - 가장 기본적인 추출방법
- 무작위 표본
- 이미 표본으로 선택된 대상은 다른 대상을 선택하는데 영향 미치지 않음
- 난수표 활용
- 많은 비용이 소요되며 관리가 용이하지 않음
- 모집단에 대한 제대로된 정보 없이 추출하면 표집오차 발생할 확률 큼
- 복원추출
  - 모집단에 비해 표본의 크기가 클때
  - 표본선택 후 다시 표본에 집어넣어 추출
- 비복원추출
  - 한번 뽑힌 표본은 모집단에 되돌리지 않음
  - 표본이 뽑힐 확률이 매번 달라짐
체계적 표집 - 모집단의 대상자들에게 일련의 숫자 부여해서 일정한 간격 두고 대상자 선택
- 표집 쉽고 대상자들이 무작위로 나열되어 있을때 효과적
- 대상자들이 무작위로 나열되어 있지 않으면 특정 집단에 속한 대상자들이 많이 추출됨

- 모집단을 제대로 대표할 수 없는 문제 생길 수 있음
- 표본이 독립적이지 않음
층화
표집
- 계층표집이라고도 함
- 대상자들을 같은 특징으로 분류 후
- 분류된 특징 안에 있는 대상자들을 단순무선표집 실시
- 잘 되면 표본의 표준편차가 작아져 모집단을 추정하는 오차 작아짐(모집단 설명 잘 될 수 있음)

- 틀이 잘 안갖춰져 있으면 시간 오래 걸리고 대상자들을 선택하는데 오류 발생 가능성 높음
군집
표집
- 모집단을 여러개의 군집으로 나눈 후
- 무작위로 군집을 선택
- 군집내의 대상자를 표본으로 선택
- 쉽게 표본 만들 수 있음
- 모집단에 대한 사전지식 없어도 됨

- 군집개수가 많지 않으면 표집오차가 커질 수 있음
- 군집이 별로 없다면 군집을 작게 만들어 군집의 개수를 늘려 대표성 확보해야 함
층화
군집
표집
- 대상자들을 같은 특징으로 분류
- 분류한 사람들을 다시 군집으로 분류
- 단순무선표집을 통해 집단 선정
- 선정한 모든 사람을 표본으로 선정
- 표본이 모집단을 대표할 수 있는 확률 높음
- 연구자가 모집단의 속성을 잘 알아아 함
- 시간과 경비 많이 들고 표집과정이 다소 복잡
비확률적 표집 반복가능성 낮음 편의
표집
- 연구자 마음대로 뽑음
- 이방법이 아니고는 표본을 구성하기 어려울때 사용
- 모집단에 대한 대표성이 없을 수 있음
- 연구결과에 많은 편견이 개입될 소지가 있음
- 일반화 어려울 수 있음
할당
표집
- 모집단을 임의의 일정한 범주로 나눔
- 범주에서 표본을 임의로 추출
- 연구자는 표본의 집단별 분포를 미리 알아야 함
- 같은 크기의 무작위 표집보다 적은 비용으로 표본을 추출할 수 있음
- 층화표집의 비확률적표집에 해당됨
- 모집단에 대해 알려져 있지 않은 변수로 범주를 나눌 수 없음
- 모든 변수를 할당 비율에 맞춰 표본으로 뽑는 것은 불가능
- 모집단을 잘 대표하는가에 대한 문제 발생 가능
- 일반화 어려움
목적
표집
- 유의표집으로도 불림
- 연구자의 의도적 판단에 의해 전형적이라고 생각되는 표본을 선택
- 비용 적게듬, 심층적으로 접근 가능
- 질적연구에 유용
- 표본의 대표성을 확인하기 힘듬
- 모집단에 대한 사전지식이 필요
눈덩이표집 - 특정 대상자 선택 후
- 소개로 대상자 선택
- 사회적으로 민감한 주제의 연구대상을 찾을때 유용
- 연구자가 표본의 추출을 통제할 수 없음
- 표본이 편향될 가능성이 높음
- 일반화 어려움