1 분 소요

1.1 데이터를 분석하다

  • 흥미가 있는 대상을 관찰하고 측정함으로써, 그 대상의 정보, 즉 ‘데이터’를 얻을 수 있습니다.
  • 데이터는 수치의 모음으로, 막연히 바라보기만 해서는 무엇인지 제대로 알 수 없습니다.
  • 데이터 분석 방법을 하나의 도구로서 사용하여 적절하게 데이터를 분석한다면, 비로소 데이터의 성질을 알 수 있으며, 대상을 이해하거나 미래를 예측할 수 있습니다.
  • 데이터 분석의 근간이 되는 통계학은 ‘확률론’이라는 수학을 이용합니다.
  • 데이터 분석의 목적 3가지
    • 데이터를 요약하는 것
    • 대상을 설명하는 것
      • 대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해한다.
    • 새로 얻을 데이터를 예측하는 것
  • 실험에서 효과가 기대되는 처리를 한 집단을 실험군, 이와 비교 또는 대조하기 위한 집단을 대조군 또는 통제군이라고 부릅니다.
  • 피험자에게 어느 쪽 약인지 알리지 않고 실험하는 방법을 단일맹검법이라고 합니다.
  • 연구자도 어느 쪽 약인지 모른 채 실험하는 방법이 이중맹검법이라고 합니다.
  • 데이터 분석에서 말하는 관계성에는 인과관계와 상관관계가 있습니다.
  • 인과관계란 2가지 중 하나(원인)를 변화시키면, 다른 하나(결과)도 바꿀 수 있는 관계를 말합니다.
  • 원인을 바꾸는 것을 ‘개입’, 또는 ‘통제’라고 합니다.
  • 상관관계란 한쪽이 크면 다른 한쪽도 큰 관계를 말합니다.
  • 미지의 데이터 예측이란 이미 얻은 데이터를 기반으로, 이후 새롭게 얻을 데이터를 예측하는 것을 말합니다.

1.2 통계학의 역할

  • 데이터 분석에서 통계학의 중요한 역할은, 퍼짐(산포, dispersion)이 있는 데이터에 대해 설명이나 예측을 하는 것입니다.
    • ‘퍼짐’이란, 데이터에 포함된 값 하나하나의 차이를 가리킵니다.
  • 통계학은 이러한 데이터 퍼짐을 ‘불확실성’이라 평가하고, 통계학의 목적인 ‘대상의 설명과 예측’을 수행합니다.

1.3 통계학의 전체 모습

  • 수집한 데이터를 정리하고 요약하는 방법을, 기술통계(descriptive statistics)라 합니다.
  • 수집한 데이터로부터 데이터의 발생원을 추정하는 방법을, 추론통계(inferential statistics)라 합니다.
  • 데이터에서 가정한 확률 모형의 성질을 추정하는 방법인 통계적 추론(statistical inference)
  • 세운 가설과 얻은 데이터가 얼마나 들어맞는지를 평가하여, 가설을 채택할 것인가를 판단하는 방법인 가설검정(statistical test)

댓글남기기