우리 사회가 점점 더 증거 기반 의사 결정을 요구하고 있기 때문에, 우리가 어떻게 그리고 언제 데이터로부터 유효한 추론을 이끌어낼 수 있는지를 고려하는 것이 중요합니다. 이 모듈은 통계 조사의 주요 요소를 강조하기 위해 최근의 네 가지 조사 연구를 사용할 것입니다.
통계조사의 핵심 구성요소
•연구 계획: 검증 가능한 연구 질문을 하고 자료를 수집하는 방법을 결정하는 것으로 시작하세요. 예를 들어, 커피 연구의 연구 기간은 얼마나 되었습니까? 얼마나 많은 사람들이 연구를 위해 모집되었고, 어떻게 모집되었으며, 어디서 왔습니까? 그들은 몇 살이었습니까? 종합적인 생활 습관 설문지에 흡연 습관과 같은 다른 어떤 변수들이 기록되었습니까? 연구 과정에서 참가자들의 커피 습관에 변경이 이루어졌습니까?
• 자료 조사: 자료를 조사하는 적절한 방법은 무엇인가요? 관련성이 있는 그래프는 무엇이며, 무엇을 드러내는가요? 자료의 관련성 있는 측면을 요약하기 위해 어떤 기술 통계량이 계산될 수 있으며, 무엇을 드러내는가요? 자료에서 어떤 패턴이 보이나요? 전체 패턴에서 벗어나는 개별 관측치가 있으며, 무엇을 드러내는가요? 예를 들어, 커피 연구에서 흡연자와 비흡연자를 비교했을 때 비율이 달랐나요?
• 데이터를 통한 추론 : 수집한 데이터를 "넘어가는" 추론을 위한 유효한 통계 방법은 무엇인가요? 커피 연구에서 사망 위험이 10%-15% 감소한 것이 우연의 일치로 일어날 수 있는 일인가요?
• 결론 도출: 당신의 자료로부터 배운 것을 바탕으로, 당신은 어떤 결론을 내릴 수 있습니까? 당신은 이 결론이 누구에게 적용된다고 생각합니까? (커피 연구에 참여한 사람들이 나이가 많습니까? 건강합니까? 도시에 사는 것?) 당신은 당신의 치료에 대한 인과 관계의 결론을 내릴 수 있습니까? (과학자들은 지금 커피 마시는 것이 사망 위험 감소의 원인이라고 말하고 있습니까?)
수치 분석은 전체 통계 조사의 아주 작은 부분으로만 구성되어 있습니다. 이 모듈에서는 이러한 질문 중 일부에 어떻게 답할 수 있는지, 그리고 어떤 통계 조사에 대해 어떤 질문을 해야 하는지 알게 될 것입니다.
분배적 사고
데이터가 수집되면, 중요한 첫 번째 단계는 데이터를 조직하고 조사하는 의미 있는 방법을 생각하는 것입니다. 통계의 가장 기본적인 원리는 데이터가 다양하다는 것입니다. 이러한 변화의 패턴은 포착하고 이해하는 데 매우 중요합니다. 종종 데이터를 주의 깊게 제시하면 더 정교한 분석을 요구하지 않고 많은 연구 질문을 해결할 수 있습니다. 그러나 더 자세히 조사해야 할 추가적인 질문을 나타낼 수 있습니다. 예 1: 연구자들은 암 팜플렛이 암 환자가 읽고 이해하기에 적절한 수준으로 작성되었는지 조사했습니다(Short, Moriarty, & Cooly, 1995). 읽기 능력 테스트는 63명의 환자에게 제공되었습니다. 또한 팜플렛의 단어와 문장의 길이와 같은 특성에 기초하여 30개의 팜플렛 샘플에 대한 가독성 수준을 결정했습니다. 학년별로 보고된 결과는 표 1에 나와 있습니다.
이 두 변수는 통계적 사고의 두 가지 근본적인 측면을 보여줍니다
•데이터는 다양합니다. 보다 구체적으로, 변수 값(예: 암 환자의 읽기 수준 또는 암 팜플렛의 가독성 수준)은 다양합니다. •변수의 분포라고 하는 변동 패턴을 분석하면 통찰력이 나타나는 경우가 많습니다.
암 팜플렛이 암 환자에게 적합한 수준으로 작성되었는지에 대한 연구 문제를 해결하려면 두 분포를 비교해야 합니다. 순진한 비교는 분포의 중심에만 초점을 맞출 수 있습니다. 두 중앙값 모두 9등급으로 밝혀졌지만 중앙값만을 고려하면 이러한 데이터의 변동성과 전체 분포는 무시됩니다. 더 밝은 접근법은 그림 1과 같이 전체 분포를 그래프로 비교하는 것입니다. 그림 1은 두 분포가 전혀 잘 정렬되어 있지 않다는 것을 분명히 합니다. 가장 현저한 차이는 많은 환자(정확히는 17/63, 즉 27%)가 가장 읽기 쉬운 팜플렛의 읽기 수준보다 낮다는 것입니다. 이러한 환자는 암 팜플렛에 제공된 정보를 이해하는 데 도움이 필요합니다. 이러한 결론은 단순히 중심 또는 변동성을 측정하는 것이 아니라 전체 분포를 고려하는 것에서 비롯되며 그래프는 빈도표보다 더 직접적으로 분포를 대조합니다.
통계적 유의성
데이터에서 패턴을 찾을 때에도 데이터의 다양한 측면에서 불확실성이 존재하는 경우가 많습니다. 예를 들어, 측정 오류가 발생할 수 있습니다(하루 중에 체온이 거의 1°F 정도 변동할 수 있음). 아니면 보다 장기적인 프로세스에서 얻은 관측치의 "스냅샷"만 가질 수도 있고, 관심 있는 모집단에서 얻은 개인의 작은 부분집합만 가질 수도 있습니다. 이러한 경우, 우리는 작은 데이터 집합에서 볼 수 있는 패턴이 더 큰 프로세스 또는 모집단에서 체계적인 현상에 대한 설득력 있는 증거인지 여부를 어떻게 결정할 수 있을까요?
예 2: 네이처지의 2007년 11월호에 보도된 연구에서, 연구원들은 언어전의 유아들이 다른 사람을 매력적이거나 회피적이라고 평가할 때 그 사람에 대한 그 사람의 행동을 고려하는지를 조사했습니다(Hamlin, Wynn, & Bloom, 2007). 연구의 한 요소에서, 10개월 된 유아들에게 두 번의 시도로 언덕 위를 올라가지 못하는 "등반자" 캐릭터(구글구글한 눈을 가진 나무 조각)를 보여주었습니다. 그리고 나서 그 유아들에게, 등산객이 언덕 꼭대기로 다른 캐릭터("도우미")에 의해 밀려나는 두 가지 시나리오를 보여주었습니다. 유아들에게 이 두 가지 시나리오를 여러 번 번갈아 보여주었습니다. 그리고 나서 그 유아에게 (도우미와 방해자 캐릭터를 나타내는) 두 개의 나무 조각을 보여주고 함께 놀 하나를 고르라고 요청했습니다. 연구원들은 명확한 선택을 한 16명의 유아들 중 14명이 도우미 장난감을 가지고 놀기로 선택했다는 것을 발견했습니다. 이 명확한 다수의 결과에 대한 한 가지 가능한 설명은 한 장난감의 도우미 행동이 유아들이 그 장난감을 선택할 가능성을 높인다는 것입니다. 하지만 다른 가능한 설명은 없을까요? 장난감의 색깔은 어떤가요? 글쎄요, 자료를 수집하기 전에, 연구원들은 같은 수의 유아들이 각각의 색깔과 모양(빨간 사각형과 파란색 원)을 볼 수 있도록 배열했습니다. 아니면 그 유아들은 오른손 성향을 가지고 있어서 그들의 오른손에 더 가까운 장난감을 골랐을까요? 글쎄요, 자료를 수집하기 전에, 연구원들은 배열했습니다 절반의 유아들이 오른쪽에 있는 도우미 장난감을 보았고 절반은 왼쪽에 있는 도우미 장난감을 보았습니다. 아니면, 이 나무 캐릭터의 모양(사각형, 삼각형, 원)이 효과가 있었을 수도 있을까요? 아마도 그럴지도 모르지만, 연구원들은 도우미 장난감, 방해자 장난감, 등산가가 어떤 모양인지를 회전시킴으로써 이를 제어했습니다. 실험을 설계할 때, 반응에 영향을 미칠 수 있는 가능한 많은 변수를 제어하는 것이 중요합니다.
무작위성
연구원들이 다른 모든 그럴듯한 설명을 설명한 것으로 보이기 시작했습니다. 하지만 통제할 수 없는 중요한 고려 사항이 하나 더 있습니다. 만약 우리가 이 16명의 유아들을 대상으로 다시 연구를 했다면, 그들은 같은 선택을 하지 않았을 수도 있습니다. 다시 말해서, 어떤 무작위성이 있습니다 선택 과정에 내재되어 있을 수 있습니다. 각 유아가 진정한 선호도가 전혀 없었을 수도 있고, 단지 "무작위 운"으로 인해 14명의 유아가 도우미 장난감을 선택하게 되었을 수도 있습니다. 비록 이 무작위 성분은 통제할 수 없지만, 우리는 확률 모형을 적용하여 무작위 확률만 고려한다면 장기적으로 발생할 결과의 패턴을 조사할 수 있습니다. 유아들이 두 장난감 중 하나를 선택할 확률이 동일하다면, 각 유아는 도우미 장난감을 선택할 확률이 50%입니다. 이는 각 유아가 동전을 던져서 앞면이 나오면, 유아는 도우미 장난감을 선택한 것과 같습니다. 우리가 동전을 16번 던지면, 동전이 14번 앞면이 나올 수 있을까요? 물론 가능성은 있지만, 매우 낮은 것으로 드러났습니다. 16번 던지면 14번(또는 그 이상)의 앞면이 나올 확률은 동전을 던져서 9번 앞면이 나올 확률만큼 높습니다. 이 확률을 p-값이라고 합니다. p-값은 임의의 과정이 실제 연구에서 발견된 것과 최소한 극단적인 결과를 제공하는 빈도를 알려줍니다. 따라서 각 유아가 동일하게 선택한다고 가정할 때, 16명의 유아 중 14번 또는 그 이상이 도우미 장난감을 선택할 확률은 0.0021입니다. 우리는 단 두 가지 논리적 가능성만 있습니다. 유아가 도우미 장난감에 대해 진정한 선호도를 가지고 있거나(50/50), 또는 유아가 아무런 선호도를 가지고 있지 않으며(50/50), 이 연구에서 1,000번의 반복 중 2번만 발생할 결과입니다. 이 p-값이 0.0021은 매우 작기 때문에, 우리는 이 연구가 이러한 유아들이 도우미 장난감에 대해 진정한 선호도를 가지고 있다는 매우 강력한 증거를 제공한다고 결론짓습니다. 우리는 종종 p-값을 어떤 컷오프 값(유의성 수준, 일반적으로 약 0.05)과 비교합니다. p-값이 해당 컷오프 값보다 작으면, 우리는 여기서는 무작위 확률만 작용했다는 가설을 기각합니다. 이 경우, 연구자들은 연구에 참여한 유아의 절반 이상이 도우미 장난감을 선택했다는 결론을 내릴 것이며, 이는 도우미 장난감에 대한 진정한 선호의 강력한 증거를 제공합니다
'심리에 대하여' 카테고리의 다른 글
심리학의 역사 (1) | 2024.05.15 |
---|---|
일반화 가능성 (0) | 2024.05.15 |
신경과학과 심리 생리학2 (0) | 2024.05.12 |
신경과학과 심리생리학 (0) | 2024.05.12 |
신경계의 구조 정리 (0) | 2024.05.09 |