심리에 대하여 / / 2024. 3. 26. 00:07

통계적 사고와 심리학

커피를 마시는 것이 실제로 당신의 기대 수명을 증가시키나요? 최근연구 (Freedman, Park, Abnet, Hollenbeck, & Sinha, 2012)는 하루에 최소 6잔의 커피를 마신 남성이 마시지 않은 남성보다 사망할 확률이 10% 낮다는 것을 발견했습니다 (여성은 15% 낮습니다). 이것은 당신이 당신 자신의 커피 습관을 들이거나 늘려야 한다는 것을 의미합니까? 현대 사회는 이와 같은 연구에 넘쳐납니다; 당신은 매일 뉴스에서 그러한 여러 연구에 대해 읽을 수 있습니다. 게다가, 데이터는 현대 생활의 어디에나 많습니다. 그러한 연구를 잘 수행하고 정보에 입각한 결정이나 정책을 세우기 위해 그러한 연구의 결과를 잘 해석하려면, 데이터로부터 통찰력을 얻는 과학인 통계에 대한 기본 개념을 이해해야 합니다. 통계는 일화와 직관에 의존하기보다 우리가 관심 있는 현상을 체계적으로 연구할 수 있게 해줍니다.

 

통계 조사의 핵심 구성 요소

• 연구 계획: 검증 가능한 연구 질문을 하고 자료를 수집하는 방법을 결정하는 것으로 시작하세요. 예를 들어, 커피 연구의 연구 기간은 얼마나 되었습니까? 얼마나 많은 사람들이 연구를 위해 모집되었고, 어떻게 모집되었으며, 어디서 왔습니까? 그들은 몇 살이었습니까? 종합적인 생활 습관 설문지에 흡연 습관과 같은 다른 어떤 변수들이 기록되었습니까? 연구 과정에서 참가자들의 커피 습관에 변경이 이루어졌습니까?


• 자료 조사: 자료를 조사하는 적절한 방법은 무엇인가요? 관련성이 있는 그래프는 무엇이며, 무엇을 드러내는가요? 자료의 관련성 있는 측면을 요약하기 위해 어떤 기술 통계량이 계산될 수 있으며, 무엇을 드러내는가요? 자료에서 어떤 패턴이 보이나요? 전체 패턴에서 벗어나는 개별 관측치가 있으며, 무엇을 드러내는가요? 예를 들어, 커피 연구에서 흡연자와 비흡연자를 비교했을 때 비율이 달랐나요?


• 데이터를 통해 추론해 보십시오. 수집한 데이터를 "넘어가는" 추론을 위한 유효한 통계 방법은 무엇인가요? 커피 연구에서 사망 위험이 10%-15% 감소한 것이 우연의 일치로 일어날 수 있는 일인가요?


• 결론 도출: 여러분의 데이터로부터 배운 것을 바탕으로, 여러분은 어떤 결론을 도출할 수 있나요? 여러분은 이 결론이 누구에게 적용된다고 생각하나요? (커피 연구에 참여한 사람들이 나이가 많나요? 건강한가요? 도시에 사는 것?) 여러분은 여러분의 치료법에 대한 인과관계의 결론을 도출할 수 있나요? (과학자들은 지금 커피 마시는 것이 사망 위험 감소의 원인이라고 말하고 있나요?) 수치 분석(컴퓨터의 찌그러진 숫자)은 전체 통계 조사의 작은 부분만을 차지한다는 것에 주목하세요. 이 모듈에서, 여러분은 우리가 이러한 질문들 중 일부에 어떻게 대답할 수 있는지 그리고 여러분이 읽은 통계 조사에 대해 어떤 질문을 해야 하는지 알 수 있을 것입니다.

 

분배적 사고

통계는 데이터가 다양하다는 것입니다. 그 변화의 패턴은 포착하고 이해하는 데 매우 중요합니다. 종종 데이터를 주의 깊게 제시하면 더 정교한 분석 없이도 많은 연구 문제를 해결할 수 있습니다. 하지만 더 자세히 살펴봐야 할 다른 문제를 지적할 수도 있습니다.

 

예 1: 연구자들은 암 팜플렛이 암 환자가 읽고 이해하기에 적절한 수준으로 작성되었는지 조사했습니다.(Short, Moriarty, & Cooly, 1995). 63명의 환자에게 읽기 능력 테스트가 제공되었습니다. 또한 팜플렛의 단어와 문장 길이와 같은 특성에 기초하여 30개의 팜플렛 샘플에 대한 가독성 수준을 결정했습니다. 학년별로 보고된 결과는 표 1에 나와 있습니다.

암 팜플렛이 암 환자에게 적합한 수준으로 작성되었는지에 대한 연구 문제를 해결하려면 두 분포를 비교해야 합니다. 순진한 비교는 분포의 중심에만 초점을 맞출 수 있습니다. 두 중앙값 모두 9등급으로 밝혀졌지만 중앙값만을 고려하면 이러한 데이터의 변동성과 전체 분포는 무시됩니다. 더 밝은 접근법은 그림 1과 같이 전체 분포를 그래프로 비교하는 것입니다. 그림 1은 두 분포가 전혀 잘 정렬되어 있지 않다는 것을 분명히 합니다. 가장 현저한 차이는 많은 환자(정확히는 17/63, 즉 27%)가 가장 읽기 쉬운 팜플렛의 읽기 수준보다 낮다는 것입니다. 이러한 환자는 암 팜플렛에 제공된 정보를 이해하는 데 도움이 필요합니다. 이러한 결론은 단순히 중심 또는 변동성을 측정하는 것이 아니라 전체 분포를 고려하는 것에서 비롯되며 그래프는 빈도표보다 더 직접적으로 분포를 대조합니다.

 

통계적 유의성

심지어 우리가 데이터에서 패턴을 발견했을 때도, 종종 데이터의 다양한 측면에서 불확실성이 존재합니다. 예를 들어, 측정 오류가 발생할 수 있습니다(하루 중에 여러분의 체온도 거의 1°F 정도 변동할 수 있습니다). 아니면 우리는 더 장기적인 과정에서 얻은 관찰의 "스냅샷"만 가질 수도 있고, 관심 있는 모집단에서 얻은 작은 부분집합만 가질 수도 있습니다. 

 

그런 경우, 우리는 작은 데이터 집합에서 우리가 보는 패턴이 더 큰 과정이나 모집단에서 발생하는 체계적인 현상에 대한 설득력 있는 증거인지 어떻게 결정할 수 있을까요? 예 2: 네이처지 2007년 11월호에 보고된 한 연구에서, 연구원들은 언어 이전의 유아들이 다른 사람들을 향한 그 개인의 행동을 그들을 매력적이거나 회피적이라고 평가할 때 고려하는지를 조사했습니다(Hamlin, Wynn, & Bloom, 2007). 

 

실험

연구의 한 요소에서, 10개월 된 유아들은 언덕을 구성할 수 없는 "등반자" 캐릭터(구글하게 눈을 붙이고 있는 나무 조각)를 두 번의 시도 만에 보여주었습니다. 그리고 나서, 유아들에게 두 가지 시나리오를 보여줬는데, 하나는 등반가가 다른 캐릭터("헬퍼")에 의해 언덕 꼭대기로 밀려났고, 다른 하나는 등반가("hinder")에 의해 언덕 아래로 밀려 내려갔습니다. 유아에게는 이 두 가지 시나리오가 여러 번 번갈아 보여졌습니다. 그리고 나서, 유아에게 두 개의 나무 조각(헬퍼와 방해자 캐릭터를 나타냄)을 보여주고 함께 놀 하나를 고르라고 요청했습니다. 연구원들은 명확한 선택을 한 16명의 유아들 중 14명이 헬퍼 장난감을 가지고 노는 것을 선택했다는 것을 발견했습니다.

 

 

이 명확한 다수의 결과에 대한 한 가지 가능한 설명은 한 장난감의 도움 행동이 유아들이 그 장난감을 선택할 가능성을 높인다는 것입니다. 하지만 다른 가능한 설명이 있을까요? 장난감의 색깔은 어떤가요? 자, 자료를 수집하기 전에, 연구원들은 각 색깔과 모양 (빨간 사각형과 파란 원)이 같은 수의 유아들에게 보이도록 배열했습니다. 아니면 유아들이 오른손 성향을 가지고 있어서 자신의 오른손에 더 가까운 장난감을 선택한 것일까요? 자, 자료를 수집하기 전에, 연구원들은 반의 유아들이 오른쪽에, 반은 왼쪽에 있는 도우미 장난감을 보도록 그것을 배열했습니다. 아니면, 아마도 이 나무 글자들의 모양 (사각형, 삼각형, 원)이 효과가 있었을 것일까요? 아마도, 하지만 다시 말하지만, 연구원들은 어느 모양이 도우미 장난감, 방해자 장난감, 등산가인지를 회전시킴으로써 이를 통제했습니다. 실험을 설계할 때, 반응에 영향을 미칠 수 있는 가능한 많은 변수를 통제하는 것이 중요합니다.


연구자들이 다른 모든 그럴듯한 설명을 설명한 것처럼 보이기 시작했습니다. 하지만 통제할 수 없는 중요한 고려 사항이 하나 더 있는데, 만약 우리가 이 16명의 유아를 대상으로 다시 연구를 진행했다면, 그들은 같은 선택을 하지 않았을 수도 있다는 것입니다. 다시 말해, 그들의 선택 과정에는 무작위성이 내재되어 있습니다. 어쩌면 각 유아는 진정한 선호도가 전혀 없었을 수도 있고, 단지 14명의 유아가 도우미 장난감을 선택하게 된 것은 "무작위 운"이었을 수도 있습니다. 이 무작위 성분은 통제할 수 없지만, 무작위 기회만이 유일한 요인이라면, 우리는 확률 모형을 적용하여 장기적으로 발생할 결과의 패턴을 조사할 수 있습니다.

 

 

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유