[자연과학] 생태 과학 칼럼 모음

[김우재의 보통과학자] P값에 반기를 든 초파리 행동유전학자 (2022.03.24)

푸레택 2022. 3. 24. 08:32

[김우재의 보통과학자] P값에 반기를 든 초파리 행동유전학자 (daum.net)

 

[김우재의 보통과학자] P값에 반기를 든 초파리 행동유전학자

“확신은 반복을 통해서 만들어진다. 이 명제를 회피하려는 그 어떠한 시도도 성공할 수 없으며, 오히려 파괴적이다." -존 터키 “과학 내부의 다양한 문제는 부분적으로는 사회 전반의 문제를

news.v.daum.net

소프트웨어와 비트라는 말을 처음 만든 미국의 통계학자 존 와일더 터키 박사(1915-2000년). 미국철학학회 제공

[김우재의 보통과학자] P값에 반기를 든 초파리 행동유전학자

 

“확신은 반복을 통해서 만들어진다. 이 명제를 회피하려는 그 어떠한 시도도 성공할 수 없으며, 오히려 파괴적이다." - 존 터키

“과학 내부의 다양한 문제는 부분적으로는 사회 전반의 문제를 반영한 것일뿐입니다. 사회는 대유행 및 기후 변화와 같은 위기에서 주도적으로 주도할 과학자를 절실히 필요로 하지만 우리는 우리의 틀에 갇혀 있어야 합니다. 제가 말하고 싶은 바는, 더 많은 과학자들이 공직에 출마해야 한다는 것입니다." - 애덤 클러리지 창 듀크 싱가포르국립대 의대 교수

과학을 다른 학문과 구분 짓는 가장 중요한 특징은 무엇일까. 과학철학에서 ‘구획문제’로 알려진 이 질문에 대한 확정된 답은 없다. 각종 통계학적 방법론을 사용하는 ‘심리학과 사회학 등의 사회과학은 자연과학과 동일한 수준의 과학인가’, 혹은 ‘물리학보다 더욱 수학적 엄밀함을 추구하는 방법론을 사용하는 경제학은 과학인가’와 같은 질문에 명쾌하게 답을 할 수 있는 학자는 없다. 하지만 우리는 “여러 현상을 설명해 주는 가설이 모두 ’과학적 가설’은 아니”라는 사실을 잘 알고 있다. 예를 들어, 대통령 후보 선거에서 어떤 후보가 대통령에 선출된 현상에 대해 누구도 과학적 가설을 세우고 이를 과학적으로 설명할 수 없다. 선거결과는 과학적 설명 밖의 영역이다. 과학은 모든 현상을 설명하는 만능 도구가 아니다. 

하지만 우리는 모든 설명에서 ‘과학적 설명’ 혹은 ‘과학적 가설’을 추구할 수 있고, 가능한 그래야 한다. 철학자 이상하는 세상에 존재하는 여러 가설들 중에서 ‘과학적 가설’이 갖는 특징을 다음과 같이 설명한다.

”특정 측정량과의 연결성을 갖는 가설만이 과학적 가설로 여겨진다. 이때 그러한 연결성을 갖는 가설은 다음을 만족해야 한다.

①해당 측정량은 특정 조건 아래 재확인 및 재생산 가능해야 한다. 재확인 가능한 측정량이 주로 관찰과 관련되어 있다면, 재생산 가능한 측정량은 조작 실험과 관련되어 있다.

②가설은 해당 측정량에 함축된 사실, 실례로 질량값과 같은 사실을 규명해줄 수 있어야 한다.

③인과 설명에 동원되는 그러한 사실의 인정 유무는 자연적 제한과 무관하지 않기 때문에, 가설은 그러한 인정 유무에 따라 검증 혹은 반증 가능한 대상이 된다.”

어떤 설명이 과학적 가설에 기반한 설명이 되려면, 우선 그 설명은 ‘측정량’에 기반해야 한다. 즉, 과학적 설명은 그 기반으로 숫자로 된 데이터를 요구한다. 하지만 그게 전부는 아니다. 그 측정량이 시간과 장소 혹은 측정을 수행하는 사람에 따라 계속 변한다면, 그런 측정량은 신뢰가능하지 않다. 따라서 과학적 설명이 기반하는 측정량은 “특정 조건 아래 재확인과 재생산 가능해야 한다.” 측정량 중 관찰에 의해 얻어진 데이터는 재확인이 가능해야 하고, 실험에 의해 얻어진 데이터는 재생산이 가능해야 한다. 이렇게 얻어진 측정량, 즉 데이터만이 과학적 가설의 소재가 될 수 있고, 그렇게 추구된 과학적 가설만이 과학적 지식의 생산에 기여하며, 궁극적으로 과학을 진보시킨다. 

P값의 기원… 통계학의 발전과 과학적 권위에 대한 왜곡된 열망

의생명과학 분야에서 실험을 수행하는 과학자라면, 누구나 P값에 대해서 배우게 된다. 세포에 여러 조건을 가해 원하는 유전자의 발현량을 측정하는 경우건, 생쥐의 유전자 하나를 없애고 정상적인 생쥐와 유전자넉아웃 생쥐의 차이를 측정하는 경우건, 대부분의 의생명과학 실험은 대조군과 실험군 사이의 차이를 비교해 얻어진 데이터로 이루어진다. 두 조건 사이의 차이가 유의미한지를 판단하기 위해 지금까지 과학자들이 사용한 방식은 영가설검증법(NHST)이라고 불리는 통계학적 추론법이었다. 

영가설검증법에서는 영가설을 세우고 P값에 의해 영가설을 기각하는 방식으로, 발견의 유의성을 검증한다. 영가설을 기각하기 위해서는 P값이 작을수록 좋으므로, 연구자들은 일반적으로 낮은 P값을 통해 영가설을 통해 ‘검증하고자 하는 결과가 존재하지 않는다’라고 가정하고, 영가설이 기각되었음으로 실험결과는 유의미하다고 판단한다. 즉, 어떤 실험결과의 영가설검증에 의해 도출된 P값이 낮으면 낮을 수록, 해당 실험결과가 순전히 우연에 의해 얻어진 것일 가능성은 낮아진다고 판단할 수 있다. 일반적으로 영가설검증법이 통계적으로 유의미하다고 판단하는 P의 문턱값은 0.05다. 하지만 0.05라는 P의 문턱값이 과연 자연법칙을 검증하는데 유의미한 것인지 판단해줄 근거란 없다.

19세기가 끝날 때까지 통계학은 독립된 분과학문이 아니었다. 20세기에 들어와서도 1920~1930년대가 되어서야 수학적 통계학 분야를 중심으로 독립된 통계학 분야가 등장하기 시작한다. 20세기 전반기 피어슨, 네이만, 피셔 등의 통계학의 선구자들이 구축한 통계학 방법론은 당시 막 발전하기 시작하던 여러 사회과학분야에 스며들었고, 특히 심리학은 이당시 통계학에서 발전한 통계적검정을 가장 적극적으로 받아들였다. 특히 현재 의생명과학분야에서 문제가 되는 영가설검증법은 이 당시 심리학계 내부에서 여러 활발한 논의를 통해 구축된 것으로, 이 당시 어떻게 영가설검증법과 P값이 등장하게 되었는지를 이해하는것은 과학의 재현성위기를 이해하는데 필수적이다.

20세기 초반 통계적 검정법 연구는 칼 피어슨과 고셋등의 연구를 거쳐 피셔, 네이만, 피어슨 등으로 이어지며 통계학의 전성기를 알렸다. 통계학자이자 통계학사를 연구한 조재근은 심리학에서 사용되는 통계검정법의 역사를 다룬 논문에서 이렇게 말한다.

“오늘날의 통계학 전문가들이 볼 때 ‘20세기 전반기에 경험적 연구를 했던 사회과학 연구자들은 통계학의 대가들이 만들 고 수학적 이론으로 뒷받침한 검정 방법을 그대로 빌려다 썼을 것’처럼 보인다. 게다가 알고 보면 통계학 내부적으로 수학적인 이론 연구에 힘입어 독립성이 강화되고 다른 한편으로 통계학 외부적으로 통계적 방법이 사회과학을 위시한 여러 분야에서 보편적인 과학 연구 방법으로 널리 쓰이게 된 두 가지 과정은, 둘 사이에 그리 큰 시간적 격차가 없이 진행되었다. 따라서 그 두 과정은 먼저 통계학의 대가들이 획기적인 연구를 내놓 은 다음, 사회과학을 비롯한 여러 분야의 연구자들이 그 성과를 각 분야에서 활용하는 식으로 매끄럽게 연결된 것처럼 보인다.”

하지만 역사는 통계학에서 창안된 통계검증법이 심리학을 위시한 다른 분야의 과학에 그렇게 매끄럽게 적용되지 않았음을 알려준다. 특히 현재 우리가 가장 많이 사용한 영가설검증법의 방법론의 역사가 대표적이다. 1920~1930년대 피셔와 네이만-피어슨은 각각 ‘유의성검정’이라 불리는 검정법과 ‘가설검정’라 불리는 검정법을 독자적으로 개발하고, 둘 중 어느쪽 방법이 더 과학적인가를 두고 죽을때까지 대립하며 논쟁을 벌인다. 양 진영의 대표자들이 두 방법론 사이에서 어떤 절충점도 만들지 못하고 죽었기 때문에, 1990년대에 들어와서야 네이먼의 제자가 화해를 모색할 정도였다. 

문제는 이 두 통계검정법 사이에 어떤 절충도 마련되지 않은 상황에서 이미 1950년대부터 심리학계가 이 둘을 마음대로 혼합한 잡종 검정법을 마음대로 사용하고 있었다는 점이다. 이당시 심리학 논문에서 통계검정법은 매우 유행한 상태라, 무려 80% 이상의 논문이 이 잡종 검정법을 사용하고 있었는데, ”20세기 전반기에 나온 심리학 연구 논문은 물론 당시에 널리 읽힌 심리통계학 교과서에서는 통계적 검정을 누가 개발했는지 밝히지 않은 채 마치 당대의 모든 통계학자들이 유일한 한 가지 검정법만을 인정한다는 듯이 잡종 검정법을 소개”하고 있었다. 즉, 당시 심리학계에선 통계학 내부에서 서로 다른 두 방법론을 두고 벌어지던 논쟁을 완전히 무시하고, 이 둘이 단일한 것이라고 받아들여 사용했다는 것이다. 

통계학이 수학적인 이론을 중심으로 독립적인 학문으로 비약하는 과정에서 통계학적 방법은 새로운 분야로 널리 활용되기 시작했고, 특히 이 시기 자연과학의 엄밀성과 결정론을 추종하던 양적 방법론을 중시하는 사회과학분야에서 통계학은 적극적으로 받아들여졌고, 엄밀한 방법론으로 무장한 과학이 되려던 심리학과 여러 사회과학분야 연구자들의 욕망은, 통계학 분야에서의 논쟁과 상관 없이 P값을 받아들여 현재에 이르게 된 것이다. 즉, 통계학과 사회과학이 전문화되기 시작하던 20세기 초반에 우연히 벌어진 사건 덕분에, 심리학은 물론 다른 사회과학분야와 현대의 의생명과학분야까지 진정한 통계검정법인지 아닌지 결론조차 나지 않은 방법론으로 통계를 왜곡해온 셈이다.

P값의 배신

과학의 재현성 위기는 P값 위기와 밀접한 관련을 맺고 있다. 2017년 통계학의 권위 있는 전문가들은 “과학자들이 선호하는 P값에 좀 더 까다로운 표준을 적용해야 한다”고 주장했다. 이들은 첫째, “사회과학과 의생명과학의 경우, P의 문턱값을 0.005로 낮춰야 하”며, 둘째, ”0.05~0.005의 P 값을 들이대는 주장은 '확립된 지식'이 아니라 '암시적 증거'로 간주되어야 한다”고 제안했다. 이 선언에 나선 연구자 그룹은 72명이나 됐으며, 이처럼 빈약한 통계학적 표준으로 생산되는 과학지식이 재현성위기를 만든다는 공감대를 형성했다.

 

20세기 초반 심리학자들은 통계검정법에 대해 잘 모르면서 영가설검정법을 연구에 도입했고, P=0.05라는 인위적인 규칙을 만들었다. 그 이후 과학자들은 기계적으로 P값을 사용해왔다. 하지만 P값이 무엇인지 정확히 설명할 수 있는 과학자는 별로 없다. 위키피디아 제공

이들이 P의 문턱값을 낮추라고 주장한 이유는 많은 연구자들이 의도적이던 의도적이지 않던 간에 ‘P값 해킹’이라 불리는 관행을 통해 연구자료를 왜곡하기 때문이다. 2019년 미국통계학회는 3월 학회지를 아예 ‘P값 해킹’과 관련된 내용으로만 채웠다. 통계학자 박준석은 P값을 해킹하는 몇가지 방법을 이렇게 설명한다.

“연구자가 가설에 유리하게 P값을 작게 만들 수 있다는 것이 알려져 있다. P값을 작게 만드는 방법들로는 다음과 같은 것들이 있다. 첫째, 분석에 사용되는 데이터가 많으면 많을수록 P값이 작아지기 때문에, 연구자는 P값이 0.05보다 작아질 때까지 데이터를 계속 수집할 수 있다.(이론적으로는 데이터가 무한히 있으면 P값을 0으로 만들 수 있다.) 둘째, 어떤 통계분석 절차를 쓰느냐에 따라 p값이 조금씩 달라지는데, 연구자는 이들 중 자신의 가설을 가장 지지하는 결과를 선택적으로 보고할 수 있다. 셋째, 연구자는 애초부터 종속변수에 영향을 끼칠 만한 독립변수들을 한꺼번에 조사한 후, 그들 중 통계적으로 유의한 결과가 나온 것만 골라서 보고할 수 있다. 이들을 포함한 다양한 방법을 사용하여 연구자는 데이터 분석 결과가 자신의 가설을 지지하도록 영향력을 행사할 수 있다.”

2016년 P값의 문턱을 0.005로 낮추자는 주장이 학계에 거의 먹히지 않자, 학회는 이번엔 아예 연구의 유의성을 P값에 의존하는 행태 자체를 문제삼았다. 학회에 따르면 P값은 실험결과가 실제로 그런지 검증하는 여러 통계값 가운데 하나로 쓰여야 할 뿐, 실험결과에 절대적 권위를 부여하는 값으로 사용되어서는 안된다는 것이다. 로널드 와서스테인 미국통계학회장은 “통계적 유의성이라는 족쇄에서 벗어나는 것이 과학은 과학이 되고, 통계는 통계가 되는 길”이라고 말했다. 또한 나아가 “연구 결과가 갖는 불확실성의 한계를 받아들이고, 더 나은 측정법, 더 정교한 연구설계, 더 많은 표본을 얻고자 노력하는” 것이 과학을 진정으로 발전시키는 것임을 지적한다. 

P값 해킹을 비롯한 영가설검증법을 둘러싼 문제들은 실험결과에 어떻게던 권위를 부여해 논문이라는 연구자의 화폐를 발행하려는 과학자들의 욕망을 드러낸다. 이런 욕망 자체가 나쁜 것은 아니다. 하지만 실제로 효과가 없는 연구결과가 논문이라는 권위로 출판될 경우, 그 논문은 사회에 엄청난 파급효과를 만들어낼 수 있다. 예를 들어 현재 전세계 백신음모론자들 사이에서 여전히 근거로 받아들여지는 백신과 자폐증의 연관관계에 대한 논문은, 이미 논문이 철회되었음에도 불구하고 과학과 통계방법론에 익숙하지 않은 시민들에게 백신을 거부할 권위로 작동하고 있다. 즉 P값 해킹을 통한 논문의 출판은 과학계에 재현성위기를 만들 뿐 아니라, 자칫하면 잘못된 상식이 과학적 권위를 얻어 사회의 질서를 해치게 만들 수도 있는 위험한 행위일 수 있다.

 

영가설검정법과 P값이 계속 사용되는 한, P 해킹은 피할 수 없는 비극이다.

초파리 행동유전학자, P값에 반기를 들다

2016년 듀크대에서 초파리 행동유전학을 연구하는 애덤 클라리지 창 교수는 국제학술지 '네이처메소드'에 《추정량 통계가 유의성 평가를 대체해야 한다》라는 제목의 논문을 발표한다. 초파리에서 생체시계 유전자를 찾을 공로로 2017년 노벨상을 수상한 마이클 영의 실험실에서 생체시계 관련 유전자의 발현을 연구한 클러리지 창 교수는 이후 다양한 생물의 행동을 모니터하고 분석할 수 있는 시스템을 구축하고, 동물의 행동을 조절할 수 있는 유전학 도구를 개발하면서 행동유전학 연구분야에서 촉망받는 연구자로 인정받는다. 2016년 이 논문 이전 그의 연구경력을 살펴보면 그는 초파리 유전학 연구공동체의 전통적인 연구자로 보인다.

20세기 통계적 검정법을 두고 피셔와 네이만-피어슨은 격렬히 대립했다. 하지만 심리학은 이 두 진영의 방법론을 아무렇지도 않게 차용해 혼종으로 만들어 사용했다. (왼쪽부터) 피셔, 네이만, 피어슨. 위키피디아 제공

이 논문에서 그는 40년이 넘는 기간동안 영가설검정법과 P값이라는 통계학적 도구는 철학적으로도 실용적으로도 비판받아왔으나 그 대안으로 제시된 여러 방법론들 역시 통계학에 깊이 있는 지식을 지니지 못한 다른 분야 학자들에게 사용되기 어렵다는 점을 지적한다. 그는 '추정량 통계'이라는 방법론이 이를 대체할 수 있다고 주장한다. 추정량 통계는 ‘효과크기’와 ‘신뢰구간’에 집중하는 통계검정법이다.

효과크기는 두 변수 사이의 연관성을 표현하는 기술통계학적 기법으로 “예를 들어 어떤 다이어트약을 1달간 먹으면 살이 5kg이 빠진다고 할 때, 효과크기는 5kg”이 되는 식이다. 이에 반해 P값은 두 변수 사이의 연관성을 표현하는 추론통계학의 기법인 셈이다. 신뢰구간은 이미 여러 대선후보 지지율 통계조사결과 발표 등을 통해 우리에게 익숙한 개념으로 '모집단 모수 값이 포함될 가능성이 있는 갑의 범위'를 의미한다. 쉽게 말해 신뢰구간이란 '그나마 내가 확실히 말할 수 있는 정도'를 구간으로 표현하는 것이다. 

재현성 위기와 영가설검정법과 P값의 문제가 이미 드러나고 있는 상황이었음에도 불구하고, 클러리지 창 교수의 제안은 연구자들에게 적극적으로 받아들여지지 않는다. 통계학 전문가도 아니고, 초파리 행동유전학자에 불과한 그의 제안이 통계학 전문가들과 생쥐나 인간세포 연구자들에게 받아들여진다는 것도 이상한 일이었을 것이다. 하지만 그는 포기하지 않고 의생명과학에서 P값을 추정량 통계로 완전히 뒤바꿀 계획을 진행한다. 그리고 2018년 6월 그는 “P값을 넘어서: 추정량 그래픽으로 데이터 분석하기”라는 프리프린트를 출판함과 동시에 추정량 통계를 현장의 실험과학자들이 손쉽게 사용할 수 있게 만든 ‘추정량 통계’라는 웹사이트를 공개한다. 

이 논문과 웹사이트에서 클러리지 창 교수는 기존의 의생명과학자들이 자주 사용하던 데이터 시각화 방식인 막대그래프로부터 시작해서 왜 데이터 시각화와 추정량 통계가 중요한지를 아주 쉽게 그림으로 표현해 보여준다. 같은 데이터라 해도 어떤 방식으로 시각화하는가와 어떤 통계검정법을 사용하느냐에 따라 읽는 독자가 느끼는 효과는 완전히 달라질 수 있다는 점을 클러리지 창 교수의 쉬운 설명은 아주 잘 보여준다. 

연구자들은 클러리지 창 교수가 만든 웹사이트에 자신의 데이터를 집어 넣고 그래프를 손쉽게 만들 수 있으며 그가 그래픽을 만들기 위해 사용한 프로그래밍 코드도 깃헙을 통해 다운받아 마음대로 편집해 사용할 수 있다. 프리프린트는 2019년 논문으로 출판되었고, 현재 이 논문은 735회 이상 인용되며 현장의 의생명과학자들에게도 널리 알려지게 됐다.

도대체 클러리지 창 교수라는 초파리 행동유전학자는 자신의 연구경력에 아무런 도움도 되지 않을 통계적 방법론 구축에 왜 뛰어든 것일까. 인터넷에 나와 있는 경력만으로 그 이유를 추정할 방법은 없다. 이 글을 준비하면서 그에게 이메일을 보냈다. 몇 가지 질문을 던졌고, 며칠후 그의 친절한 답변을 받을 수 있었다. 아래 글은 클러리지 창 교수가 추정량 통계학에 관심을 갖게 만든 계기와 그가 생각하는 과학과 사회의 관계에 대해 알려준다.

아래는 초파리 행동유전학자 클러리지 창 교수와 질의응답.
 

 Q. P-value를 추정통계로 대체하는데 상당한 시간을 할애하게 된 동기는 무엇입니까?

이 프로젝트는 우리 자신의 데이터 분석에 대한 좌절감에서 비롯되었습니다. 나는 행동 실험이 어느 날은 "효과가 있다"고 다음날은 "효과가 없다”는 박사후 연구원이나 학생들을 보고 매우당황했어요. 그리고 그런 이유가 모두 유의성 테스트 결과만 고려했기 때문이라는 사실을 깨닫게 되었죠. 큰 효과 크기를 가진 실험도 변동성이 있는 것이 현실이며, 이를 처리하는 올바른 방법은 데이터를 집계하여 단일 효과 크기를 계산하는 것이라는 점도 알게 되었습니다. 그러니까 유의성 검정과 비교할 때 추정량 통계가 보다 직접적이고 간단하게 답을 줄 수 있는 거죠.

 Q. 추정통계를 다룬 에피소드가 있나요?

죄송합니다, 질문을 이해하지 못했습니다.

 Q. 일반 과학자들에게 통계 분석 및 재현성 위기에 대한 생각을 공유해줄 수 있나요?

재현성 위기의 큰 원인은 사람들이 유의성 검정이 확실한 답을 제공한다고 잘못 믿고 있기 때문입니다. 사실 극소수의 실험만이 매우 확실한 결과를 줄 수 있어요. 효과 크기는 이상적으로 여러 실험실에서 여러 실험의 결과를 평균화하는 방법을 제공할 수 있습니다. 재현성 위기는, 자금 지원 기관이 보조금 요청을 발행하거나 재현 연구를 위해 명시적으로 계약을 제공함으로써 쉽게 해결할 수 있습니다. 모든 중요한 결과는 여러 독립 그룹에서 재현해볼 가치가 있습니다.

 Q. 한국 과학자들과 독자들에게 해주고 싶은 말씀이 있으신가요?

저는 영화 '기생충' 이나 드라마 '오징어 게임'이 아주 오래된 이야기를 믿을 수 없을 정도로 신선하게 전달한 방식을 좋아합니다. 과학 내부의 다양한 문제는 부분적으로는 사회 전반의 문제를 반영한 것일뿐입니다. 사회는 대유행 및 기후 변화와 같은 위기에서 주도적으로 주도할 과학자를 절실히 필요로 하지만 우리는 우리의 틀에 갇혀 있어야 합니다. 제가 말하고 싶은 바는, 더 많은 과학자들이 공직에 출마해야 한다는 것입니다.

2022년 3월 3일 애덤 클러리지 창 교수가 보낸 편지의 원문.

과학의 재현성 위기를 만드는데 크게 일조한 통계학의 영가설검정법과 P값이라는 도구에 맞서, 현장 연구자의 입장에서 좀 더 재현가능하고 신뢰할 수 있는 통계검정법을 재발견하고 이를 연구공동체에 널리 알리기 위해 자신의 시간을 할애한 클러리지 창 교수의 이야기는, 재현성위기의 시대를 살아가는 현대의 보통과학자들이 거대한 시스템과 싸울 수 있는 한가지 방법을 보여준다. 누구나 열정적으로 새로운 대안을 공부하고 자신의 자원과 시간을 희생해서 새로운 플랫폼을 구축할 수는 없다. 하지만 그런 한 사람의 송곳이 뚫어 놓은 구멍을, 모두 함께 넓힐 수는 있다. 우리 모두가 그의 웹사이트를 이용해 데이터를 생산하고, 서서히 의생명과학 논문에서 P값을 퇴출시키면 되는 것이다.

클러리지 창 교수는 평범한 과학자이지만, 사회적으로 과학자가 공익을 위해 해야할 일에 대해 명확히 지각하고 있는 보통과학자다. 재현성위기를 다룬 책 《사후경직》의 저자이자 의학 저널리스트인 리처드 해리스는 “의학의 발전 속도를 끌어올리려면 생명의학연구는 오히려 속도를 늦춰야 한다. 즉 진행하는 프로젝트 수를 줄이고 하나하나를 좀 더 엄밀히 수행해야 한다”고 말했다. 하지만 과학의 발전 속도를 늦추라는 말은 현실적으로 불가능한 나이브한 윤리적 명령일 뿐이다. 비엔나 학단의 철학자 오토 노이라트의 말처럼, 우리 모두는 바다를 항해하는 배 위에서 배를 수리하는 운명을 가진 사람들일 뿐이다. 배를 멈추면 배는 침몰한다. 과학도 마찬가지다. 배를 멈추지 않고 최선을 다해 수리하는 일은 가능하다. 과학을 계속 발전시키면서, 재현성 위기를 개선하는 일도 충분히 가능하다. 

2018년 애덤  클러리지 창 교수가 자신의 프리프린트를 트위터에 공개하면서 올린 그림은, 현장의 실험과학자들이 왜 막대그래프와 P값을 피해야 하는지를 잘 보여준다. 애덤 클러리지-창 트위터 계정 캡쳐

※ 참고자료

https://towardsdatascience.com/what-can-an-octopus-tell-us-about-the-biggest-debate-in-statistical-theory-f017295d781f

-https://www.hani.co.kr/arti/science/science_general/888909.html

-https://www.youtube.com/watch?v=UFhJefdVCjE

 

글=김우재ㅣ동아사이언스 2022.03.10

※ 필자소개 


김우재 어린 시절부터 꿀벌, 개미 등에 관심이 많았다. 생물학과에 진학했지만 간절히 원하던 동물행동학자의 길을 자의 반 타의 반으로 포기하고 바이러스학을 전공해 박사학위를 받았다. 이후 박사후연구원으로 미국에서 초파리의 행동유전학을 연구했다. 초파리 수컷의 교미시간이 환경에 따라 어떻게 변하는지를 신경회로의 관점에서 연구하고 있다. 모두가 무시하는 이 기초연구가 인간의 시간인지를 이해하는데 도움이 될 것이라고 주장하고 다닌다. 과학자가 되는 새로운 방식의 플랫폼, 타운랩을 준비 중이다. 최근 초파리 유전학자가 바라보는 사회에 대한 책 《플라이룸》을 썼다.

/ 2022.03.24 옮겨 적음