[이데일리 김지완 기자] 통계적 이탈자(Outlier). 암상시험에서 통계를 왜곡하는 자를 일컫는 표현이다. 업계에선 ‘짱돌’로 불린다. 통계적 이탈자 혹은 짱돌. 이번 젬백스의 진행성 핵상마비 임상 2a상 결과를 관통하는 핵심이다.
젬백스(082270)는 지난달 24일 ‘진행성 핵상마비(PSP) 치료제로서 GV1001의 국내 2a상 임상시험 톱라인 데이터 수령’이라는 제목으로 공시했다. 그리고 다음날 증시 개장과 함께 하한가로 주가가 곤두박질쳤다.
GV1001 임상 발표 현장인 ‘뉴로2024’ 학회에서 축제 분위기가 연출된 것관 상반된 흐름이다. 뉴로2024는 전 세계 신경과학 분야 전문가들이 모여 최신 연구결과를 공유하는 학회로, 지난달 24일부터 25일 양일 간 캐나다 토론토에서 개최됐다. 임상을 총괄한 이지영 서울대보라매병원 교수 역시 임상 결과에 흡족해했다. 세계 석학들은 앞다퉈 GV1001 임상 3상 참여를 희망했다.
하지만 투자시장과는 온도 차가 너무 컸다.
| 김상재 젬백스 회장(창업자, 현 고문)이 지난 7일 경기도 성남시 본사에서 이데일리와 단독 인터뷰 중이다.(사진=김지완 기자) |
|
이데일리는 지난 7일 경기도 성남시 젬백스 본사를 찾았다. 이날 기자는 김상재 회장(창업자, 현 고문)을 만나 극단의 해석 차이를 만들어낸 p값 논란의 실체를 파헤쳤다.
“걸러내지 못한 3명이 문제”회사 내부 자축 분위기와 별개로 이번 임상에서 p값이 나오지 않은 것에 실망한 이들이 많은 것 같다는 지적엔 선을 그었다.
김상재 젬백스 회장은 “1.12㎎ 투약군 가운데 3명이 문제였다”면서 “3명이 무려 74점을 올렸다”고 말했다. 이어 “1.12㎎ 투약인원 전체가 25명밖에 안되는데, 그 3명이 평균점수를 3점 가까이 높아지게 만든 것”이라면서 “나머지 투약군이 아무리 좋아져도 p값이 나올 수 없게 된 것”이라고 덧붙였다.
PSP-RS는 진행성 핵상마비 평가 척도다. 눈 운동, 언어능력, 음식물 섭취 기능, 보행능력, 균형감각, 인지기능, 자립능력 등 총 28개 항목으로 구성돼 있다. 각 항목은 0점에서 4점까지며 총점은 100점이다. 점수가 높을 수록 중증도가 높다. 즉 0점은 PSP 증상이 전혀 없고, 100점은 가장 심각한 상태다.
실제 젬백스가 발표한 임상 결과는 이 같은 설명과 일치한다. 젬백스는 GV1001 1.12㎎ 투약군은 5.44점이 증가했고 표준편차가 +9.64점이라고 발표했다. 김 회장 말대로 3명의 상승분을 빼면 투약군의 점수는 크게 낮아진다. 표준편차 9.64점은 1.12㎎ 투약군 내 환자 간 점수 편차가 컸다는 의미다. 투약군 가운데 최댓값은 +30점으로 김 회장 말이 사실로 확인됐다.
0.56㎎ 투약군 및 대조군과 비교하면 이 같은 주장은 더욱 힘을 얻는다. 0.56㎎ 투약군과 대조군의 표준편차는 각각 6.56점, 6.86점으로 1.12㎎군보다 적었다. 또 0.56㎎ 투약군과 대조군에서 가장 증상이 악화된 환자의 수치가 각각 +14점과, +17점이었다.
결론적으로 3명을 제외하면 전혀 다른 통계 결과가 나왔다.
약효 평가에 부적합 환자 걸러내야차·포 다 떼고 p값 안 나올 임상이 세상에 어딨냐는 비판엔 정면으로 맞섰다.
김 회장은 “일반적으로 이 3명은 임상 중 드롭아웃(제외) 된다”며 “PSP는 중증 신경퇴행성 질환으로 워낙 많은 합병증을 유발한다. 고령자가 많아 중증 기저질환을 수반한 경우가 많다. 이 경우엔 보통 임상군에서 빼거나, 다른 검사를 통해 임상 환자 적정성을 평가해야 한다”고 설명했다.
PSP와 같은 진행성 질환의 경우, 증상의 급격한 악화로 인해 평가가 어려워질 땐 임상에서 제외하는 것이 바람직하다. 특정 치료가 효과가 없는 것으로 판단되거나 연구 목표에 부합하지 않는 경우 환자를 임상시험에서 제외하는 것이 통상적인 절차다.
PSP는 겉으로 드러나는 운동·언어·인지 장애 증상이 전부라고 생각하면 오산이다. 음식물 삼킴 장애에 따른 흡인성 폐렴과 영양결핍이 빈번하고, 잦은 낙상으로 근골격게 손상을 겪는 이들이 부지기수다. 신체적 제약에 따른 심리적 고통으로 우울증과 같은 정신 질환을 겪는 환자도 많다.
| 김상재 젬백스 회장. |
|
그는 “PSP는 증상이 급격히 악화하는 상황에선 그 어떤 치료도 효과를 기대하기 어렵다”며 “그 3명은 PSP 외 기저질환이 많았던 초고령 환자들이었다. 임상 환자를 급히 모으면서. PSP-RS 점수가 높았던 환자들로 밝혀졌다”고 말했다.
김 회장은 “반대로 이런 환자들이 위약군에 들어갔다고 치면 GV1001과 대조군 간 차이가 극명하게 벌어졌을 것 아니냐”고 반문했다.
그는 “임상자 숫자가 많으면 이런 환자 몇 명이 섞여도 문제없다”면서 “이번처럼 임상 규모가 적을 땐 환자 한 명의 영향력이 크기 때문에 p값을 얻기가 만만치 않다”고 설명했다.
이어 “결국 그룹당 스무명 남짓한 인원으로 p값을 본다는 것 자체가 무리”라면서 “식약처에 임상시험계획을 제출할 때도 임상 규모를 고려해 p값 대신 ‘경향성’을 보겠다는 점을 분명히 했다”고 강조했다.
저용량 투약군, 임상 인원 적은 탓원점으로 돌아가 1.12㎎ 투약군 25명 중 3명을 빼면 p값이 나왔냐는 질문엔 김 회장은 “그렇게 판단한다”고 답했다.
실제 등록자 78명 중 8명 환자가 이 같은 과정으로 임상 중 이탈했고, 최종 70명만 남았다.
0.56㎎ 투약군에서 p값이 나오지 않은 이유 역시 임상 규모가 원인이었다.
김 회장은 “0.56㎎군은 원래 25명이 등록했는데 5명이 중도 이탈했다”며 “20명을 가지고 최종 분석했는데, p값을 낼 만한 모수가 부족했다”고 설명했다. 이어 “환자가 몇 명만 더 있었다면 p값이 확실하게 나왔을 것”이라면서 “투약군과 위약군 간 차이 역시 뚜렷했다”고 말했다.
GV1001 0.56㎎ 투약군은 1.35점 증가에 그쳤다. 대조군은 증가 폭은 평균 4.36점이었다. GV1001이 PSP 진행을 70%가량 늦춘다는 의미다.
어디까지나 통계 얘기다. 임상 속으로 들어가 보면 GV1001 진가가 드러난다.
김 회장은 “GV1001 투약을 받은 환자 가운데 58.33%가 점수가 개선되거나 유지됐다”면서 “PSP는 여러 번 얘기하지만 단 한 차례도 개선되지 않고 수직으로 증상이 악화하는 중대 질환이다. 마이너스 점수가 나오는 사례 자체가 없다”고 의미를 부여했다.
그는 “이번 PSP 학회에선 GV1001 임상 발표로 축제 분위기였다”며 “수년간 변변한 임상은 전무했고 매번 세포실험이나 동물실험 결과 발표하는 게 전부였기 때문”이라고 말했다.
김 회장은 “PSP에서 임상 결과가 나온 것도 놀라운 일인데, 질병 진행을 늦추고, 심지어 질환 개선까지 하는 치료제가 등장했기에 축제의 장이 펼쳐진 것”이라며 “학회장에서 이지영 서울대 보라매병원 교수를 호명해 일으켜 세운 뒤, 석학들은 뜨거운 박수갈채를 보냈다. 무엇이 실패냐”고 반문했다.
한편, GV1001 임상 3상은 내년 하반기 200명 규모로 미국을 중심으로 다국적 임상으로 계획 중이다.