
▲왼쪽부터 제이앤피메디 윤나희 Senior Consultant, 제이앤피메디 윤기원 Consultant
압도적인 데이터, 그리고 필요한 선택
수십만 페이지에 달하는 임상 데이터를 연구자가 일일이 확인할 수 있을까? 수백 개의 규제기관 검증 규칙을 사람이 손으로 모두 검토할 수 있을까? 대답은 '예'일 수도 있다. 그러나 중요한 질문은 '정말 그렇게 할 것이냐'다. 정답은 이미 분명하다. 우리는 도움이 필요하다.
임상시험은 새로운 치료제를 개발하기 위한 과학적 과정이지만, 그 과정에서 생성되는 데이터는 이미 인간이 감당하기 힘든 수준에 도달했다. 실제로 일부 사건에서는 규제기관이 무려 100만 페이지에 달하는 임상시험 문서를 검토해야 했다는 보고도 있었다. 이는 임상 데이터의 규모가 얼마나 방대한지를 단적으로 보여준다.
데이터의 폭증은 여러 요인이 맞물린 결과다. 글로벌 멀티센터 임상시험의 확대, 전자건강기록(Electronic Health Record, EHR)의 보편화, 분산형 임상시험(Decentralized Clinical Trial, DCT) 확산에 따른 원격 모니터링과 웨어러블 기기에서 발생하는 실시간 데이터가 합쳐지면서 과거와는 비교할 수 없는 규모의 데이터가 생성되고 있다. 보도에 따르면, 실제로 미국의 한 임상시험수탁기관(CRO)에서는 약 1.6백만 건(2TB 규모)의 임상시험 데이터베이스가 외부에 노출된 사례가 보고된 바 있다. 이는 대형 후기 단계 임상시험이 축적하는 데이터가 수십만~수백만 페이지, 혹은 테라바이트 단위에 이를 수 있음을 보여준다.[1]
이러한 데이터의 홍수 속에서, 우리는 어떻게 수많은 데이터를 빠르게 검토할 수 있을까? 바로 이 지점에서 업계가 주목한 새로운 동반자, 바로 인공지능(AI)이다.
속도 그 이상의 이유: 왜 AI인가
AI가 주목받는 이유는 단순히 방대한 데이터를 '빨리' 처리하기 때문만은 아니다. 임상시험 현장이 AI를 주목하는 이유는 속도를 넘어선 더 본질적인 가치를 제공하기 때문이다. 그 이유는 다음과 같다.
높은 비용과 낮은 성공률 - 신약 개발은 평균 10년 이상, 수조 원에 달하는 천문학적인 비용이 소요되지만 성공률은 여전히 10% 미만이며, 미국생명공학혁신기구(BIO)에서 발표한 임상 개발 성공률에 관한 산업 보고서에 따르면, 임상 1상에서 신약 후보가 시장까지 도달할 확률은 약 7.9%에 불과하다.[2] 이러한 낮은 성공률은 결국 조직의 손실로 이어질 수 있는데 특히 임상 3상 단계의 경우, 연구의 규모에 비례해 막대한 시간과 자본이 투입되기 때문에 그 타격은 더 크다. 문제는 초기 단계의 데이터 관리 및 분석 부실이 이러한 낮은 성공률을 더 악화시킨다는 점이다. 인적 오류로 인한 데이터 에러(Data Error)나 임상 과정의 위험 신호(Safety Signal)를 조기에 포착하지 못하면, 실패할 신약 후보에 대한 불필요한 투자를 계속하게 되어 비용은 눈덩이처럼 불어나게 된다. AI는 이 불필요한 시간과 비용을 차단하는 역할을 한다.
강화되는 규제기관의 요구 - FDA, EMA, PMDA 등 주요 규제기관은 데이터 제출의 일관성과 효율성을 높이기 위해 제출 데이터 형식을 CDISC(Clinical Data Interchange Standards Consortium) 표준으로 의무화했다. 그러나 실제 현장에서는 이러한 표준화 요구가 새로운 수작업 부담으로 작용하고 있다. 소스 데이터를 CDISC 표준에 맞게 매핑하는 작업은 여전히 숙련된 인력의 수작업에 의존하며, 이 과정에서 반복적인 QC(품질관리)가 필수적이다. 또한 두 명의 프로그래머가 서로 독립적으로 동일한 데이터를 처리 또는 통계 분석을 실시한 뒤 결과를 비교하는 더블 프로그래밍 절차도 흔하다. 이는 품질 확보에는 유효하지만, 비용과 시간이 많이 소요되는 방식이다. AI 기반의 자동화 도구는 바로 이 지점에서 핵심적인 역할을 수행한다. 복잡한 매핑 규칙을 학습하고, 더블 프로그래밍 없이도 코드의 오류를 실시간으로 탐지하며, CDISC 준수 여부를 자동으로 검증해 규제 대응에 필요한 시간과 인력을 획기적으로 절감한다.
|
결국 AI는 단순히 처리 속도를 높이는 도구가 아니라, 데이터 품질과 일관성을 보장함으로써, 임상시험의 실패 가능성을 줄이기 위한 현실적 해답으로 부상하고 있다.
자동화 사례, 새로운 접근
지난 6월 열린 '임상시험 데이터 교환 표준 컨소시엄(CDISC) 세미나: 글로벌 임상 데이터 표준화 흐름과 메이븐 컨버터(Maven Converter)의 역할'에는 250명 이상의 실무자가 참석했다. 행사에서 가장 많이 언급된 키워드는 단연 'AI'와 '자동화'였다. 참석자들은 "표준화 자체가 목적이 아니라, 효율적으로 표준을 구현할 수 있는 기술이 필요하다"는 점에 공감했다.
또한 이 자리에서 소개된 메이븐 컨버터(Maven Converter)의 시연은 특히 주목을 끌었다. 과거에는 데이터 매핑 담당자가 도메인 정의서를 일일이 확인하고 변수명을 직접 일일이 매칭해야 했다. 누락이나 오기재가 발생하면 수십 차례에 이르는 QC 사이클을 거쳐야만 오류를 수정할 수 있었다. 하지만 메이븐 컨버터는 데이터를 FDA 요구 포맷으로 자동 변환하는 AI 기술을 통해 매핑 및 검증을 동시에 수행한다.

이 과정의 의미는 단순히 몇 시간을 절약하는 차원을 넘어선다. 과거라면 한 데이터셋을 완성하는 데 수 주에서 수 개월이 걸리던 과정을 단축할 수 있으며, 품질관리 체계 전반의 효율성을 끌어올린다. 세미나 발표 이후, 업계 관계자들은 단순한 속도 향상을 넘어 품질 관리 체계의 변화 가능성에 주목했다.
여전히 남아있는 질문과 한계
그렇다고 해서 AI가 모든 문제를 해결하는 만능 열쇠는 아니다. 여전히 여러 질문이 남아 있다.
데이터 품질 문제 - 학습 데이터가 불완전하다면, AI의 결과도 왜곡될 수 있다.
규제 수용성 - 규제기관이 AI 결과를 어디까지 신뢰할 것인가는 아직 명확하지 않다. 실제로 EMA와 FDA는 AI 기반 알고리즘의 사용 가이드라인을 단계적으로 마련하고 있지만, 여전히 초기 단계다.
블랙박스 리스크 - AI의 판단 근거가 불투명하다면 오류 발생 시 책임 소재가 모호하다. 이는 환자 안전과 직결될 수 있는 문제다.
|
이러한 질문에 대한 해답을 모두 찾아내고, 완전한 AI를 적용할 수 있게 된다면 우리는 더 이상 아무것도 하지 않아도 되는 것일까? 그렇지 않다. 오히려 그때부터가 시작이다.
AI는 반복적이고 단순한 작업을 줄여주더라도 데이터의 해석, 전략적 판단, 규제 대응처럼 AI가 대신할 수 없는 영역은 더욱 중요해진다. 결국 AI가 단순 노동을 줄여 줄수록 우리는 더 복잡하고 본질적인 문제에 집중해야 한다. 다시 말해, AI는 사람을 대체하기보다는 사람의 역할을 새로운 차원으로 이동시키는 도구다.
앞으로 우리가 집중해야 할 방향

AI 도입의 성패는 기술 자체에 달려 있지 않다. 중요한 것은 우리가 어디에 집중하느냐이다.
데이터 거버넌스 강화 - AI가 학습할 데이터의 품질과 출처를 관리하는 체계가 필요하다. 예를 들어, 데이터 입력 오류나 정의되지 않은 값들이 학습 과정에 포함되면, 결과는 왜곡될 수밖에 없다. 따라서 데이터 관리 체계를 정교하게 구축하는 것은 AI 도입의 전제 조건이다.
설명 가능한 AI(Explainable AI) - 규제기관과 연구자가 AI의 판단 근거를 이해할 수 있어야 한다. 예측 결과만 제시하는 블랙박스 모델은 임상시험에서 받아들여지기 어렵다. 국제적으로도 ‘Explainable AI’ 요구는 점점 더 커지고 있다.
사람의 개입(Human-in-the-loop) - AI가 제시한 결과를 무조건 수용하는 것이 아니라, 실무자가 이를 검토하고 판단해야 한다. AI는 의사결정을 보조할 수 있지만, 최종적인 책임은 사람이 져야 한다.
국제 협력 - FDA, EMA, PMDA 등 주요 규제기관이 AI 적용에 대해 어떤 기준을 마련하는지 살펴보고, 이에 발맞춰 국제적 협력을 강화해야 한다. AI의 활용은 한 국가나 한 기업 차원에서 해결할 수 없는 과제이기 때문이다.
|
결국 중요한 것은 "AI를 도입할까 말까"가 아니라, "AI를 어떻게 책임감 있게 다루고 관리할 것인가"이다.
협업이 만들어갈 임상시험의 미래
앞으로 임상시험은 "사람 vs AI"의 대결 구도가 아니다. 오히려 "사람과 AI의 협업"이 핵심이다. AI는 방대한 데이터를 신속하고 정확하게 처리하고, 사람은 그 결과를 해석하며 전략적 판단을 내린다.
AI 없는 표준화는 느리고 불완전하다. 표준화 없는 AI는 혼란과 위험을 야기한다. 두 가지가 결합할 때 비로소 글로벌 경쟁력이 확보된다.
상상해보자. 미래의 임상시험에서 AI는 수많은 환자 데이터를 실시간으로 표준화하고 분석하며, 연구자는 그 결과를 기반으로 위험 신호를 빠르게 파악해 임상 전략을 조정한다. 규제기관은 설명 가능한 AI의 근거를 통해 투명성을 확보하고, 환자는 더 안전하고 신뢰할 수 있는 치료제를 더 빨리 만날 수 있다.
임상시험의 바다는 점점 거칠어지고, 데이터의 파도는 더욱 거세지고 있다. 이 파도를 넘어 항해하기 위해 필요한 것은 AI라는 돛과 표준이라는 나침반, 그리고 사람의 지혜다. 세 가지가 함께할 때, 임상시험은 새로운 지평을 열 수 있을 것이다.
[1] Alder, S. (2025, February 19). Clinical Trials Database Containing 1.6 Million Records Exposed Online. The HIPAA Journal. https://www.hipaajournal.com/clinical-trials-database-containing-1-6-million-records-exposed-online
[2] BIO. (2021). Clinical Development Success Rates 2011-2020. https://www.bio.org/clinical-development-success-rates-and-contributing-factors-2011-2020
📌 원문 바로가기 : LINK
▲왼쪽부터 제이앤피메디 윤나희 Senior Consultant, 제이앤피메디 윤기원 Consultant
압도적인 데이터, 그리고 필요한 선택
수십만 페이지에 달하는 임상 데이터를 연구자가 일일이 확인할 수 있을까? 수백 개의 규제기관 검증 규칙을 사람이 손으로 모두 검토할 수 있을까? 대답은 '예'일 수도 있다. 그러나 중요한 질문은 '정말 그렇게 할 것이냐'다. 정답은 이미 분명하다. 우리는 도움이 필요하다.
임상시험은 새로운 치료제를 개발하기 위한 과학적 과정이지만, 그 과정에서 생성되는 데이터는 이미 인간이 감당하기 힘든 수준에 도달했다. 실제로 일부 사건에서는 규제기관이 무려 100만 페이지에 달하는 임상시험 문서를 검토해야 했다는 보고도 있었다. 이는 임상 데이터의 규모가 얼마나 방대한지를 단적으로 보여준다.
데이터의 폭증은 여러 요인이 맞물린 결과다. 글로벌 멀티센터 임상시험의 확대, 전자건강기록(Electronic Health Record, EHR)의 보편화, 분산형 임상시험(Decentralized Clinical Trial, DCT) 확산에 따른 원격 모니터링과 웨어러블 기기에서 발생하는 실시간 데이터가 합쳐지면서 과거와는 비교할 수 없는 규모의 데이터가 생성되고 있다. 보도에 따르면, 실제로 미국의 한 임상시험수탁기관(CRO)에서는 약 1.6백만 건(2TB 규모)의 임상시험 데이터베이스가 외부에 노출된 사례가 보고된 바 있다. 이는 대형 후기 단계 임상시험이 축적하는 데이터가 수십만~수백만 페이지, 혹은 테라바이트 단위에 이를 수 있음을 보여준다.[1]
이러한 데이터의 홍수 속에서, 우리는 어떻게 수많은 데이터를 빠르게 검토할 수 있을까? 바로 이 지점에서 업계가 주목한 새로운 동반자, 바로 인공지능(AI)이다.
속도 그 이상의 이유: 왜 AI인가
AI가 주목받는 이유는 단순히 방대한 데이터를 '빨리' 처리하기 때문만은 아니다. 임상시험 현장이 AI를 주목하는 이유는 속도를 넘어선 더 본질적인 가치를 제공하기 때문이다. 그 이유는 다음과 같다.
- 신약 개발은 평균 10년 이상, 수조 원에 달하는 천문학적인 비용이 소요되지만 성공률은 여전히 10% 미만이며, 미국생명공학혁신기구(BIO)에서 발표한 임상 개발 성공률에 관한 산업 보고서에 따르면, 임상 1상에서 신약 후보가 시장까지 도달할 확률은 약 7.9%에 불과하다.[2] 이러한 낮은 성공률은 결국 조직의 손실로 이어질 수 있는데 특히 임상 3상 단계의 경우, 연구의 규모에 비례해 막대한 시간과 자본이 투입되기 때문에 그 타격은 더 크다. 문제는 초기 단계의 데이터 관리 및 분석 부실이 이러한 낮은 성공률을 더 악화시킨다는 점이다. 인적 오류로 인한 데이터 에러(Data Error)나 임상 과정의 위험 신호(Safety Signal)를 조기에 포착하지 못하면, 실패할 신약 후보에 대한 불필요한 투자를 계속하게 되어 비용은 눈덩이처럼 불어나게 된다. AI는 이 불필요한 시간과 비용을 차단하는 역할을 한다.
강화되는 규제기관의 요구
- FDA, EMA, PMDA 등 주요 규제기관은 데이터 제출의 일관성과 효율성을 높이기 위해 제출 데이터 형식을 CDISC(Clinical Data Interchange Standards Consortium) 표준으로 의무화했다. 그러나 실제 현장에서는 이러한 표준화 요구가 새로운 수작업 부담으로 작용하고 있다. 소스 데이터를 CDISC 표준에 맞게 매핑하는 작업은 여전히 숙련된 인력의 수작업에 의존하며, 이 과정에서 반복적인 QC(품질관리)가 필수적이다. 또한 두 명의 프로그래머가 서로 독립적으로 동일한 데이터를 처리 또는 통계 분석을 실시한 뒤 결과를 비교하는 더블 프로그래밍 절차도 흔하다. 이는 품질 확보에는 유효하지만, 비용과 시간이 많이 소요되는 방식이다. AI 기반의 자동화 도구는 바로 이 지점에서 핵심적인 역할을 수행한다. 복잡한 매핑 규칙을 학습하고, 더블 프로그래밍 없이도 코드의 오류를 실시간으로 탐지하며, CDISC 준수 여부를 자동으로 검증해 규제 대응에 필요한 시간과 인력을 획기적으로 절감한다.
결국 AI는 단순히 처리 속도를 높이는 도구가 아니라, 데이터 품질과 일관성을 보장함으로써, 임상시험의 실패 가능성을 줄이기 위한 현실적 해답으로 부상하고 있다.
자동화 사례, 새로운 접근
지난 6월 열린 '임상시험 데이터 교환 표준 컨소시엄(CDISC) 세미나: 글로벌 임상 데이터 표준화 흐름과 메이븐 컨버터(Maven Converter)의 역할'에는 250명 이상의 실무자가 참석했다. 행사에서 가장 많이 언급된 키워드는 단연 'AI'와 '자동화'였다. 참석자들은 "표준화 자체가 목적이 아니라, 효율적으로 표준을 구현할 수 있는 기술이 필요하다"는 점에 공감했다.
또한 이 자리에서 소개된 메이븐 컨버터(Maven Converter)의 시연은 특히 주목을 끌었다. 과거에는 데이터 매핑 담당자가 도메인 정의서를 일일이 확인하고 변수명을 직접 일일이 매칭해야 했다. 누락이나 오기재가 발생하면 수십 차례에 이르는 QC 사이클을 거쳐야만 오류를 수정할 수 있었다. 하지만 메이븐 컨버터는 데이터를 FDA 요구 포맷으로 자동 변환하는 AI 기술을 통해 매핑 및 검증을 동시에 수행한다.
이 과정의 의미는 단순히 몇 시간을 절약하는 차원을 넘어선다. 과거라면 한 데이터셋을 완성하는 데 수 주에서 수 개월이 걸리던 과정을 단축할 수 있으며, 품질관리 체계 전반의 효율성을 끌어올린다. 세미나 발표 이후, 업계 관계자들은 단순한 속도 향상을 넘어 품질 관리 체계의 변화 가능성에 주목했다.
여전히 남아있는 질문과 한계
그렇다고 해서 AI가 모든 문제를 해결하는 만능 열쇠는 아니다. 여전히 여러 질문이 남아 있다.
규제 수용성 - 규제기관이 AI 결과를 어디까지 신뢰할 것인가는 아직 명확하지 않다. 실제로 EMA와 FDA는 AI 기반 알고리즘의 사용 가이드라인을 단계적으로 마련하고 있지만, 여전히 초기 단계다.
블랙박스 리스크 - AI의 판단 근거가 불투명하다면 오류 발생 시 책임 소재가 모호하다. 이는 환자 안전과 직결될 수 있는 문제다.
이러한 질문에 대한 해답을 모두 찾아내고, 완전한 AI를 적용할 수 있게 된다면 우리는 더 이상 아무것도 하지 않아도 되는 것일까? 그렇지 않다. 오히려 그때부터가 시작이다.
AI는 반복적이고 단순한 작업을 줄여주더라도 데이터의 해석, 전략적 판단, 규제 대응처럼 AI가 대신할 수 없는 영역은 더욱 중요해진다. 결국 AI가 단순 노동을 줄여 줄수록 우리는 더 복잡하고 본질적인 문제에 집중해야 한다. 다시 말해, AI는 사람을 대체하기보다는 사람의 역할을 새로운 차원으로 이동시키는 도구다.
앞으로 우리가 집중해야 할 방향
AI 도입의 성패는 기술 자체에 달려 있지 않다. 중요한 것은 우리가 어디에 집중하느냐이다.
설명 가능한 AI(Explainable AI) - 규제기관과 연구자가 AI의 판단 근거를 이해할 수 있어야 한다. 예측 결과만 제시하는 블랙박스 모델은 임상시험에서 받아들여지기 어렵다. 국제적으로도 ‘Explainable AI’ 요구는 점점 더 커지고 있다.
사람의 개입(Human-in-the-loop) - AI가 제시한 결과를 무조건 수용하는 것이 아니라, 실무자가 이를 검토하고 판단해야 한다. AI는 의사결정을 보조할 수 있지만, 최종적인 책임은 사람이 져야 한다.
국제 협력 - FDA, EMA, PMDA 등 주요 규제기관이 AI 적용에 대해 어떤 기준을 마련하는지 살펴보고, 이에 발맞춰 국제적 협력을 강화해야 한다. AI의 활용은 한 국가나 한 기업 차원에서 해결할 수 없는 과제이기 때문이다.
결국 중요한 것은 "AI를 도입할까 말까"가 아니라, "AI를 어떻게 책임감 있게 다루고 관리할 것인가"이다.
협업이 만들어갈 임상시험의 미래
앞으로 임상시험은 "사람 vs AI"의 대결 구도가 아니다. 오히려 "사람과 AI의 협업"이 핵심이다. AI는 방대한 데이터를 신속하고 정확하게 처리하고, 사람은 그 결과를 해석하며 전략적 판단을 내린다.
AI 없는 표준화는 느리고 불완전하다. 표준화 없는 AI는 혼란과 위험을 야기한다. 두 가지가 결합할 때 비로소 글로벌 경쟁력이 확보된다.
상상해보자. 미래의 임상시험에서 AI는 수많은 환자 데이터를 실시간으로 표준화하고 분석하며, 연구자는 그 결과를 기반으로 위험 신호를 빠르게 파악해 임상 전략을 조정한다. 규제기관은 설명 가능한 AI의 근거를 통해 투명성을 확보하고, 환자는 더 안전하고 신뢰할 수 있는 치료제를 더 빨리 만날 수 있다.
임상시험의 바다는 점점 거칠어지고, 데이터의 파도는 더욱 거세지고 있다. 이 파도를 넘어 항해하기 위해 필요한 것은 AI라는 돛과 표준이라는 나침반, 그리고 사람의 지혜다. 세 가지가 함께할 때, 임상시험은 새로운 지평을 열 수 있을 것이다.
[1] Alder, S. (2025, February 19). Clinical Trials Database Containing 1.6 Million Records Exposed Online. The HIPAA Journal. https://www.hipaajournal.com/clinical-trials-database-containing-1-6-million-records-exposed-online
[2] BIO. (2021). Clinical Development Success Rates 2011-2020. https://www.bio.org/clinical-development-success-rates-and-contributing-factors-2011-2020
📌 원문 바로가기 : LINK