治験設計の指針となる事象予測

ケーススタディ

早期治験が終了した後、依頼者は同一の化合物を用いた大規模な第IIb相治験を予定していましたが、最初の治験で得られた臨床データの中に、特定の事象を予測するバイオマーカーがあるかどうかを知りたいと考えていました。 プロジェクトの開始時には、チームからの質問や、分析を実行する前に必要とされる洞察を完全に理解するために、依頼者企業の臨床医や科学者と共に時間を過ごしました。 このようなインタラクションは、あらゆるデータサイエンスプロジェクトの重要な一部となっています。

この作業の最初の構成要素は、特徴の選択、すなわち臨床データの中から、例えば人口統計学や検査データなど、事象の予測因子として有用な可能性のある変数を選択することでした。 この作業は科学チームと協力して行われ、科学チームの経験や知識をプロセスに汲み入れてれました。 専門的なワークフローツールと R を組み合わせて関連データを抽出・処理した後、機械学習アプローチを適用する前に、統計的・可視化のアプローチを適用してデータを掘り下げました。 例えば、チームがデータの一貫性、欠落データ、外れ値などを調べ、これらを報告書として研究チームに提供しました。 ランダムフォレストや勾配ブースティング法を含む様々な機械学習アプローチを R を用いて適用し、クロスバリデーションを用いて評価しました。 様々な手法の予測力、精度、リコール、および注目すべき変数の重要度を分析して提示しました。 変数の重要度とは、データ中の様々な特徴がどのように予測変数に貢献したかを説明し、アウトプットが単なる「ブラックボックス」予測変数ではなく、どの変数が予測変数で重要であるかの洞察を確実に提供します。

その後、データサイエンスチームによって提供された可視化技術を使用して、最も予測性の高い変数をより詳細に検討することが可能になりました。 この結果は、臨床チームが次の治験を設計する際の意思決定をサポートするためのエビデンス源として使用されました。 依頼者からは、臨床データのデータマイニングに加えて、選択した患者集団の中に、事象に外的に関連する可能性のある変数があるかどうかを理解するために、多様な文献を対象にテキストマイニングのアプローチを実行するように追加の依頼がありました。 この作業では、文献の変数と報告の間の関連性の強さのスコアを調べ、意思決定をサポートするために使用されました。

PHASTAR のサービスについて知るにはこのボタンをクリック

PHASTAR は試験設計、統計解析、データ科学、データ捕捉、治験報告の専門家です