医療法人徳仁会中野病院薬局
青島 周一
統計学の授業でお馴染みかもしれませんが、臨床研究で示された結果(群間差)が、偶然に成立しうる確率をP値と呼びます。医薬品の臨床試験では、一般的にP値が0.05を下回っていれば、研究結果に示された群間差は偶然生じたものではなく、薬の効果によるものであると判断されます。この状態を“有意差あり”などと表現しますが、P値は臨床的な有効性の有無を判断できる指標ではないことに注意が必要です。
あるサプリメントの風邪予防効果を検証するために比較試験を行ったとしましょう。被験者6人を、サプリメント群3人と、プラセボ群3人にランダムに振り分け、1年間追跡したところ、風邪の発症はサプリメント群で33%(1/3)、プラセボ群で67%(2/3)でした。風邪の発症リスクはサプリメント群で半減する(相対比0.5)という結果です。半減というと大きな効果にも思えますが、「たまたまじゃない?」と指摘されたらどう回答すれば良いでしょう。
例えば、プラセボ群に、たまたま風邪予防に関心が高い人が1人紛れていたらどうでしょうか。あるいはサプリメント群に、たまたま風邪を引きやすい人が1人紛れていても同様です。被験者は各群で3人しかいませんので、風邪の発症が1人増減するだけで結果が覆ることも十分にあり得ます。
さて、被験者をサプリメント群300人、プラセボ群300人に増やして同様の比較試験を行ったとします。その結果、風邪の発症はサプリメント群で33%(100/300)、プラセボ群で67%(200/300)でした。被験者が6人の時と全く同じで、サプリメント群で発症リスクが半減するという結果です。
二つの研究を比較してみると、偶然の影響を受ける度合いに違いがあることが分かります。600人を対象にした研究では、風邪の発症が10人ほど増減しても、結果が覆るほどの影響はありません(110/300対190/300でも相対比は0.37/0.63=0.58)。つまり、被験者数が増加すると、研究結果が受ける偶然の影響度が低下するのです。
以上を踏まえれば、P値が臨床的な有効性の有無を判断できる指標でないことは明らかでしょう。同じ効果の大きさであっても、症例数が少なければ、偶然の影響は大きくなりP値は増加しますし、症例数が多ければ偶然の影響度は小さくなりP値は低下するからです。従って、「有意差なし」=「効果なし」ではありませんし、たとえ有意差があったとしても、臨床的に意味のある差かどうか、P値は何も教えてくれません。