エビデンスの基礎知識 — 専門用語をやさしく読み解く
このページは、evidage.com の記事に出てくる「ハザード比」「メタアナリシス」「RCT」などの専門用語を、たとえ話と図解でやさしく解説するためのものです。
「健康情報の科学」が初めての方は、まずこのページから読むのがおすすめです。
🎯 まず最初に:エビデンスレベルとは?
健康情報には「信頼度の差」があります。同じ「○○は体にいい」という主張でも:
- 個人の体験談(「私が試したら良かった!」)
- 動物実験(「マウスでは効いた」)
- 小規模臨床試験(「30人で調べたら効果あり」)
- 大規模ランダム化試験(「1万人を5年追跡したら効果が確認された」)
これらはまったく信頼度が違います。evidage では、すべての推奨に Level 1〜4 の4段階で信頼度を明示しています。
Level 1 — 最強推奨(緑色)🟢
意味:複数の大規模 RCT またはメタアナリシスで結果が一致
たとえ:「日本中の10万人を10年追跡したらこの結果でした」を複数チームが別々に検証してくれて、みんな同じ結論になった。
例:禁煙、週150分運動、地中海食
Level 2 — 強く推奨(青色)🔵
意味:大規模コホート研究、または少数の RCT で効果が一致
たとえ:「数万人を数年追跡してこういう結果」が出ているけれど、まだ複数チームの追試はこれから。
例:睡眠7〜9時間、社会的つながり、納豆摂取
Level 3 — 推奨(グレー青)🔘
意味:観察研究や小規模試験での示唆あり
たとえ:「数百〜数千人で観察したらこういう傾向」だが、決定的ではない。
例:マインドフルネス瞑想、ブロッコリースプラウトの抗酸化
Level 4 — 限定的(グレー)⚪
意味:動物実験や代理指標のみ、ヒトでの大規模試験は未確立
たとえ:「マウスでは効いた」「血液マーカーでは変わった」レベル。
例:NMN/NR、レスベラトロール、エビオス錠(直接エビデンス)
避けるべき(赤色)🔴
意味:害が利益を上回ることが明確
例:β-カロテン高用量サプリ、男性のカルシウム高用量サプリ
🔬 ハザード比(HR、Hazard Ratio)
意味:「ある介入をした人」と「しない人」で、特定のイベント(病気、死亡など)が起きるリスクを比べた比率。
たとえ話
100人の友人が2年後に風邪をひく確率を考えましょう:
– グループA(マスクなし):30人が風邪をひく
– グループB(マスクあり):20人が風邪をひく
このとき、ハザード比 HR = 20/30 = 0.67。「マスクで風邪リスクが33%減」という意味です。
数値の読み方
| HR | 意味 |
|---|---|
| HR 1.0 | リスク変わらず |
| HR 0.7 | リスク 30% 低下(良い) |
| HR 0.5 | リスク 50% 低下(かなり良い) |
| HR 1.3 | リスク 30% 増加(悪い) |
| HR 2.0 | リスク 2倍(かなり悪い) |
evidage 記事での使い方
例:「禁煙者 vs 喫煙者:全死亡 HR 0.5」
→ 「禁煙すると、亡くなるリスクが喫煙し続ける場合の半分になる」
📊 メタアナリシス(メタ解析)
意味:同じテーマの研究をたくさん集めて、統計的にまとめたもの。
たとえ話
1人の医者が「コーヒーは健康に良い」と言っても、それだけでは信頼できません。
でも、世界中の研究50本を集めて統計的にまとめたら?
→ 「平均すると、コーヒーを飲む人は飲まない人より心血管疾患リスクが10%低い」みたいな全体傾向が見えてきます。
なぜ重要か
- 個別の研究は、たまたま結果が出た可能性がある(偶然・バイアス)
- メタアナリシスは多数の研究の平均なので、より確実
- 多くの場合、Level 1 エビデンスの根拠になる
evidage 記事での使い方
例:「Ekelund et al. (2019) の メタアナリシス(105万人):週150分運動で全死亡 HR 0.69」
→ 「世界中の研究をまとめた結果、100万人規模でこの効果が確認された」
🧪 RCT(ランダム化比較試験)
意味:ランダムに2グループに分けて、片方には介入、もう片方にはしない、で結果を比べる実験。
たとえ話
「ある食事法でやせるか?」を調べたい時:
– 100人を集める
– コインを投げて、ランダムに50人ずつに振り分け
– A グループ:その食事法を実践
– B グループ:普通の食事
– 半年後、体重を比較
ランダムにすることで、「もともとやせている人だけがAに集まった」みたいな偏りが排除できます。
なぜ重要か
- 因果関係を証明できる唯一の方法
- 観察研究は「相関」しか分からない
- 薬の承認も RCT が必須
evidage 記事での使い方
例:「PREDIMED 試験(RCT, 7,447人):地中海食で心血管イベント 30% 低下」
→ 「ランダム化されたしっかりした実験で、地中海食の効果が確認された」
📐 効果量(Effect Size)
意味:「どれくらい効くか」の数値。
よく出る指標
| 指標 | 意味 |
|---|---|
| HR(ハザード比) | 既出。リスクの比 |
| RR(相対リスク) | リスクの比率(HRと似ているが対象期間が異なる) |
| OR(オッズ比) | 確率の比(症例対照研究で多用) |
| NNT(治療必要数) | 「1人の効果のために何人治療すべき」 |
NNT のたとえ
「ある薬の NNT = 100」とは、100人にこの薬を飲ませると、1人だけ効果が出るということ。
- NNT 5:5人中1人に効果(とても効く)
- NNT 50:50人中1人に効果(まあ効く)
- NNT 500:500人中1人に効果(ほぼ効かない)
これを知ると、「○○を飲めば誰でも効く」という宣伝にだまされにくくなります。
🔢 信頼区間(Confidence Interval、CI)
意味:「数値の信頼できる範囲」。
たとえ話
「禁煙すると寿命が 10年延びる(95% CI: 8〜12年)」とあったら:
– 真の値が 8〜12年の間にある可能性が95%
– ピンポイント10年ではなく、8〜12年の幅で考える
なぜ重要か
- 95% CI が「1.0をまたいでいる」と、効果が 統計的に有意でない
- CI が狭いほど信頼度が高い
- CI が広いほど不確実
🎲 p値(p-value)
意味:「偶然でこの結果が出る確率」。
たとえ話
「コインを10回投げて10回表だった」とき:
– 偶然そうなる確率(p値)= 0.001(0.1%)
– → これは偶然ではなく、コインに何か仕掛けがあると考えるのが妥当
数値の読み方
| p値 | 意味 |
|---|---|
| p < 0.05 | 統計的に有意(5% 以下の確率で偶然) |
| p < 0.01 | より強い有意 |
| p < 0.001 | 非常に強い有意 |
| p > 0.05 | 偶然の可能性が高い、効果なしの可能性 |
evidage では、p < 0.05 を満たさない研究は「示唆」「傾向」と表現します。
🧠 観察研究 vs 介入研究
| 種類 | 特徴 | 例 |
|---|---|---|
| 観察研究(コホート、症例対照) | ライフスタイルを観察するだけ | Takayama 研究(納豆と心血管死) |
| 介入研究(RCT、準実験) | 研究者が介入を提供 | PREDIMED(地中海食 RCT) |
重要な違い
- 観察研究:「相関」しかわからない(隠れた要因がある可能性)
- 介入研究:「因果」が証明できる
evidage では、RCT と大規模メタアナリシスを優先しつつ、観察研究も参考にしています。
🚨 「効きそう」と「効く」の違い
健康情報を読むときの最重要ポイント:
❌ 「効きそう」(注意が必要)
– 動物実験で効いた
– 細胞実験で効いた
– 個人の体験談がある
– メーカーの宣伝
✅ 「効く」(信頼できる)
– 複数のヒト RCT で確認された
– メタアナリシスで効果量が示された
– 大規模コホート研究で関連が確認された
evidage では、「効きそう」レベルの情報は Level 4 として明示し、「効く」レベルの Level 1〜2 を中心に推奨しています。
🔗 関連ページ
⚠️ 免責事項
本ページは医学・統計学の教育目的の参考情報です。専門的・厳密な定義は、医学統計の教科書をご参照ください。
evidage 編集部/株式会社ハイドロウィングラボ/2026年4月25日