エビデンスの基礎知識 — 専門用語をやさしく読み解く

エビデンスの基礎知識 — 専門用語をやさしく読み解く

このページは、evidage.com の記事に出てくる「ハザード比」「メタアナリシス」「RCT」などの専門用語を、たとえ話と図解でやさしく解説するためのものです。

「健康情報の科学」が初めての方は、まずこのページから読むのがおすすめです。


🎯 まず最初に:エビデンスレベルとは?

健康情報には「信頼度の差」があります。同じ「○○は体にいい」という主張でも:

  • 個人の体験談(「私が試したら良かった!」)
  • 動物実験(「マウスでは効いた」)
  • 小規模臨床試験(「30人で調べたら効果あり」)
  • 大規模ランダム化試験(「1万人を5年追跡したら効果が確認された」)

これらはまったく信頼度が違います。evidage では、すべての推奨に Level 1〜4 の4段階で信頼度を明示しています。

Level 1 — 最強推奨(緑色)🟢

意味:複数の大規模 RCT またはメタアナリシスで結果が一致

たとえ:「日本中の10万人を10年追跡したらこの結果でした」を複数チームが別々に検証してくれて、みんな同じ結論になった。

:禁煙、週150分運動、地中海食

Level 2 — 強く推奨(青色)🔵

意味:大規模コホート研究、または少数の RCT で効果が一致

たとえ:「数万人を数年追跡してこういう結果」が出ているけれど、まだ複数チームの追試はこれから。

:睡眠7〜9時間、社会的つながり、納豆摂取

Level 3 — 推奨(グレー青)🔘

意味:観察研究や小規模試験での示唆あり

たとえ:「数百〜数千人で観察したらこういう傾向」だが、決定的ではない。

:マインドフルネス瞑想、ブロッコリースプラウトの抗酸化

Level 4 — 限定的(グレー)⚪

意味:動物実験や代理指標のみ、ヒトでの大規模試験は未確立

たとえ:「マウスでは効いた」「血液マーカーでは変わった」レベル。

:NMN/NR、レスベラトロール、エビオス錠(直接エビデンス)

避けるべき(赤色)🔴

意味:害が利益を上回ることが明確

:β-カロテン高用量サプリ、男性のカルシウム高用量サプリ


🔬 ハザード比(HR、Hazard Ratio)

意味:「ある介入をした人」と「しない人」で、特定のイベント(病気、死亡など)が起きるリスクを比べた比率。

たとえ話

100人の友人が2年後に風邪をひく確率を考えましょう:
– グループA(マスクなし):30人が風邪をひく
– グループB(マスクあり):20人が風邪をひく

このとき、ハザード比 HR = 20/30 = 0.67「マスクで風邪リスクが33%減」という意味です。

数値の読み方

HR 意味
HR 1.0 リスク変わらず
HR 0.7 リスク 30% 低下(良い
HR 0.5 リスク 50% 低下(かなり良い
HR 1.3 リスク 30% 増加(悪い
HR 2.0 リスク 2倍(かなり悪い

evidage 記事での使い方

例:「禁煙者 vs 喫煙者:全死亡 HR 0.5
→ 「禁煙すると、亡くなるリスクが喫煙し続ける場合の半分になる」


📊 メタアナリシス(メタ解析)

意味:同じテーマの研究をたくさん集めて、統計的にまとめたもの。

たとえ話

1人の医者が「コーヒーは健康に良い」と言っても、それだけでは信頼できません。
でも、世界中の研究50本を集めて統計的にまとめたら?

「平均すると、コーヒーを飲む人は飲まない人より心血管疾患リスクが10%低い」みたいな全体傾向が見えてきます。

なぜ重要か

  • 個別の研究は、たまたま結果が出た可能性がある(偶然・バイアス)
  • メタアナリシスは多数の研究の平均なので、より確実
  • 多くの場合、Level 1 エビデンスの根拠になる

evidage 記事での使い方

例:「Ekelund et al. (2019) の メタアナリシス(105万人):週150分運動で全死亡 HR 0.69」
→ 「世界中の研究をまとめた結果、100万人規模でこの効果が確認された」


🧪 RCT(ランダム化比較試験)

意味ランダムに2グループに分けて、片方には介入、もう片方にはしない、で結果を比べる実験。

たとえ話

「ある食事法でやせるか?」を調べたい時:
– 100人を集める
– コインを投げて、ランダムに50人ずつに振り分け
– A グループ:その食事法を実践
– B グループ:普通の食事
– 半年後、体重を比較

ランダムにすることで、「もともとやせている人だけがAに集まった」みたいな偏りが排除できます。

なぜ重要か

  • 因果関係を証明できる唯一の方法
  • 観察研究は「相関」しか分からない
  • 薬の承認も RCT が必須

evidage 記事での使い方

例:「PREDIMED 試験(RCT, 7,447人):地中海食で心血管イベント 30% 低下」
→ 「ランダム化されたしっかりした実験で、地中海食の効果が確認された」


📐 効果量(Effect Size)

意味:「どれくらい効くか」の数値。

よく出る指標

指標 意味
HR(ハザード比) 既出。リスクの比
RR(相対リスク) リスクの比率(HRと似ているが対象期間が異なる)
OR(オッズ比) 確率の比(症例対照研究で多用)
NNT(治療必要数) 「1人の効果のために何人治療すべき」

NNT のたとえ

「ある薬の NNT = 100」とは、100人にこの薬を飲ませると、1人だけ効果が出るということ。

  • NNT 5:5人中1人に効果(とても効く)
  • NNT 50:50人中1人に効果(まあ効く)
  • NNT 500:500人中1人に効果(ほぼ効かない)

これを知ると、「○○を飲めば誰でも効く」という宣伝にだまされにくくなります。


🔢 信頼区間(Confidence Interval、CI)

意味:「数値の信頼できる範囲」。

たとえ話

「禁煙すると寿命が 10年延びる(95% CI: 8〜12年)」とあったら:
真の値が 8〜12年の間にある可能性が95%
– ピンポイント10年ではなく、8〜12年の幅で考える

なぜ重要か

  • 95% CI が「1.0をまたいでいる」と、効果が 統計的に有意でない
  • CI が狭いほど信頼度が高い
  • CI が広いほど不確実

🎲 p値(p-value)

意味:「偶然でこの結果が出る確率」。

たとえ話

「コインを10回投げて10回表だった」とき:
– 偶然そうなる確率(p値)= 0.001(0.1%)
– → これは偶然ではなく、コインに何か仕掛けがあると考えるのが妥当

数値の読み方

p値 意味
p < 0.05 統計的に有意(5% 以下の確率で偶然)
p < 0.01 より強い有意
p < 0.001 非常に強い有意
p > 0.05 偶然の可能性が高い、効果なしの可能性

evidage では、p < 0.05 を満たさない研究は「示唆」「傾向」と表現します。


🧠 観察研究 vs 介入研究

種類 特徴
観察研究(コホート、症例対照) ライフスタイルを観察するだけ Takayama 研究(納豆と心血管死)
介入研究(RCT、準実験) 研究者が介入を提供 PREDIMED(地中海食 RCT)

重要な違い

  • 観察研究:「相関」しかわからない(隠れた要因がある可能性)
  • 介入研究:「因果」が証明できる

evidage では、RCT と大規模メタアナリシスを優先しつつ、観察研究も参考にしています。


🚨 「効きそう」と「効く」の違い

健康情報を読むときの最重要ポイント

「効きそう」(注意が必要)
– 動物実験で効いた
– 細胞実験で効いた
– 個人の体験談がある
– メーカーの宣伝

「効く」(信頼できる)
– 複数のヒト RCT で確認された
– メタアナリシスで効果量が示された
– 大規模コホート研究で関連が確認された

evidage では、「効きそう」レベルの情報は Level 4 として明示し、「効く」レベルの Level 1〜2 を中心に推奨しています。


🔗 関連ページ


⚠️ 免責事項

本ページは医学・統計学の教育目的の参考情報です。専門的・厳密な定義は、医学統計の教科書をご参照ください。


evidage 編集部/株式会社ハイドロウィングラボ/2026年4月25日