エビデンスの読み方(4段階レベルと評価軸)

なぜエビデンスに「レベル」を付けるのか

「効く」「効かない」という二元論では、現実の研究の幅広さを表現できません。同じ「赤ワインは健康にいい」という主張でも、ラットを使った試験管実験で示された話と、数万人を10年追跡した観察研究で示された話と、無作為化二重盲検の対照試験で示された話では、信頼度が大きく異なります。evidage は記事の冒頭に [Level 1〜4] を明示し、読者がそのエビデンスをどの程度の重みで受け止めればよいかを瞬時に判断できるようにしています。

4段階のエビデンスレベル — 一目で分かる早見表

レベル 証拠の強さ 何で示されているか
Level 1 最強 🥇 大規模ランダム比較試験の系統的レビュー・メタ解析。複数の独立した研究機関で再現済み
Level 2 🥈 複数のランダム比較試験または大規模コホート研究で一貫した結果
Level 3 🥉 観察研究・小規模ランダム比較試験。示唆的だが決定的でない
Level 4 限定的 🔬 動物実験・試験管実験・症例報告のみ。ヒト介入試験はまだ不十分

重要な区別:「証拠の強さ」と「推奨度」は別物です。たとえば「禁煙」は Level 1(最強)のエビデンスがあり、これは「禁煙したほうがよい」という強い推奨につながります。本サイトでは 「[Level X(証拠の強さ)]」「[行動の推奨度]」を別々に表記しています。

4つのレベル定義(詳細)

Level 1(最強)

大規模ランダム比較試験(RCT)の系統的レビュー・メタ解析で再現性高く支持されている領域。複数の独立した研究機関が同じ方向の結果を報告。例:禁煙、運動習慣、地中海食、十分な睡眠時間(7〜9時間)など。

Level 2(強)

複数のランダム比較試験または大規模コホート研究で一貫した結果が出ている領域。例:オリーブオイル、ヨーグルト、青魚、コーヒー(適量)、緑茶、抹茶、酢など。本サイトで扱う「気になる食べ物」シリーズの多くがこのレベル。

Level 3(中)

観察研究または小規模ランダム比較試験で示唆されているが、まだ決定的ではない領域。「やってみる価値はあるが、過信は禁物」というポジション。

Level 4(限定的)

動物実験・試験管実験・症例報告のみで、ヒトでの介入試験がまだ行われていない領域。話題として面白いが、生活への取り入れには根拠が不足。

4つの軸で評価する

  • ① 効果量:可能な限り具体的な数値で表現
  • ② 再現性:独立した複数の研究機関で確認されているか
  • ③ 副作用・リスク:利益と不利益を必ず併記
  • ④ 研究対象集団:健常者か疾患者か、年齢・性別・人種は何か

記事を読むときのコツ

記事冒頭の [Level X(最強/強/中/限定的)] 表示を最初に確認してください。「最強」「強」は今すぐ生活に取り入れる価値が高いもの。「中」は様子見でOK。「限定的」は話題として面白いが、まだ実行に移すには早い、という具合に判断できます。

最終更新:2026年5月