メインコンテンツまでスキップ

page_version — ページバージョン履歴

page_versionコンテンツが変化していく過程のページ履歴 を記録します。1行 = 「このページ (page_id) はこの状態 (version_id) で、この時刻からこの時刻まで公開されていた」。QA ZERO が 「記事を更新したあとで性能が変わったか?」 のような質問に答えるとき、古いデータと新しいデータを混ぜずに答えるための仕組みです。

時系列でのコンテンツ変化 を扱う質問に使ってください — A/B テスト、前後比較、改訂の影響追跡。

サンプル行

手作りサンプル。ID カラムは page_id のみ (version_id は実マテリアルではバージョンラベルとして出ます)。

page_idversion_idtitleword_countfirst_seenlast_seen
10421"コーヒーミル おすすめ (2025)"8202025-11-02 00:00:002026-01-15 09:23:00
10422"手挽きコーヒーミル おすすめ"12402026-01-15 09:23:002026-02-28 14:07:00
10423"手挽きコーヒーミル おすすめ (2026年版)"15102026-02-28 14:07:00(公開中)
10881"Hario Slim II"3402025-09-10 00:00:00(公開中)
12011"V60 の淹れ方ガイド"6802025-10-01 00:00:002026-03-12 08:14:00
12012"V60 でコーヒーを淹れる方法"9502026-03-12 08:14:00(公開中)

一目で読み取れる:

  • page_id 1042 は3バージョン。タイトルが時間とともに具体化され ("コーヒーミル おすすめ (2025)""手挽きコーヒーミル おすすめ (2026年版)")、word count がほぼ倍増。典型的なコンテンツリフレッシュの物語。
  • page_id 1088 は商品ページ — ローンチ以来1バージョン。商品ページは通常リビジョンが出ない。
  • page_id 1201 はタイトルが宣言的から指示的に変わった ("V60 の淹れ方ガイド""V60 でコーヒーを淹れる方法")。このページの GSC 順位が 2026-03-12 あたりで変化していれば、物語ができる。

サンプルが省いているカラム

  • content_hash — 本体の安定ハッシュ。実際のコンテンツ変更を検出するのに使う (日付スタンプ変更のようなノイズと区別するため)。
  • バージョンメタデータ — 変更種別、変更者 (追跡されていれば)、変更理由。

全リストは ai/materials.yaml

よく使う JOIN キー

  • page_idallpv.page_id + version_idallpv.version_id にマッチ (発生時点で公開されていたバージョンでページビューをスライス)
  • page_idgsc.page_id (バージョンごとの検索性能スライス)

典型的な分析パターン:

  1. page_version で気になるページのバージョンを引く。
  2. first_seen / last_seen の窓で allpv または gsc のトラフィックをバージョン別にスライスする。
  3. セグメントを比較する。

page_version に向いた最初の質問

  • 「ページ 1042 をリライトしたあとでエンゲージメント時間が増えたか?」
  • 「ページ 1201 の GSC 順位はバージョン間でどう変わったか?」
  • 「直近で変更されたページは?」
  • 「コンテンツ更新とトラフィック変化が相関するのはどこ?」

次に読むページ