【至急・重要】ウィルスチェックのお願い

Change Style


WP: 「タグまわりの謎」 (1) 調査開始

Masayan先輩のサイトでは、Advanced Tag Entry を使っても日本語タグデータが増殖する という。

ぼのの場合、Advanced Tag Entry を入れた当初にチェックして以降は、記事編集画面でタグ付けするときに、タグ付け欄のスラッグと Advanced Tag Entry 欄のタグ名が正しいことを確認する程度で、すっかりだらけきって安心しきっていました。

これはいかん、と気を引き締めて、うちのデータも調べます。(`・ω・´)ゞ

ただ、私のうっかり運用や他のプラグインなど、Advanced Tag Entry 以外にも重複タグを作る可能性があるため、現在のデータからは原因が分かりにくくなっているはず。。
そこで、今回の調査はこんな手順で。(予定)

  1. 現状のデータを確認
  2. 何か手がかりがあれば、追究してみる
  3. 重複タグ等を整理
  4. 改めて、タグ付け動作テスト・データ確認
  5. 必要に応じてソースコードを見る

参考資料:

今までのあらすじ

  • 関係しそうな今までの作業:
  • 過去の重複レコード等の整理はまだ行なっていない。
  • 最近の記事編集画面でのタグ付けは、Advanced Tag Entry のドロップダウンを使ったり、コアのタグ付け欄にスラッグ入れたり。 ← うっかり運用
  • 古い記事の編集時に、タグ付け欄のスラッグを毎回漏れなくチェックしていたか、自信なし。。 ← うっかり運用

調査開始時のタグデータ

terms テーブルの全データを name 順に表示して、タグ名がダブっているものを探す。 → 重複タグが見られるのは 169 以降。

下表は、その terms テーブルを term_id 順に表示し、重複データ(スラッグがURLエンコード)の前に正常データ(スラッグが英語)を挿入したもの。さらに、右側に term_taxonomyterm_relationships テーブルのデータを繋げてみた。(term_relationships は紐付けられている記事数分レコードがあるので、下表にはレコードの有無のみ記入。)

terms テーブル1 term_taxonomy テーブル2 term_
relationships3
term
_id
name slug term_
group
term_
taxonomy
_id
taxonomy description parent count レコード有無
(これ以前省略)
164 OPML opml 0
165 リンク集 links 0
167 うどん粉病 powdery-mildew 0
101 ナビゲーション navigation 0 104 post_tag 0 19 104: あり
169 ナビゲーション %e3%83%8a%e3… 0 173 post_tag 0 0 173: なし
107 タグ付け tag 0 110 post_tag 0 14 110: あり
171 タグ付け %e3%82%bf%e3… 0 175 post_tag 0 0 175: なし
97 アップグレード upgrade 0 100 post_tag 0 14 100: あり
172 アップグレード %e3%82%a2%e3… 0 176 post_tag 0 0 176: なし
173 Subversion subversion 0
174 SSH ssh 0
175 Akismet akismet 0
92 スパム spam 0 95 post_tag 0 13 95: あり
176 スパム %e3%82%b9%e3… 0 180 post_tag 0 0 180: なし
177 jQuery jquery 0
178 JavaScript javascript 0
179 icon icon 0
180 bbPress bbpress 0
142 インストール install 0 146 post_tag 0 9 146: あり
181 インストール %e3%82%a4%e3… 0 185 post_tag 0 0 185: なし
182 パーマリンク permalink 0 186 post_tag 0 1 186: あり
183 パーマリンク %e3%83%91%e3… 0 187 post_tag 0 0 187: なし

現状から分かること

  • どの重複タグも、実際の記事データには付けられていない。
  • ただし、「アップグレード」は、UTW データインポートや Inline Tag Thing 導入時の検証に使い、あえて残している重複タグ。
  • したがって、予想外の重複タグは、「176: スパム」あたりか、「181: インストール」「183: パーマリンク」である。
    これらは最近新しく設けたタグだけれど、Inline Tag Thing で過去記事にも付けたので、Advanced Tag Entry のせいとは言えない。
  • ごく最近の記事に付けた日本語タグを遡ってみる:
    インストール、パーマリンク、スパム、アップグレード — 全て重複タグあり
  • その前は、12/12 の記事に使った「カスタマイズ」「ナビゲーション」。
    カスタマイズ」の term データは「76: カスタマイズ(customize)」のみで、重複タグはない
    Advanced Tag Entry を入れたのは 12/4 だけれども、既存タグのスラッグを英語に編集し始めたのは少し経ってからなので、12/12 の記事の投稿時点ではスラッグが URLエンコードのままだったかもしれず、微妙。。

やはり、現状のデータでの原因究明は難しそう。
次は、データ整理をした上でタグ付けテストして、データを見てみます。

  1. カテゴリやタグに使う「語句」(term)の基本情報[back]
  2. 「カテゴリ」「タグ」(taxonomy)の情報と、それに使われる「語句」(term)とのの紐付け[back]
  3. 「カテゴリ」「タグ」と、「記事」「リンク(ブログロール)」との紐付け[back]

コメントをどうぞ