概要
pixivでは主にタグに関して、同じ意味・内容・機能の言葉(タグ)であるにもかかわらず、同義語や、ひらがな・カタカナの混在や取り違えなどで表記が割れている状態。表記ゆれ、または表記ぶれともいう。
読みは同じでも、漢字などの違いで意味が異なる言葉同士(たとえば「燃え/萌え」や「道着/胴着」)は「同音異義語」にあたるため、表記揺れには含まれないものとする。
もとより、漫画家の「手塚治虫」を「手塚治」と書いてしまう、英語の“light”と“right”のように(日本語では同じ「ライト」ではあるが)、文字/綴り・意味・発音の全てが異なるなどのケースでは、表記揺れではなく単なる誤字・誤記として扱われるべきであろう。
表記揺れとして、「漫画」「まんが」「マンガ」を例にすれば、いずれも日本人(または日本語のわかる人間)から見れば「同じ意味の言葉」と受け取れるが、コンピュータはこれらを「全く別の言葉」と解釈するため、検索に不便になる(ひらがな・カタカナ・漢字・アルファベット・記号の文字コードが全く異なるため)。
統一のメリットとデメリット
できれば一つの言葉に統一した方が便利であるが、pixivの肥大化に伴い、すでに手遅れのものも多い。日本語には公的な正書法が存在しないこともあり、用語の統一は非常に困難。統一しようにも「どれを選ぶか」についても意見が割れることもあるし、一見表記揺れでも実は使い分けられていることもあるので注意。
また、完全にまとめてしまった場合、それが検索者が思い浮かんだ言葉と違っていたら検索結果には何も表示されない。その場合も何らかの形で主流のタグが判り、そこに辿り着けることが望ましい。表記揺れタグを全部付けた誘導イラストを用意する方法もある。
タグでの望ましい表記
タグの役割を考えると、一番多く使われていて、他の意味での使用が無い表記が望ましい。
一般的な言葉においては「正式な表記」が存在せず、どのような表記が多く使われるかは不定。
特にひらがな・カタカナ・漢字表記タグが混在する場合が多くみられる。
作品名では正式名称、人物名ではフルネームが基本的に推奨される。
特に人名の場合、「姓だけ」または「名だけ」のタグは他の人物と混用される危険が増すため、推奨されない。
ただし、フルネームが判明していない場合や、略称・通称の方が通じやすく多く使われる場合もある。
例外として、アキュートがある。こちらに関しては、アキュート有りとアキュート無しが明確に(作品タグとしては)別扱いとなるが、大百科ではアキュートの有無によらず同一のものと判定される場合がある。
対策等
検索・閲覧
ピクシブ百科事典の記事に表記揺れがまとめてある場合はそれを参考にできる。
それがない場合、思い浮かんだ表記での検索を試し、適切な表記を見つけるのが望ましい。
1つの表記が圧倒的に多く使われている場合であれば、それだけを使っても問題は小さい。
表記揺れをまとめて検索したい場合は、OR検索(部分一致検索)が効果的。
表記揺れ間で部分一致が大きければ、部分一致検索の使用で事足りる場合もある。
タグ編集
そのタグの登録数が1桁かそれに近いなら、百科記事を書かずにタグを全部付け替えたほうがいいのかもしれないが、実は使い分けられているケースには注意。
pixivのタグの編集制限は厳しいが、制限が解除されるまでは他の記事でも編集して待とう。もしくはタグを消す人と付ける人、2人のアカウントで組めば相当早い。
表記揺れの言葉がいくつもタグロックされている場合は、新たな言葉を付けるだけにするか作者にメッセージなどで意見を送るのも方法である。
また「見た目は同じでも、入力した機種によって異なる記号になってしまうタグ」にも要注意。例えばMacで入力すると普通に出る「〜(波線)」だが、Windowsで入力しようとすると「~(チルダ)」が出てしまう(この実装は本来誤り)。こうしたタグを付け替えてしまうと、特定の機種で検索できなくなってしまうおそれがある。
記事編集
表記揺れタグのピクシブ百科事典で誘導記事を作製する方法がある。
多く使われている表記揺れではこれが適切と思われる。
また、誘導先の記事で表記揺れの一覧をまとめておけば、閲覧・検索の手助けができ、他者の編集により自分だけでは知り得なかった表記が見つかる可能性もある。
ピクシブ百科事典では、特定の表記についてのみ記事作製されている場合がある。
他表記で記事が作成されているのに気づかず同義語の記事を作成してしまう無駄を避けるため、事前に他表記の記事の有無を確認することが推奨される。
最近ではタグとして用いられたことのない(検索でのヒット数が0な)単語にもかかわらず、その単語を表記揺れとして記事を作っているユーザーもいるが、用いられていない以上は誘導する必要もないので、無駄な行為といえる。
このような記事はただ容量を使うだけな上、不必要に増えていくと検索の邪魔にしかならない。
そのため、該当の表記が実際にタグとして用いられているかをちゃんと確認してから作成するようにした方が良い。
表記ゆれの原因と例
全角・半角文字(記号・英数字など)の違い
漢字・ひらがな・カタカナ・アルファベットの違い
同名が多い動植物や色名は、一般側がキャラクターの少ないタグを選ぶことで、一般寄りと固有寄りに自然と分かれる場合もある。しかし新たな人気作の出現によって一気に割合が変わることもあるので不安定。絞り込み検索用に、他タグをつけておくほうが堅実。
なお、「犬」「イヌ」「いぬ」のように表記揺れのタグを併記する方法は、意外と絞り込み検索に強い。
異体字・仮名使いの違いなど
ピクシブ百科事典では漢字1文字のほうが親記事にしやすく、羽根は羽への誘導記事扱いだが、タグとしては逆に、文字数の多い羽根のほうが絞り込み検索で使いやすい。
娘(「むすめ」ではなく「こ」と読ませる場合。「眼鏡っ娘」「男の娘」など)/子
送り仮名の有無
長音符(ー)の有無
文字と絵文字・記号
ハートの「❤」など機種依存文字の記号も多い。
接辞や強調の有無
「○○絵」「○○画」系のタグは絞り込み検索に強い。例えば「自然」と「自然画」は同じようなタグだが、「自然」の部分一致検索では「混ぜるな自然」なども混ざる。
黒髪/黒髪ロング(髪色に髪型やその略称を組み合わせたタグは多数存在)
同一概念・類義語・別称
女子高生/女子校生(後者は女子中学生の意味も含まれるので注意)
外来語と国語・訳語の違い
正式・一般名称とその略称
作品名・人名などの固有名詞の表記揺れ
作品名が一般名詞であったり、単に人物の「姓が同じ」「名が同じ」な例は枚挙に暇が無いため、本記事では割愛する。
作品名・人名に誤記がある場合
⇒誤記一覧
記号の有無
けいおん!(原作・アニメ1期)/けいおん!!(アニメ2期)/けいおん(略称)
君の名は(ドラマ作品。後者作品とは無関係)/君の名は。(新海誠原作の映画作品。前者作品とは無関係)
また、中黒(・)の有無については『正式表記は「・」入りだが、一般に使われるタグでは省かれる』という事例が多く見られる。
アラビア数字・ローマ数字・漢数字の違い(誤記)
漫画・アニメなどの作品名に「数字」が含まれている場合、「アラビア数字」「ローマ数字」「漢数字」を取り違えることもある。
機種依存文字を気にして、ローマ数字をアラビア数字に置き換える場合も。
3月のライオン/三月のライオン(数字の違いで作品そのものが違ってしまう一例)
山田くんと7人の魔女/山田くんと七人の魔女(逆にアラビア数字が正題)
正式名称(フルネーム)と略称・別称の違い
中には、原作者や制作会社が決めた「公式の略称」も存在する。
通称と本名が異なる人物
シャア・アズナブル/クワトロ・バジーナ/キャスバル・レム・ダイクン
下の名前のみで表記されることが多い人物
一般によく使われている名前の場合、前述のとおり検索時に支障をきたす場合があるため、フルネームでのタグが望ましい。
姓名の片方が別の意味・用法で使われている人物
同姓同名・同一表記の人物(合成語や括弧付きによる曖昧さ回避)
曖昧さ回避の記事も参照。
ジョーカー/ジョーカー(プリキュア)/ジョーカー(バットマン)/ジョーカー(映画)/ジョーカー(ペルソナ5)
孫悟空/孫悟空(ドラゴンボール)/孫悟空(最遊記)/孫悟空(無双)
同一シリーズ内での別表記
登場作品によって漢字などが異なる場合、誤った使われ方がされやすい。
アキュートの有無
etc…
一般/汎用タグ
2番目が100000件以上
2番目が10000件以上
2番目が5000件以上
2番目が1000件以上
(比率差大)
2番目が500件以上
2番目が100件以上
作品名等のタグ
2番目が100000件以上
艦隊これくしょん/艦これ(略称タグの方が正式名称を上回っている)
2番目が10000件以上
(比率差大)
2番目が5000件以上
(比率差大)
2番目が1000件以上
ドラクエ3/DQ3/ドラゴンクエスト3/ドラクエIII/ドラゴンクエストIII/ドラクエⅢ/ドラゴンクエストⅢ
2番目が500件以上
DQ2/ドラクエ2/ドラゴンクエスト2/ドラクエII/ドラゴンクエストII/ドラクエⅡ/ドラゴンクエストⅡ