User:Hcm/注意すべき約物

From MusicBrainz Wiki
< User:Hcm
Revision as of 15:18, 16 December 2014 by Hcm (talk | contribs) (ハイフン)

アポストロフィ、引用符

ASCII領域にある約物のアポストロフィ「' (U+0027)」は、名称こそ「APOSTROPHE」とされていますが、Unicode標準では「アポストロフィとして右単一引用符「’ (U+2019)」を用いるのが好ましい」としています[1]

ガイドラインに於いてはASCIIのアポストロフィ・二重引用符を使っても良いとしていますが[2]、なるべく以下の約物に置き換えましょう。


文字 コードポイント 名称 註記
U+2018 LEFT SINGLE QUOTATION MARK 単一引用符開き
U+2019 RIGHT SINGLE QUOTATION MARK 単一引用符閉じ、アポストロフィ
U+201C LEFT DOUBLE QUOTATION MARK 二重引用符開き
U+201D RIGHT DOUBLE QUOTATION MARK 二重引用符閉じ
U+2032 PRIME プライム、ダッシュ(古い数学用語)、分(時間・角度)、フィート
U+2033 DOUBLE PRIME 秒、インチ[3]
U+2034 TRIPLE PRIME

ハイフン

普段キーボードからハイフンのつもりで入力している「- (U+002D)」という文字は、正確にはハイフンではなく「ハイフンマイナス(HYPHEN-MINUS)」という約物です。組版に於いてはハイフン「‐ (U+2010)」とマイナス「− (U+2212)」は区別されるべきですが、データ入力に関していうと見た目が似ている両者を普段から別物として扱う事や、そもそも文字入力自体が難しく、またいくら正しく約物を置き換えられたとしても、既存のハイフンマイナスが使われたデータと混ざると当然別のデータとして扱われるので、突合や並び換えの処理で不都合を被る可能性が高いです。

ハイフンマイナスはダッシュの代わりに使われることもありますが、ダッシュはハイフンともマイナスとも全く異なる約物ですから適切に置き換えるべきでしょう。

2014-04-03現在のところ、MusicBrainzの公式ガイドラインにはハイフンマイナスにまつわる項目は無いようです。

文字 コードポイント 名称 註記
- U+002D HYPHEN-MINUS ASCII領域にあるハイフンとマイナスを兼ねた文字。規格制定者の苦労が滲んでくる名前。
U+2010 HYPHEN ハイフン。大抵のフォントでハイフンマイナスより若干短く、また低い位置にあるはず。
U+2212 MINUS SIGN 数学記号のマイナス
U+2013 EN DASH 数字の間に入れて区間を示す。複合語を作る時、一方ないし両方がスペース又はハイフンを含む時にハイフンの代わりに使う。両脇にスペースを入れて後述の普通のダッシュと同じ様に使う方法もある[4]
U+2014 EM DASH 一般に使われるダッシュ。引用を示す、文の両端を囲って先導の単語の言い換えや補足をする、副題を付けるとか色々。
U+2015 HORIZONTAL BAR これは使い方がよくわからない。Unicode仕様書では「quotation dash」とか「long dash introducing quoted text」とか説明が書かれているけど、これはEmダッシュでも想定されている使い方だし、単純に横に線を引きたいという用途以外では使わないほうが良い気がする。
U+FF0D FULLWIDTH HYPHEN-MINUS いわゆる全角文字。見つけ次第皆殺しにして根絶やしにしましょう。

チルダ

普通の文脈に於いて、発音記号であるチルダ「~ (U+007f)」が単独で表れる場面は全くと言って良いほど無く、ダッシュの誤りだと思われます。

副題の区切りとして使われている場合は、副題の付け方に関するガイドラインも参照してください。

文字 コードポイント 名称 註記
U+301C WAVE DASH 波ダッシュ。大体は単純にこれに置き換えられると思います。括弧の代わり、en/emダッシュ、長音と何でも万能にこなすイカす奴。
U+2053 SWUNG DASH 辞書に於いて、例文内で見出しの語が使われた場合に省略する、という様に使う。「欧文ならswung dash、和文なら波ダッシュ」という使い方ではない。あんまり使わないはず。
U+FF5E FULLWIDTH TILDE いわゆる全角文字。見つけ次第皆殺しにして根絶やしにしましょう。

文字 コードポイント 名称 註記
U+30FB KATAKANA MIDDLE DOT 中黒。日本語文章で事柄を列挙したり外国人名の区切りに使ったりする。単独の点についてはこれを使っておけばまぁあんまり間違いは無いのでは。
· U+00B7 MIDDLE DOT KATAKANAという属性がない点。欧文のみの文章で中黒を使う機会があったらこれを使うとU+30FBを使った時よりも横に広がらなくて良いと思う。
U+2022 BULLET 箇条書きをする時に、行の冒頭に置いて以下が列挙した項目であることを表すための記号。HTMLなどのリッチテキストでは列挙を表すための構造が用意されているので使わないほうが良いです。
U+2219 BULLET OPERATOR 数学で掛け算をすることを表す記号。
U+2026 HORIZONTAL ELLIPSIS おなじみ3点リーダー。中黒が3つ並べられているのを見かけたらこれに置き換えましょう。
U+22EF MIDLINE HORIZONTAL ELLIPSIS これは数学の行列で使う記号で、長く連なる要素を途中で省略したことを表す記号。こういうの。なのでリーダーとして使うのは適切ではありません。U+2026だと言語やフォントによってリーダーの位置が下端だったり中心だったりして不便なため、一時期Mac OS Xが日本語組版に於ける3点リーダとして採用していた時期がありましたが、やはり記号の成り立ちが異なるため結局元に戻しています[5]。Unicodeは地獄だ。
U+FF65 HALFWIDTH KATAKANA MIDDLE DOT いわゆる半角文字。見つけ次第皆殺しにして根絶やしにしましょう。

山括弧

文字の持つ意味からして、角が1つ立った括弧としてはU+3008/U+3009の「〈〉」を使うのが正しいのですが、数学記号である大なり・小なり記号を用いて括弧の代わりとしている場面も多いです。理由としては、入力しやすいとか、本来の山括弧に比べてこう…角がシュッとした感じ?がカッコいいとか、山括弧使うと左右に間隔が空いて間延びする等々、フォントの問題や日本人プログラマを長年苦しめている全角半角の問題が色々絡んで、だれもが納得するように正しく約物を使うという事が難しくなっています。

無闇に括弧を置き換えようとすると(山括弧に限らないのですが)見た目至上派との衝突で血が流れることになるため、そのようなデータを見掛けても見て見ぬ振りをして大人しく手もとのデータだけ修正するのが現状は得策だと思います……。

スタイル指針でこの括弧の適切な置換えを制定した方がいい気がしなくもない。

文字 コードポイント 名称 註記
<> U+003C
U+003E
LESS-THAN SIGN
GREATER-THAN SIGN
大なり・小なり
〈〉 U+3008
U+3009
LEFT ANGLE BRACKET
RIGHT ANGLE BRACKET
山括弧
‹› U+2039
U+203A
SINGLE LEFT-POINTING ANGLE QUOTATION MARK
SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
これは括弧というよりも引用符なので、山括弧の単純な代替として使うのは微妙です。またJIS X 0213にも収録されていません。
〈〉 U+2329
U+232A
LEFT-POINTING ANGLE BRACKET
RIGHT-POINTING ANGLE BRACKET
この文字はUnicode標準で非推奨(deprecated)とされています。括弧としてならU+3008/U+3009を、数学記号としてはU+27E8/U+27E9に置き換えることが推奨されています。
⟨⟩ U+27E8
U+27E9
MATHEMATICAL LEFT ANGLE BRACKET
MATHEMATICAL RIGHT ANGLE BRACKET
<> U+FF1C
U+FF1E
FULLWIDTH LESS-THAN SIGN
FULLWIDTH GREATER-THAN SIGN
いわゆる全角文字。見つけ次第皆殺しにして根絶やしにしましょう。

ダブルハイフン

使い方はWikipedia:ja:ダブルハイフンを参照。

文字 コードポイント 名称 註記
= U+003D EQUALS SIGN 数学記号の等号。かつてのJIS X 0208ではダブルハイフンが収録されていなかったため、これで代用するしかありませんでした。
U+30A0 KATAKANA-HIRAGANA DOUBLE HYPHEN JIS X 0213に含まれているダブルハイフン。
U+2E17 DOUBLE OBLIQUE HYPHEN 斜めになっているダブルハイフン。ドイツ文字とかフラクトゥールと呼ばれるフォントではハイフンが斜め二重線になっているように見えますが、これはハイフンがそのようにデザインされているというだけなので入力ではU+2010を使うべきです。
U+2E40 DOUBLE HYPHEN Unicode 7.0で導入された言語属性無しのダブルハイフン。使用例はWaldorf⹀Astoriaが有名ですけど今はもう使われてないらしいですよね。どこで使うんだこれ[6]

リンク

脚註

  1. The Unicode Standard, Version 6.3: General Punctuation
  2. Style/Miscellaneous
  3. リリースの媒体の種類で“7" Vinyl”とか“12" Vinyl”とかありますけどこれもダブルプライムに置き換えた方がいいですね(2014-04-20)。
  4. ドイツの正書法ではemダッシュを使わずこれが正式らしい
  5. エリプシス(ellipsis)と三点リーダ - Mac OS Xの文字コード問題に関するメモ
  6. [1]