User:Hcm/日本語ロケールに於けるalias及びsort name/提案: Difference between revisions

From MusicBrainz Wiki
Jump to navigationJump to search
No edit summary
No edit summary
Line 24: Line 24:


=== 補足 ===
=== 補足 ===

* 間隔姓名の区切り、シリーズ物の名前分離のに使う。
* 丸括弧は名義冒頭『The』など索引に含めるのが不適当な物を末尾でまとめために使う。
間隔名の区切りシリーズの名前分離すに使う。

* アラビア数字はシリーズ物や代を表すものに使う。
丸括弧は名義冒頭の『The』など、索引に含めるのが不適当な物を末尾でまとめるために使う。
* [[Wikipedia:ja:下駄記号|下駄]]は読みの一部のみがわからない場合にその箇所を埋めるために使う。日本語ロケールにおいて下駄はあらゆる文字クラスの後に並ぶことが期待されているため。

* JIS X 0213に収録されている、か行の鼻濁音である『か゚き゚く゚け゚こ゚』は、Unicodeにおいては単一のコードポイントが与えられておらず、例えば『[[Wikipedia:ja:か゚|か゚]]』なら『か』に合成用半濁点のU+309Aを並べて表記する必要が有ります。これらの文字が他の濁音・半濁音が合成済みの仮名と混ざると、並べ替え処理が複雑になるので使わないほうが良いでしょう。
アラビア数字はシリーズ物や代のに使う。
* 片仮名の捨て仮名は他に『ㇰㇱㇲㇳㇴㇵㇶㇷㇷ゚ㇸㇹㇺㇻㇼㇽㇾㇿ』があり、日本語の正書法には無くアイヌ語で用いられます。この内『[[Wikipedia:ja:ㇷ゚|ㇷ゚]]』は『ㇷ』にU+309Aを並べる必要が有り、上段の『か゚き゚く゚け゚こ゚』を用いた時と同じ問題が起こります。このためアイヌ語を表記する手段であるこれら捨て仮名を使うのは避けたほうが良いように思います。

[[Wikipedia:ja:下駄記号|下駄]]は読みの一部のみがわからない場合にその箇所を埋めるために使う。日本語ロケールにおいて下駄はあらゆる文字クラスの後に並ぶことが期待されているため。

JIS X 0213に収録されている、か行の鼻濁音である『か゚き゚く゚け゚こ゚』は、Unicodeにおいては単一のコードポイントが与えられておらず、例えば『[[Wikipedia:ja:か゚|か゚]]』なら『か』に合成用半濁点のU+309Aを並べて表記する必要が有ります。これらの文字が他の濁音・半濁音が合成済みの仮名と混ざると、並べ替え処理が複雑になるので使わないほうが良いでしょう。

片仮名の捨て仮名は他に『ㇰㇱㇲㇳㇴㇵㇶㇷㇷ゚ㇸㇹㇺㇻㇼㇽㇾㇿ』があり、日本語の正書法には無くアイヌ語で用いられます。この内『[[Wikipedia:ja:ㇷ゚|ㇷ゚]]』は『ㇷ』にU+309Aを並べる必要が有り、上段の『か゚き゚く゚け゚こ゚』を用いた時と同じ問題が起こります。このためアイヌ語を表記する手段であるこれら捨て仮名を使うのは避けたほうが良いように思います。


== 基本 ==
== 基本 ==
Line 49: Line 55:


これ以降の規則でsort nameに間隔が使われる場合でも、aliasには間隔を追加しない。
これ以降の規則でsort nameに間隔が使われる場合でも、aliasには間隔を追加しない。

名義が複数の英単語からなる場合、単語の読みの間に間隔は'''入れない'''。


記号など読みに含まれないものはsort nameに入れない。
記号など読みに含まれないものはsort nameに入れない。

名義に単語を区切る間隔や記号を含む場合でも、sort nameの中に間隔や記号などは'''入れない'''。


== 冠詞など ==
== 冠詞など ==
Line 71: Line 77:


株式会社などは一律省く。理由はあとでかく。
株式会社などは一律省く。理由はあとでかく。

== 代・巻・シリーズ番号など ==

『二代目田中太郎』など、ある名義についての続き物としての番号が降られているとみなせる場合、番号をアラビア数字に直して末尾に追加する。

=== 例 ===

* [[artist:50785e05-d34b-4b13-8972-e0bed5c67f97|(十二代目)市川團十郎]] → いちかわ だんじゅうろう12
* [[work:4f288480-7314-417f-a98e-9ef099a9a80b|ファイナルファンタジーIX]] → ファイナルファンタジー09


== 人名 ==
== 人名 ==


アーティスト名が姓名に分けられ、それが『姓・名』と並んでいる場合、sort nameの姓と名の間に間隔を入れる。名の区別がない・姓名区別があが『姓・名』の順に並んでいない場合はそのままにする
アーティスト名が姓名に分けられ、それが『姓・名』と並んでいる場合、sort nameの姓と名の間に間隔を入れる。(下の)部分ミドルネームど複数部分からなる場合はそのまま一つの名前として扱う

姓名の区別がない・姓名の区別があるが『姓・名』の順に並んでいない場合はそのままにする。


=== 例 ===
=== 例 ===
Line 89: Line 88:
* [[artist:5565ae4b-bb20-48a4-a8b0-dfdeb53b555a|布袋寅泰]] → ほてい ともやす
* [[artist:5565ae4b-bb20-48a4-a8b0-dfdeb53b555a|布袋寅泰]] → ほてい ともやす
* [[artist:434d8627-bdf4-40d1-b79f-c5684bf72de3|くまいもとこ]] → くまい もとこ
* [[artist:434d8627-bdf4-40d1-b79f-c5684bf72de3|くまいもとこ]] → くまい もとこ
* [[artist:db346b00-3df2-45cf-98e0-86260d521342|ブリドカットセーラ恵美]] → ブリドカット セーラえみ
* [[artist:d5176cc6-3d8e-4cb1-a57e-5417c176aac8|バカボン鈴木]] → バカボンすずき
* [[artist:d5176cc6-3d8e-4cb1-a57e-5417c176aac8|バカボン鈴木]] → バカボンすずき
* [[artist:6d4c4759-8a16-4b9f-83e2-4c225307fc85|Ken Ishii]] → ケンイシイ
* [[artist:6d4c4759-8a16-4b9f-83e2-4c225307fc85|Ken Ishii]] → ケンイシイ
Line 96: Line 96:
名義が姓と名に分けられるが『姓・名』の順に並んでいない場合は、sort nameの為に姓名の順に入れ替えるということは'''しない'''。一般的に日本の音楽関連のアーティスト索引は純粋な読みの順番で並んでいるため。
名義が姓と名に分けられるが『姓・名』の順に並んでいない場合は、sort nameの為に姓名の順に入れ替えるということは'''しない'''。一般的に日本の音楽関連のアーティスト索引は純粋な読みの順番で並んでいるため。


== 人名例外・クラシック音楽作曲家 ==
== 人名例外・クラシック音楽作曲家・演奏家 ==


欧米系のクラシック音楽作曲家は苗字のみで索引を作られることが一般的なため、名義が『名・姓』と並んでいた場合はsort nameを『姓・名』に入れ替える。イニシャルは開く。
クラシック音楽作曲家・演奏家は苗字のみで索引を作られることが一般的なため、名義が『名・姓』と並んでいた場合はsort nameを『姓・名』に入れ替える。イニシャルは開く。


名義がフルネームで表記される場合が稀であると考えられる場合、苗字のみのaliasをprimaryとするのが好ましいかも知れない。
名義がフルネームで表記される場合が稀であると考えられる場合、苗字のみのaliasをprimaryとするのが好ましいかも知れない。
Line 107: Line 107:
* [[artist:6fdd3b3e-1ea6-4da9-8d6f-8f8de01c133a|モーリス・ラヴェル]] → ラヴェル モーリス
* [[artist:6fdd3b3e-1ea6-4da9-8d6f-8f8de01c133a|モーリス・ラヴェル]] → ラヴェル モーリス


== 愛称/ミドルネームを含む名前 ==
== 愛称を含む名前 ==


stub. 名義が『姓・愛称/ミドルネーム・名前』となっている場合、sort nameは名前と愛称はそままするべか入れ替えるべきか? ミドルネーム愛称で別の規則を作るべきか?
名義が『姓・愛称・名前』となっている場合、愛称の部分を名前の後ろ、名前の一部して扱う。

=== 例 ===

* [[artist:5b1b9f5e-4407-4e0d-a32a-a3fb1eac1fcb|村上“ポンタ”秀一]] → むらかみ しゅういちポンタ


<!--
<!--
Line 122: Line 126:
『むらかみ しゅういちポンた』や『むらかみ ポンた しゅういち』とはしない。
『むらかみ しゅういちポンた』や『むらかみ ポンた しゅういち』とはしない。
-->
-->

== 代・巻・シリーズ番号など ==

『二代目田中太郎』など、ある名義についての続き物としての番号が降られているとみなせる場合、番号をアラビア数字に直して末尾に追加する。

=== 例 ===

* [[artist:50785e05-d34b-4b13-8972-e0bed5c67f97|(十二代目)市川團十郎]] → いちかわ だんじゅうろう12
* [[work:4f288480-7314-417f-a98e-9ef099a9a80b|ファイナルファンタジーIX]] → ファイナルファンタジー09


== 別名義を含むグループ名 ==
== 別名義を含むグループ名 ==
Line 129: Line 142:
名義と後続の部分を間隔を入れて分けて、更に名義の部分についてsort nameの規則を適用する。
名義と後続の部分を間隔を入れて分けて、更に名義の部分についてsort nameの規則を適用する。


後続の部分の先頭が「の」「と」といった接続助詞や「ウィズ(with)」「フィーチャリング(featuring)」「ズ(’s)」「アンド(and)」といったアーティスト同士を結ぶフレーズ、「ザ(the)」といった冠詞から始まる場合はそれを省く
後続の部分の先頭が「の」「と」といった接続助詞や「ウィズ(with)」「フィーチャリング(featuring)」「アンド(and)」といったアーティスト同士を結ぶフレーズ、「ザ(the)」といった冠詞、「彼の」「ヒズ(his)」「ゼア(their)」「ズ(’s)」のような先の名義に対する所有格から始まる場合はそれを省く


後続の部分にさらに別の名義が含まれる場合はこれを繰り返す。
後続の部分にさらに別の名義が含まれる場合はこれを繰り返す。


=== 例 ===
=== 例 ===
* [[artist:5c913d38-8676-46ae-91f2-b315fbd27d08|弦一徹ストリングス]] → げん いってつ ストリングス
* [[artist:b64475cf-7706-4b1e-998e-adad25d35b21|佐山雅弘トリオ]] → さやま まさひろ トリオ
* [[artist:3e8583d9-c49e-447e-b1d4-2421a6955458|仙波清彦とはにわオールスターズ]] → せんば きよひこ はにわオースルターズ
* [[artist:49b3d3cc-881f-4370-8e23-63d237bf7b36|井上陽水奥田民生]] → いのうえ ようすい おくだ たみお
* [[artist:5086d4ab-75b8-4f2f-b482-162b6d379380|宇崎竜童&R・Uコネクションwith井上堯之]] → うざき りゅうどう アールユーコネクション いのうえ たかゆき

* [[artist:8ae0d675-22b1-48cd-adc5-d9065fe22c63|Shikao & The Family Sugar]] → シカオアンドザファミリーシュガー
* [[artist:39dfe589-90c1-4a20-89cc-9953cbafbef7|村山・落合ストリングス]] → むらやまおちあいストリングス

* [[artist:0bcb1ffe-f468-4ede-bef4-30f807af9830|Des-ROW]] → ディースロウ
* Des-ROW・スペ志アル → ディースロウ スペシアル
* [[artist:68528451-3f8b-490a-a630-68fd753e5127|Des-ROW・組]] → ディースロウぐみ
* [[artist:521789fb-3308-480f-92e5-bb85ebdfd494|Des-ROW・組スペシアル]] → ディースロウぐみ スペシアル
* [[artist:d2664fef-cf13-4b73-9c92-5cb8faa85f26|Des-ROW・組スペシアルr]] → ディースロウぐみ スペシアルアール

* [[artist:437319be-b887-44db-acab-378d77011859|T‐SQUARE SUPER BAND]] → ティースクェア スーパーバンド
* [[artist:792a6fb9-a5e0-40dd-8e05-74c4f929b05d|T‐SQUARE plus]] → ティースクェア プラス
* [[artist:6a5a1d92-3d06-40de-8a30-a5544efa0c57|T‐SQUARE and FRIENDS]] → ティースクェア フレンズ


;規則を適用
* ザ・田中太郎スーパーバンド → たなか たろう スーパーバンド (ザ)
:
* 田中太郎アンド・ザ・スーパーバンド → たなか たろう スーパーバンド
:* [[artist:5c913d38-8676-46ae-91f2-b315fbd27d08|弦一徹ストリングス]] → げん いってつ ストリングス
:* [[artist:b64475cf-7706-4b1e-998e-adad25d35b21|佐山雅弘トリオ]] → さやま まさひろ トリオ
:* [[artist:3e8583d9-c49e-447e-b1d4-2421a6955458|仙波清彦とはにわオールスターズ]] → せんば きよひこ はにわオースルターズ
:* [[artist:49b3d3cc-881f-4370-8e23-63d237bf7b36|井上陽水奥田民生]] → いのうえ ようすい おくだ たみお
:* [[artist:5086d4ab-75b8-4f2f-b482-162b6d379380|宇崎竜童&R・Uコネクションwith井上堯之]] → うざき りゅうどう アールユーコネクション いのうえ たかゆき
;規則を適用しない
:先頭部分が完全な名義を含まない場合は、基本の規則に準じる
:* [[artist:8ae0d675-22b1-48cd-adc5-d9065fe22c63|Shikao & The Family Sugar]] → シカオアンドザファミリーシュガー
:* [[artist:39dfe589-90c1-4a20-89cc-9953cbafbef7|村山・落合ストリングス]] → むらやまおちあいストリングス
;Des-ROWを使った例
:
:* [[artist:0bcb1ffe-f468-4ede-bef4-30f807af9830|Des-ROW]] → ディースロウ
:* Des-ROW・スペ志アル → ディースロウ スペシアル
:* [[artist:68528451-3f8b-490a-a630-68fd753e5127|Des-ROW・組]] → ディースロウぐみ
:* [[artist:521789fb-3308-480f-92e5-bb85ebdfd494|Des-ROW・組スペシアル]] → ディースロウぐみ スペシアル
:* [[artist:d2664fef-cf13-4b73-9c92-5cb8faa85f26|Des-ROW・組スペシアルr]] → ディースロウぐみ スペシアルアール
;T‐SQUAREを使った例
:
:* [[artist:437319be-b887-44db-acab-378d77011859|T‐SQUARE SUPER BAND]] → ティースクェア スーパーバンド
:* [[artist:792a6fb9-a5e0-40dd-8e05-74c4f929b05d|T‐SQUARE plus]] → ティースクェア プラス
:* [[artist:6a5a1d92-3d06-40de-8a30-a5544efa0c57|T‐SQUARE and FRIENDS]] → ティースクェア フレンズ
;複雑な例
:
:* ザ・田中太郎スーパーバンド → たなか たろう スーパーバンド (ザ)
:* 田中太郎アンド・ザ・スーパーバンド → たなか たろう スーパーバンド
:* The Tanakars and The Satows with their Orchestra → タナカーズ サトーズ オーケストラ (ザ)


=== 補足 ===
=== 補足 ===
Line 163: Line 184:


=== sort nameに対する姓名のスペースについて ===
=== sort nameに対する姓名のスペースについて ===
巷のアーティストの索引を提供しているサイトでは、大体が名前にスペースを用いないため、辞書順で並ぶようになっています。にもかかわらずここで電話帳順になるような提案をしたのは、「アプリケーション側で間隔を取り除くだけで電話帳順から辞書順に簡単に変換できるから」です。電話帳順も辞書順も「最終的な読みは一緒」になりますから、電話帳順のデータを用意しさえすれば、あとでポリシーの違いで辞書順を使う必要が出てきても、先の操作だけで苦労せず移行できるはずで、結果的に両対応したことになります。これが逆に辞書順から電話帳順に移行しようとなるとデータ全体を見直さなければならないため、一筋縄ではいかないでしょう
巷のアーティストの索引を提供しているサイトでは、大体が名前にスペースを用いないため、辞書順で並ぶようになっています。にもかかわらずここで電話帳順になるような提案をしたのは、「アプリケーション側で間隔を取り除くだけで電話帳順から辞書順に簡単に変換できるから」です。電話帳順も辞書順も「最終的な読みは一緒」になりますから、電話帳順のデータを用意しさえすれば、あとでポリシーの違いで辞書順を使う必要が出てきても、先の操作だけで苦労せず移行できるはずで、結果的に両対応したことになります。これが逆に辞書順から電話帳順に移行しようとなるとデータ全体を見直さなければならず大変苦労を伴うでしょう。

Revision as of 20:23, 17 March 2015

文字体系

sort nameに使う文字は以下に限定する。

  • 間隔(スペース)
    • 『 』
    • U+0020のみ使う。
  • 丸括弧
    • 『()』
  • アラビア数字
    • 『0123456789』
  • 平仮名
    • 『あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわゐゑをん』
    • 『ゔがぎぐげござじずぜぞだぢづでどばびぶべぼぱぴぷぺぽ』
    • 『ぁぃぅぇぉゕゖっゃゅょゎ』
  • 片仮名
    • 『アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヰヱヲン』
    • 『ヴガギグゲゴザジズゼゾダヂヅデドバビブベボパピプペポヷヸヹヺ』
    • 『ァィゥェォヵヶッャュョヮ』
  • 長音
    • 『ー』
  • 下駄
    • 『〓』

補足

間隔は姓名の区切り、シリーズ物の名前を分離するのに使う。

丸括弧は名義冒頭の『The』など、索引に含めるのが不適当な物を末尾でまとめるために使う。

アラビア数字はシリーズ物や代を表すものに使う。

下駄は読みの一部のみがわからない場合にその箇所を埋めるために使う。日本語ロケールにおいて下駄はあらゆる文字クラスの後に並ぶことが期待されているため。

JIS X 0213に収録されている、か行の鼻濁音である『か゚き゚く゚け゚こ゚』は、Unicodeにおいては単一のコードポイントが与えられておらず、例えば『か゚』なら『か』に合成用半濁点のU+309Aを並べて表記する必要が有ります。これらの文字が他の濁音・半濁音が合成済みの仮名と混ざると、並べ替え処理が複雑になるので使わないほうが良いでしょう。

片仮名の捨て仮名は他に『ㇰㇱㇲㇳㇴㇵㇶㇷㇷ゚ㇸㇹㇺㇻㇼㇽㇾㇿ』があり、日本語の正書法には無くアイヌ語で用いられます。この内『ㇷ゚』は『ㇷ』にU+309Aを並べる必要が有り、上段の『か゚き゚く゚け゚こ゚』を用いた時と同じ問題が起こります。このためアイヌ語を表記する手段であるこれら捨て仮名を使うのは避けたほうが良いように思います。

基本

基本的に表記を仮名に書き下したものをそのまま使う。名義中にアラビア数字や記号が使われている場合も読みに直して仮名を使う。

補足

書き下した後に濁点を除いたり捨て仮名を直したり平仮名か片仮名に揃えるということはしない。利用者側の都合によって利用者毎に変換すべきです。

これ以降の規則でsort nameに間隔が使われる場合でも、aliasには間隔を追加しない。

記号など読みに含まれないものはsort nameに入れない。

名義に単語を区切る間隔や記号を含む場合でも、sort nameの中に間隔や記号などは入れない

冠詞など

『The』『ザ』など、一般的に索引に含められないものが先頭にある場合、それを丸括弧で囲み、末尾に移動させ、間隔を挿入する。

補足

括弧で囲む理由は、冠詞を抜かずにそのままソートする流派に対して入れ替える対象を抜き出しやすくさせたいという意図があります。

株式会社・有限会社など

株式会社などは一律省く。理由はあとでかく。

人名

アーティスト名が姓名に分けられ、それが『姓・名』と並んでいる場合、sort nameの姓と名の間に間隔を入れる。(下の)名前の部分がミドルネームなど複数の部分からなる場合はそのまま一つの名前として扱う。

姓名の区別がない・姓名の区別があるが『姓・名』の順に並んでいない場合はそのままにする。

補足

名義が姓と名に分けられるが『姓・名』の順に並んでいない場合は、sort nameの為に姓名の順に入れ替えるということはしない。一般的に日本の音楽関連のアーティスト索引は純粋な読みの順番で並んでいるため。

人名例外・クラシック音楽作曲家・演奏家

クラシック音楽作曲家・演奏家は苗字のみで索引を作られることが一般的なため、名義が『名・姓』と並んでいた場合はsort nameを『姓・名』に入れ替える。イニシャルは開く。

名義がフルネームで表記される場合が稀であると考えられる場合、苗字のみのaliasをprimaryとするのが好ましいかも知れない。

愛称を含む名前

名義が『姓・愛称・名前』となっている場合、愛称の部分を名前の後ろに置き、名前の一部として扱う。


代・巻・シリーズ番号など

『二代目田中太郎』など、ある名義についての続き物としての番号が降られているとみなせる場合、番号をアラビア数字に直して末尾に追加する。

別名義を含むグループ名

グループ名義の先頭に別アーティストの完全な名義が含まれていて、その後のフレーズがそれ単独で名義全体の構成を表していたり、別のグループ・人物を含む場合、先頭の名義がグループで後続の部分が編成の違いを表している場合は、以下の操作をする。

名義と後続の部分を間隔を入れて分けて、更に名義の部分についてsort nameの規則を適用する。

後続の部分の先頭が「の」「と」といった接続助詞や「ウィズ(with)」「フィーチャリング(featuring)」「アンド(and)」といったアーティスト同士を結ぶフレーズ、「ザ(the)」といった冠詞、「彼の」「ヒズ(his)」「ゼア(their)」「ズ(’s)」のような先の名義に対する所有格から始まる場合はそれを省く

後続の部分にさらに別の名義が含まれる場合はこれを繰り返す。

規則を適用
規則を適用しない
先頭部分が完全な名義を含まない場合は、基本の規則に準じる
Des-ROWを使った例
T‐SQUAREを使った例
複雑な例
  • ザ・田中太郎スーパーバンド → たなか たろう スーパーバンド (ザ)
  • 田中太郎アンド・ザ・スーパーバンド → たなか たろう スーパーバンド
  • The Tanakars and The Satows with their Orchestra → タナカーズ サトーズ オーケストラ (ザ)

補足

このようにすることで、該当の名義がその人名の名義のすぐ後に並ぶことになり便利なため。

全体的な補足

sort nameに対する姓名のスペースについて

巷のアーティストの索引を提供しているサイトでは、大体が名前にスペースを用いないため、辞書順で並ぶようになっています。にもかかわらずここで電話帳順になるような提案をしたのは、「アプリケーション側で間隔を取り除くだけで電話帳順から辞書順に簡単に変換できるから」です。電話帳順も辞書順も「最終的な読みは一緒」になりますから、電話帳順のデータを用意しさえすれば、あとでポリシーの違いで辞書順を使う必要が出てきても、先の操作だけで苦労せず移行できるはずで、結果的に両対応したことになります。これが逆に辞書順から電話帳順に移行しようとなると、データ全体を見直さなければならず大変な苦労を伴うでしょう。