colbaseかなデータを見て
作品名かな表記のバリエーション
読み方のバリエーション
音読みなのか訓読みなのかの違い
石鏃 せきぞく いしやじり
濁音になるか清音になるかの違い
鬼瓦 おにかわら おにがわら
音訓、濁音清音が混ざるものもある
中広形銅矛 なかひろがたどうほこ なかびろがたどうほこ ちゅうびろがたどうほこ
中広形銅戈 なかひろがたどうか なかびろがたどうか ちゅうびろがたどうか
半濁音になるか清音になるかの違い
青磁象嵌雲鳳文鉢 せいじぞうがんうんほうもんはち せいじぞうがんうんぽうもんはち
濁音になるか半濁音になるかの違い
金銅輪宝 こんどうりんぼう こんどうりんぽう
促音化するしないの違い
石冠 せきかん せっかん
促音、清濁が混ざるものもある
洲浜菊花双鳥鏡 すはまきっかそうちょうきょう すはまきっがそうちょうきょう すはまきくかそうちょうきょう
促音、音訓が混ざるものもある
菊花蝶鳥鏡 きっかちょうちょうきょう きくかちょうちょうきょう きっかちょうとりきょう
間に”の”を入れて読むか否かの違い
頭椎大刀 かぶつちたち かぶつちのたち
飛鳥山花見 あすかやまはなみ あすかやまのはなみ
柿本人麿像 かきのもとひとまろぞう かきのもとのひとまろぞう
隅田川船遊び すみだがわふなあそ すみだがわのふなあそ
井戸端洗濯 いどばたせんたく いどばたのせんたく
二代目市川八百蔵の曽我五郎 にだいめいちかわやおぞう そがごろう にだいめいちかわやおぞう そがのごろう
間に”に”を入れて読むか否かの違い
萩薄双鳥鏡 はぎにすすきそうちょうきょう はぎすすきそうちょうきょう
送り仮名を含むものと含まないもの
捩文鏡 ねじもんきょう ねじりもんきょう
漢字文化圏以外からもたらされた作品について、オリジナルの言語から日本語に翻訳した作品名がつけられている例がある。このとき、作品名かなには、オリジナルの言語の発音に近い音の仮名が当てられている場合と、翻訳した日本語の読み仮名が当てられている場合とがある。
(作品名)チャクラサンヴァラ父母仏立像 (作品名かな1)チャクラサンヴァラヤブユムリュウゾウ (作品名かな2)チャクラサンヴァラフボブツリュウゾウ
ある音をどう仮名で表すかに複数通りの通念が存在するもの。
山茶碗 やまちゃわん やまぢゃわん やまじゃわん
その他、漢字の読み方の違い(音読みの読み仮名が複数あるものが主か?)
寒山拾得図 かんざんじっとくず かんざんじゅっとくず
古今雛 こきんびな ここんびな
享保雛 きょうほうびな きょうほびな
元豊通宝 げんゆうつうほう げんぽうつうほう げんほうつうほう
双龍環頭柄頭 そうりゅうかんとうつかがしら そうりょうかんとうつかがしら
天聖元宝 てんせいげんぽう てんしょうげんぽう
治平元宝 ちへいげんぽう じへいげんぽう
天日槍帰化時代考・蘇那曷叱知来朝考《博物叢書》 あまのひぼこきかじだいこうそなかしちらいちょうこう あめのひぼこきかじだいこうそなかしちらいちょうこう
富嶽図 ふがくず ふうがくず
立雛次郎左衛門頭 たちびなじろざえもんがしら たちびなじろうざえもんかしら
林和靖図 りんなせいず りんわせいず
袍 幟仁親王所用 ホウ タカヒトシンノウショヨウ ホウ タカヒトシンノウショリョウ
雑画帖 ざつがちょう ざつがじょう
複数の読み方を併記する例
和同開珎 わどうかいちん(ほう)
作品名と作品名かなで表記が異なるもの
作品名で小書き文字が使われているが、作品名かなでは大書き文字が使われているものがある。
(作品名)アットゥシ (作品名かな)アットウシ
作品名に記号を含むものについて、作品名かなに記号が含まれるものと記号が含まれないものがある。
イクパスイ(儀礼用の箆) いくぱすい(ぎれいようのへら) いくぱすい ぎれいようのへら
矢筒・矢 やづつ・や やづつ や
作品名より作品名かなが長い場合がある。
経筒 どうせいきょうづつ
作品名は分かち書きされていないが、作品名かなが分かち書きされている場合がある。
蓮花文軒丸瓦 れんげもん のきまるがわら
各館で生成する元データの作り方の都合か、ひらがな、または、カタカナと漢字が混じる作品名で漢字部分しか作品名かなが出ていないものがある。
マリア観音像 かんのんぞう
鮑取り あわびと
作品名かなで、算用数字を読みの仮名に変換しているものと、算用数字をそのまま用いているもの。
外縁付鈕2式銅鐸 がいえんつきちゅうにしきどうたく がいえんつきちゅう2しきどうたく
作品名かなで、漢数字を読みの仮名に変換しているものと、漢数字を算用数字に変換しているものがある。
山水図冊八題 さんすいずさつはちだい さんすいずさつ8だい
花卉図冊十二題 かきずさつじゅうにだい かきずさつ12だい
長音があったりなかったり
(作品名)ストゥ(制裁棒) (作品名かな1)すとぅ(せいさいぼう) (作品名かな2)すとぅー(せいさいぼう)
作品名かなに記号のみが入力されているものがある。
蛇蝎釉茶碗 *
雑感
同じ作品名に対して、作品名かなに読み方のバリエーションが複数あっても、それ自体は問題ない
音読み訓読み、濁点ありなし、促音化の有無など
統一したければ統一できるようにもしたらいいのだろうとも思うが。(イメージとしては、configファイルに何か設定を書けるというような。)
同一の組織の中では同一の表記ルールが取られていた方がいい、ということもないように思う
複数の組織から出ているデータをマージして扱うことも当然あると考えると、組織の中の統一はあまり重要でない。
むしろ、異なる仮名、異なる読み方であっても指している概念は同一のものである、ということがわかるようにしたい。
これは、データ自体をRDFで記述して、適切なメタデータを付与する、みたいな方向なんだろうな。
作品名と作品名かなで表記が異なるデータについては、データそれ自体に修正をかけられるとよい。大書き・小書きの違いも、作品名の表記に揃えられるとよい。
まず、書き言葉の読みを入れる。
書き言葉 話し言葉 colbase
音先行で作品名が付けられているものもある。
作品名かなという概念が合わない収蔵品もある。
変な空白は整形できるといい、できるといいけども。
ひらがななのかカタカナなのか、半角なのか全角なのか(半角全角については、括弧などの記号についても表記揺れがある)。
この辺は、データを扱うツールの中で、1クリックで表記統一ができる機能を実装するとか、そういう方向になる気がする。originalデータそれ自体の表記を統一しよう、というより。
RDFデータストアの活用というのは、表現方法としては一つの解決策だとは思う。
一方で、Webを舞台に形成される知識基盤社会に日本美術の情報を供給するということを考えると、なかなかそこに引っかかりづらいんだろうと思う部分もある。
link