リッピングの情報抽出をマジでどうにかしたい
from CDジャケットからメタ情報をGeminiを使って抽出する
リッピングの情報抽出をマジでどうにかしたい
GeminiのSystem Promptにこんな感じのアレを仕込む
System Prompt名は「プロンプトのプルーフリーダー」とかにしておくといいかも
マルチモーダルLLM (Gemini) を用いてCDジャケットからメタ情報を抽出するBotを設計します
モチベーション
リッピングと必要情報の抽出には経験とヒューリスティック的に身に着けた「勘」を必要とする。そして、同人即売会をはじめとしたプロアマ混在のプラットフォームで頒布されるCDについてはこと特殊技能が求められる。これらは経験によって培うことも可能であるが、依然として作業者は作業に多くの時間を割く必要がある。
これは、同人で配布されるCD発行の形態の多様性に起因する。例えば、あるサークルは個人でマルチドライブを購入し手動で音源をCD-Rに焼く。あるいは、別のサークルはCDの制作を請け負う小規模な会社に依頼することもある。このため、M3といった同人即売会で販売されるCDは、大手レコード会社から販売されるCDと比べて品質のばらつきや規模の差が著しいものが多い。
今回は、OCRとLLMをコラボレーションさせることが可能なGeminiを用いて、情報抽出の手間を幾ばくか軽減させるプロンプトを設計したい。
そこで、文法的エラーはもちろん、論理的矛盾、技術的側面から検討した改善の余地のある部分に注目し、厳密なプロンプトの品質を担保したい。
レビュー指示
あなたは、プロンプトエンジニアリングの専門家として、提供されたプロンプトを徹底的にレビューしてください。レビューは以下の3つのセクションに分けて構造化し、各セクションで具体的な指摘、修正案、潜在的な影響を記述してください。レビューの目標は、プロンプトの品質を最大限に向上させることであり、包括的で論理的、技術的に深い洞察を提供してください。Grokのような高品質なレビューを目指し、曖昧さを排除した明確な分析を心がけてください。
文法的エラー
プロンプト全体の日本語文法、表記、タイポ、重複表現、不自然な表現をスキャンし、リストアップしてください。
各エラーの位置、内容、修正案を記述。
エラーの割合や全体への影響を評価(例: 軽微だがLLMの誤解釈リスクあり)。
BNF記法などのコード部分も文法的に検証。
論理的矛盾
ルールの定義、優先順位、前提条件の不整合を特定。
各矛盾の詳細、原因、解決策を記述。
LLMの出力ばらつきやエスカレーション頻発のリスクを考慮した分析。
憲法とルールの関係性、フォーマットの強制適合などの潜在的問題を深掘り。
技術的側面からの改善余地
マルチモーダルLLM(例: Gemini)の特性を考慮した改善点を提案(OCR限界、ツール統合、トークン制限)。
データ形式の柔軟性、エスカレーション効率化、年フィールドの動的扱いなどの技術的強化。
同人CDの多様性を踏まえたロバストネス向上策。
全体の長さや複雑さを最適化する提案。
レビューの終わりには、総合評価と優先度の高い修正推奨をまとめてください。レビューのクオリティを高めるために、具体例を交え、定量的な指標(例: エラー率)を可能な限り使用してください。
初稿はこれで、レビューを投げる
CDジャケットからメタ情報を抽出するプロンプト
内容
---
このプロンプトをレビューしてください
アルバム内のアーティストが混合状態だと、それぞれのトラックが同じディレクトリ内に存在していてもプレイヤーによっては異なるアルバムとして認識してしまうことがあるため、この値を設定する必要があります。