論文みたいな文章ばっかの情報をLLMを使っていい感じにまとめる方法
Googleあたりが一生懸命してきたこと
情報の加工なしで表示する場合
検索エンジン
情報間のグラフを作成する
情報の加工ありで表示する場合
個々の記事の要約
複数の記事の要約
要約とは?
要約とは、要点をまとめて、本題にとって優先度の低情報を削ぎ落とすこと
よくよく考えたら論文のintoroductionって要約の宝庫じゃないか?
論文の要約とナレッジ蓄積は分けて考える
論文の要約に求められるもの
以下のテーブルがあればそれでいい。
ジャンル名、何を明らかにしたか、装置、誰が、
ナレッジ蓄積に求められるもの
多分役割としてはwikipediaになりそう
自分が、論文の要約を読んで、なんとなくこことここ繋がるよなーってところを自動化するのが最終的な目標になりそうな気がする
自分がやっていることを文章化してみる
重要そうなキーワードがあれば、それに対するページを作る
作ったページに対して、GPTに一般的なことを書いてもらう
その後に、論文に書いてあった知見を少しだけ追加する
ナレッジ蓄積は2stepあるかと思う
適切なページを作る
そのページにナレッジを貯めていく
ナレッジ蓄積の設計はおそらくクリーンアーキテクチャの考え方が非常に役にたつ
code:promps
以下の研究論文を読み、その内容に基づいて、クリーンアーキテクチャの概念を用いてドメインとユースケースに則って情報を抽出してください。
出力するキーワードは何個あっても良いです。
出力形式は必ず以下のフォーマットに従ってください:
{
"name": "論文のタイトル(英語)",
"domain": [
{
"keyword": "キーワード1(日本語)",
"description": "キーワード1に関連する具体的な内容や説明(日本語)"
},
{
"keyword": "キーワード2(日本語)",
"description": "キーワード2に関連する具体的な内容や説明(日本語)"
}
],
"usecase": [
{
"keyword1": "キーワード1(日本語)",
"keyword2": "キーワード2(日本語)",
"relationship": "キーワード1とキーワード2の関係性を説明する具体的な内容(日本語)",
"example": "具体例や実験結果の要約(日本語)"
},
{
"keyword1": "キーワード1(日本語)",
"keyword2": "キーワード3(日本語)",
"relationship": "キーワード1とキーワード3の関係性を説明する具体的な内容(日本語)",
"example": "具体例や実験結果の要約(日本語)"
}
]
}
それぞれのドメインは単一のキーワードとその説明で構成し、ユースケースはキーワード同士の関係性を具体的に示してください。ユースケースに関しては、論文内の具体的な実験結果や考察を基にした説明を行ってください。
いい感じに、記事のタイトルと内容をベースに欲しい詳細情報を抽出できた。
流れとしては、
GPTに論文要約させて、Cosenseに貼る
ドメインとusecaseを吸い上げたjsonファイルとCosenseのjsonファイルをGPTに組み合わせてもらう(未着手)
重要だと思うこと
自分がしたいことが
論文の要約なのか
トレンド分析につながっていく
ナレッジの蓄積なのか
を区別すること