20200813ナレッジグラフ構築キックオフMTG
アジェンダ
自己紹介
ナレッジグラフの説明/実現したいことの説明
Semantic MediaWikiの説明
これまで調べたことのまとめ
進め方検討
環境構築
php環境が必要
GCE上にWebサーバー構築
MediaWiki対応レンタルサーバーでも拡張機能をインストールできるのか???
ギルドナレッジグラフの設計
以下の要素をどう紐付けるか?
技術トピック
ギルドメンバー
ツール/FW/ライブラリ
構築手段
デモ動画だと手入力だが、うまく自動化・ロジック化したい
技術調査
https://gyazo.com/692dd9c382b0ba1da5ed542740cfa0c0
参加者
Murakamiさん
Miyajiさん
Yoshiokaさん
Ideさん
chieさん
miyaharaさん
あべこうさん
masso(議事)
次やること
プロジェクト名決め
semanticmediawiki環境構築
備考:参考リンクのうち以下のURLのリポジトリをローカルでdocker-compose up --buildで起動するところまで確認しました
議事メモ
ナレッジグラフとは?
グラフのノード間に意味的関係をつける
RDBに比べて、関係性をキーにする(?)情報の検索に向いている
今回は、これをギルド内で作りたい。メンバー間、メンバーと技術分野間、技術分野と技術分野間などの関係性をグラフ化したい
補足:村上さん
ナレッジグラフに入れ込みたい要素
ユーザー検索プロジェクトで作りたいもののようなメンバーと技術分野の関連性やコンテンツの関連性などをグラフ化できたら良いなと思う
最終的なイメージ
https://gyazo.com/5614b129846e892f5c1d5c93f38d6d0b
SemanticMediaWikiとは?
MediaWiki:WikipediaのベースとなるOSS
上記に意味的関係を含めたもの
イメージは参考資料にあるYoutube動画がわかりやすい
日本語のWikiをベースのソースにしたもの「日本語DBpedia」
SQLライクなアクセスも可能
php - MediaWiki - SemanticMediaWiki の環境構築Dockerイメージもある
Amazon Neptune
これ使えば一発?高価格
JanusGraph
ナレッジグラフをDBとしてもつためのOSSツール
Visualizeも考えると一旦Wikiでやったほうが良いかなと思う(Yoshioka)
リサーチした感じだとNeo4jが一番良さそう(村上)
Neptuneはあまり事例がない。Neo4jはUberかどっかがつかってた(村上)
neo4jについて
英語だけどDocはしっかりしてる
進め方
環境構築、ナレッジグラフの理論面、大きく2つのタスクに分かれそう
その後具体的に構築していく
(村上)「構築フロー」の図の234とは何をやっているのかな
機械学習で勝手に関係性を作る感じ
まずは関係性を作るのは手動で良くて、登録と検索ができればいい
既存の単語についてはJDPediaが使えそうだが、検索ができないのが使いづらい
まずは細かい関係はおいておいてPartOfみたいな関係から作るとか
可視化するためのエクスポート機能があってほしい。(形式はRDFとか)
ナレッジグラフの設計
ギルドのアウトプット(プロジェクトのWikiとか、学習メモとか)を構造化したり、タグ付けしたりする
Wikiと同じような形で粛々とやっていく
例えば、○○とはのページを作っていって、そこは気になる人や興味のある人に埋めていってもらう。
https://gyazo.com/92bc5883609df5128712275295cc28e3
MediaWiki環境を作っておいて、タグ付け方法を伝えるのが次回
環境をどこに作るか
Dockerがそのまま使えればそれが一番
GCPプロジェクトを1つ作る+管理者権限をYoshokaさんに(村上さん)
環境構築
拡張を入れようとするとMediaWikiとSemanticMediaWikiがバッティングする
プロジェクト名
アンケートをとる。名前募集します。
うまく行けばギルドのWikiをそちらに移行したい!
ナレッジグラフチャンネル(仮称)作ります:作成済み、本MTG参加者をチームに招待済み
参考情報
■ナレッジグラフ話題の参考URL