Magi
[2401.10224] The Manga Whisperer: Automatically Generating Transcriptions for Comics
https://github.com/ragavsachdeva/magi
漫画特化エンコーダ兼検出器
漫画内のレイアウト解析とキャラ識別を支える基盤モデル
o3.iconMagiはモノクロ漫画画像で事前学習された「マンガ理解用」画像エンコーダ(manga understanding model / image encoder)で、CLIPよりも漫画キャラの外見保持に優れる。
これはすごい基素.icon