Magi
[2401.10224] The Manga Whisperer: Automatically Generating Transcriptions for Comics
https://github.com/ragavsachdeva/magi
漫画特化エンコーダ兼検出器
漫画内のレイアウト解析とキャラ識別を支える基盤モデル
o3.icon
Magiはモノクロ漫画画像で事前学習された「マンガ理解用」画像エンコーダ(manga understanding model / image encoder)で、
CLIP
よりも漫画キャラの外見保持に優れる。
これはすごい
基素.icon