2023年がAI元年と言われることについての考察などなど

https://scrapbox.io/files/656619758aab63001bc8a273.png

作成日：2023/11/28 20:50

作成者：tdu_na.icon

/icons/x.icon

これは「Rad Advent Calendar 2023」の1日目の記事です。

https://adventar.org/calendars/9021

文章生成AI

画像生成AI

音声生成AI

動画生成AI

AIとの関わりかたについて

まとめ・感想

/icons/---.icon

https://scrapbox.io/files/65661995fc821d001b6f4fe2.png

上記の画像はさっそく、ChatGPT での GPT-4 限定の DALL-E3 で画像生成しました。

こんにちは！最近親知らずを抜いた青木直人と申します。自分は学部4年ですが院進するので、この1年で就活を全くせずに生きてきました👀

来年度の就活が心配でしょうがないです🥺

そんなことはさておき、X（旧Twitter）で AI がかなり話題になりました。いわずもがな大規模言語モデルの GPT-3 を一般向けに公開した ChatGPT やら、去年の11月とかにも流行った Stable Diffusion が話題ですね。前半が文章生成AI、後半が画像生成AIです。文章生成AIは特に文章添削、要約、論文サーベイ、コード生成、QA が正確にできると話題になりました。反対に、ハルシネーション（幻想）が含んでいることがあります。世間で言われるもっともらしい嘘ってやつですね。とりあえず、文章生成AIはこんな感じのことが容易くできるようになりました。（もちろん、完璧にできることはありません。）

画像生成AIでは、きれいな2次元美少女イラストや背景画像を容易く行えるようになりました。オリジナルのStable Diffusion モデルは、すべてのWeb画像を学習しています。（と言われています。）なので画像が荒かったり、画像にいる人物の手足が5本や6本になっているなどヒューマンエラーでは発生しないようなノイズ（間違い）がありました。しかし、追加学習やファインチューニングをすることによって、これらの問題はかなり改善されました。特に、最近リリースされた日本画像に特化したDiffusionモデルが話題になりましたね。

https://asset.watch.impress.co.jp/img/ipw/docs/1547/820/jdxl003_s.jpg

Stability AI、入力も出力も“日本スタイル”の画像生成AI「JSDXL」 - Impress Watch

Stablity AI は、Stable Diffusion を出した会社ですので、日本のモデルを出すことは日本人として嬉しいですね😊

追加学習での手法では、LoRA (Low-Rank Adaption)という手法が有名です。その中でもCounterfeit というモデルが有名です。

簡単にイラストレーターが描いたような美少女が生成できるので、ぜひ試してみてください。

LoRA に関しての使い方

https://arxiv.org/abs/2106.09685

https://aituts.com/stable-diffusion-lora/

Counterfeit -v3.0 のHuggingface

https://huggingface.co/gsdf/Counterfeit-V3.0

https://huggingface.co/gsdf/Counterfeit-V3.0/resolve/main/images/01.png

可愛いですね👀