2023/1 第2週 weekly AI news

2023/1/9 - 2023/1/15

#weekly_AI_news

✨今週のハイライト ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

LAIONとStable Hordeがコラボして、データセットを作成予定

⬇2023/1 第2週 weekly AI news#63bc2c60e2dacc00003046a6

MicrosoftがOpenAIに1.3兆の出資検討

⬇2023/1 第2週 weekly AI news#63bd791de2dacc000035e8ab

総務省がAI研究に10億円の予算

⬇2023/1 第2週 weekly AI news#63c1668fe2dacc0000f8bfef

音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで

⬇2023/1 第2週 weekly AI news#63bf7da4e2dacc0000bbbfa6

Depth2imgの応用

⬇️2023/1 第2週 weekly AI news#63bb9721e2dacc0000357f45

⬇️2023/1 第2週 weekly AI news#63c16865e2dacc0000f8bff2

✨ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2023/1/9

https://www.reddit.com/r/StableDiffusion/comments/104vvml/tutorial_making_fonts_with_stable_diffusion_is_as/https://www.reddit.com/r/StableDiffusion/comments/106u1qk/a_new_way_to_generate_images_inspired_by/Depth2imgの機能を使ったimage2imageのススメ

https://gyazo.com/17df91e900866f9aedbaf6372eacf096https://gyazo.com/ce5f95a436e04d48931d271fdad8772ehttps://gyazo.com/18322b76949d17e069f1051c1edf6f55

モデル : stable-diffusion-2-depth

img2imgと違って輪郭にかなり忠実∧色を指定する必要がないからとても楽

グリザイユみたいなのが流行るかもしれないnomadoor.icon

やっぱり実写つよいっすねwogikaze.icon基素.icon

https://gigazine.net/news/20230109-artist-banned-subreddit/「AIを用いて絵を描いた」としてアーティストがReddit最大のアートコミュニティをBANされる

アンチAIが守るべき作品を攻撃するとは皮肉だねnomadoor.icon

https://www.reddit.com/r/StableDiffusion/comments/1078dhp/rdschan_personified_anime_version_of_soviet/RDS-chan! Personified anime version of Soviet nuclear bomb

https://gyazo.com/34ae4233fb327fdf9638042a6201eff3https://gyazo.com/0ab5249c2360f73d570b360139398560

とんでもないものを擬人化していたので…nomadoor.icon

https://ja.wikipedia.org/wiki/RDS-1RDS-1

ソ連で行なわれたソ連では初の核実験である。

https://laion.ai/blog/laion-stable-horde/https://dbzer0.com/blog/a-collaboration-begins-between-stable-horde-and-laion/LAIONとStable Hordeがコラボ

LAIONデータセット画像を評価できるようになるhttps://tinybots.net/artbot/rate

https://gyazo.com/740d2371c76fd116304d90f3d9049069

その評価をもとにデータセット(Aesthetic model)を作るよ

Stable Hordeで生成した画像とプロンプトを利用してデータセットを作る(予定)

Stable HordeはWaifuやAnalog Diffusion etc.のあらゆるモデルが使える

ファインチューニングされたモデル達から生成された画像でデータセットを作るぞ！

これは世界初！

生成した画像に対しての評価もデータセットに含む

余談nomadoor.icon

Midjourneyは生成された画像に対してそのままアップスケールするか、似た画像を再生成するか選べる

おそらく、この評価を利用してモデルをファインチューニングしている

これってRLHFなのかな？

DreamStudioとかNovelAIがやるべきだった気がするnomadoor.icon

それをオープンコミュニティのStable HordeとLAIONがやる意義はとても大きい

私、推します

誰がどういうモチベーションで評価するんだろう基素.icon

Stable HordeではNovelAIでいうAnlas的なものがもらえますねnomadoor.icon

なくても生成させてくれるけど

量が膨大すぎて太刀打ちできない予感

reCAPTCHAみたいについでに評価できると量をこなせるかも

2023/1 第3週 weekly AI news#63c6c69be2dacc0000049f2bnomadoor.icon

評価された画像の枚数は1週間で13万枚に

意外と無償で労働してくれる人たちは多い

2023/1/10

https://www.reddit.com/r/StableDiffusion/comments/107k5yv/comparing_the_different_upscalers_for_realistic/アップスケーラーの比較

https://gyazo.com/d81a2c80f8a2be7a484bd3bee9d7cb69https://gyazo.com/134559b498ee5d6b1073e8610c1ce9e1

これ以外にも好きなアップスケーラーの議論があったりして役立ちそうnomadoor.icon

https://gigazine.net/news/20230110-chatgpt-paid/無料のチャットAI「ChatGPT」を有料で使わせる非公式アプリが大量発生中

https://gigazine.net/news/20230110-donotpay-supreme-court/GPT-3ベースのAI弁護士が最高裁判所で弁論する予定

https://ainow.ai/2023/01/10/271543/Qosmo、動画に”しっくりくる”音楽をAIが自動で選曲する新製品「Video2Music」を提供開始

これまた同名のサービスがでてきそうなネーミングnomadoor.icon

https://coinpost.jp/?p=422000Microsoft、「ChatGPT」開発のOpenAIに1.3兆円を出資か

NVIDIA Canvasに360度マップの作成機能が追加

https://www.youtube.com/watch?v=PcDIUwvSji8&ab_channel=NVIDIAStudio

NVIDIA Broadcast 1.4

瞳が勝手にモニターへ向く機能が追加

https://www.youtube.com/watch?v=nR-vP_7XFHE&ab_channel=NVIDIAStudio

https://github.com/peterwilli/sd-leap-boosterLEAP

Textual Inversionとセットでテストされてるけど、他のファインチューニングにも応用が効くのかな？nomadoor.icon

2023/1/11

https://www.genseamless.com/シームレスなテクスチャ生成サービス

https://wardrobe-ai.com/wardrobe-ai.com

https://gyazo.com/b6650268e4d95d1fee1153f8bf9001e8

自分の顔を学習させて、いろんな服を着させるサービス

今売ってる服に対して使えるようになれば、zozoとかで採用されそうnomadoor.icon

なんならもうやってそう

十中八九ARPPUあがる基素.icon

正確なサイジングと、着用イメージ両方必要

ZOZO、サイジングは色々やった

イメージはまだまだ

https://github.com/thekitchenscientist/sd_litesd_lite

シンプルなSD2.0(2.1)の動作環境を作る

https://mobile.twitter.com/aaronsiim/status/1586412346817187840?cxt=HHwWgMCo9fnniIQsAAAAジェネレーティブAIサービスのカオスマップ

https://gyazo.com/8432a256d6ddcdaf8a3494f1cd9e3f5e

結構知らないサービスたくさんあるなnomadoor.icon

Cool Japan Diffusion 2.1.1 Beta has been released!🎉

2023/1/12

https://www.marktechpost.com/2023/01/10/artificial-intelligence-ai-research-innovations-in-2022-from-google-nvidia-salesforce-meta-apple-amazon-and-ai2/Artificial Intelligence (AI) Research Innovations in 2022 from Google, NVIDIA, Salesforce, Meta, Apple, Amazon, and AI2

2022年の革新的なAI技術まとめ

https://www.reddit.com/r/StableDiffusion/comments/109f3so/low_effort_inpainting/Low effort inpainting

https://v.redd.it/x1xxbzmk3hba1/DASH_360.mp4

この人の作品好きnomadoor.icon

https://www.marktechpost.com/2023/01/09/researchers-at-stanford-have-developed-an-artificial-intelligence-ai-model-summon-that-can-generate-multi-object-scenes-from-a-sequence-of-human-interaction/スタンフォード大学の研究者らが、人間とのインタラクションのシーケンスからマルチオブジェクトのシーンを生成する人工知能（AI）モデル「SUMMON」を開発

https://gyazo.com/ccc2d3ce932eddba0184a76aa2ebf72e

人間の軌跡から、それっぽくオブジェクトを配置する

https://www.marktechpost.com/2023/01/09/this-artificial-intelligence-ai-paper-introduces-hyperreel-a-novel-6-dof-video-representation/新しい6DoF映像表現「HyperReel」を発表

https://hyperreel.github.io/HyperReel: High-Fidelity 6-DoF Video with Ray-Conditioned Sampling

単一動画から6DoF動画を生成？

https://hyperreel.github.io/figures/hyperreel.mp4

https://www.marktechpost.com/2023/01/10/this-artificial-intelligence-ai-research-from-norway-introduces-tsetlin-machine-based-autoencoder-for-representing-words-using-logical-expressions/ノルウェーの人工知能（AI）研究者が、論理式で単語を表現する機械学習型オートエンコーダ「Tsetlin」を発表

https://www.marktechpost.com/2023/01/11/meet-speechbox-an-artificial-intelligence-ai-tool-that-transforms-audio-transcripts-for-tasks-like-punctuation-restoration-with-the-whisper-language-model/Speechbox : Whisper言語モデルで句読点の復元など音声記録を変換する人工知能（AI）ツール

https://levtech.jp/media/article/column/detail_183/イスラエルと米国の研究者らが開発　3Dモデルを簡単編集できるAIシステム「GeoCode」【研究紹介】

https://gigazine.net/news/20230112-chatgpt-chan/音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで

https://gigazine.net/news/20230112-cnet-publishing-articles-by-ai/ニュースメディアのCNETが2022年11月から「CNET Money」という署名を付けて密かにAIで記事を作成していると報じられる

https://aismiley.co.jp/ai_news/coefont-rinna-oshietehiroyuki-nenmatsunenshi/ひろゆき氏が適当な回答をしてくれるAI音声「おしえてひろゆきメーカー」、年末年始で17万件以上のお悩みに回答

2023/1/13

https://www.reddit.com/r/StableDiffusion/comments/10abhq8/short_video_i_made_using_stable_diffusion_ebsynth/Short video I made using Stable Diffusion, EbSynth and Faceapp

https://v.redd.it/ep9e2h353qba1/DASH_360.mp4

https://pals.ttic.edu/p/score-jacobian-chainingScore Jacobian Chaining: Lifting Pretrained 2D Diffusion Models for 3D Generation

https://meta-portrait.github.io/MetaPortrait

https://meta-portrait.github.io/static/videos/Cross_reenactment_4.mp4

Thin-Plate Spline Motion Model for Image Animationと同じ？

https://gigazine.net/news/20230113-generative-ai-design-voice/まったく新しい合成音声をユーザーが独自設計できる生成モデル「Design Voice」

記事だけ読むと声のモデルが無限にあるA.I.VOICE

https://www.reddit.com/r/StableDiffusion/comments/10amhzo/depth_preserving_sd_upscale_vs_conventional_sd/depth2imgを使ったアップスケーリング

https://gyazo.com/cd71aa0695543845ddd8d2d72fe63a9c

一部分をトリミングしてdepth2imgしている(SDのアップスケール用スクリプトがあるらしい)

img2imgのアップスケーリングと比べ、余計なものがあまり入り込まない

総務省がAI研究に10億円の予算

2023/1/14

https://www.reddit.com/r/StableDiffusion/comments/10au6ei/what_is_coming/なんかくるかも？

https://gyazo.com/f9bdef2df045a73a4b77ad0ee1179e0a

https://www.reddit.com/r/StableDiffusion/comments/10b9jae/to_be_miku/To be Miku

https://gyazo.com/7752eaf83b3b9f60a7f586cc2ef0b690

あまりにも秀逸なタイトルnomadoor.icon

Stability Al、DeviantArt、Midjourneyに対して集団訴訟

https://www.reddit.com/r/StableDiffusion/comments/10bfw2m/i_wrote_some_python_can_combine_stable_diffusion/2つの画像のメタデータに含まれるプロンプトを抽出して、混ぜたものを新たなプロンプトとして生成する

https://gyazo.com/a359eeb5563488314267df53faf62edb

ものすごくシンプルなimage promptかなnomadoor.icon

こんな単純なのでうまくいくもんだなぁ

https://zenn.dev/spreadknowledge/articles/76a51d7d69d2bdStableDiffusionで生成した画像で画像認識AIを作ってみた

https://gyazo.com/dac9fd96273653bb355b165ea62a1474

野菜のデータセットを集めるのは大変

SDで良品/不良品の野菜を作って、それで画像認識AIを作ったらいいのでは？

あんまりうまくいかなかった

2023/1/15

https://www.reddit.com/r/StableDiffusion/comments/10c5l2t/psa_the_automatic1111_webui_changed_the_behavior/Stable Diffusion web UIのKarrasサンプラーの動作が変更されているらしい

2023年1月1日以降

Karrasを使った生成画像だと同じプロンプトを入れても再現できない

https://www.reddit.com/r/StableDiffusion/comments/10c8wpl/even_if_you_pretend_that_the_detractors_are_right/もし万が一画像生成AI=コラージュツールだと認められてしまっても、コラージュは立派な芸術である

https://www.reddit.com/r/StableDiffusion/comments/10ccrqh/sd_webui_is_now_agplv3/Stable Diffusion web UIは現在AGPLv3です

https://www.marktechpost.com/2023/01/14/check-out-this-new-diffusion-probabilistic-model-for-video-data-that-provides-a-unique-implicit-condition-paradigm-for-modeling-continuous-spatial-temporal-changing-of-videos/VIDM : 動画を生成するための拡散モデル

2つの拡散モデルからなる

コンテンツジェネレータが最初のフレームを生成

モーションジェネレータがそれをもとに次のフレームを生成

1つで頑張らずに役割を分けたモデルを組み合わせるというのが面白い

2023/1 第1週 weekly AI news ← ここ → 2023/1 第3週 weekly AI news