2023/1 第2週 weekly AI news
2023/1/9 - 2023/1/15
#weekly_AI_news
✨今週のハイライト ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
LAIONとStable Hordeがコラボして、データセットを作成予定
⬇2023/1 第2週 weekly AI news#63bc2c60e2dacc00003046a6
MicrosoftがOpenAIに1.3兆の出資検討
⬇2023/1 第2週 weekly AI news#63bd791de2dacc000035e8ab
総務省がAI研究に10億円の予算
⬇2023/1 第2週 weekly AI news#63c1668fe2dacc0000f8bfef
音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで
⬇2023/1 第2週 weekly AI news#63bf7da4e2dacc0000bbbfa6
Depth2imgの応用
⬇️2023/1 第2週 weekly AI news#63bb9721e2dacc0000357f45
⬇️2023/1 第2週 weekly AI news#63c16865e2dacc0000f8bff2
✨ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2023/1/9
https://www.reddit.com/r/StableDiffusion/comments/104vvml/tutorial_making_fonts_with_stable_diffusion_is_as/https://www.reddit.com/r/StableDiffusion/comments/106u1qk/a_new_way_to_generate_images_inspired_by/Depth2imgの機能を使ったimage2imageのススメ
https://gyazo.com/17df91e900866f9aedbaf6372eacf096https://gyazo.com/ce5f95a436e04d48931d271fdad8772ehttps://gyazo.com/18322b76949d17e069f1051c1edf6f55
モデル : stable-diffusion-2-depth
img2imgと違って輪郭にかなり忠実∧色を指定する必要がないからとても楽
グリザイユみたいなのが流行るかもしれないnomadoor.icon
やっぱり実写つよいっすねwogikaze.icon基素.icon
https://gigazine.net/news/20230109-artist-banned-subreddit/「AIを用いて絵を描いた」としてアーティストがReddit最大のアートコミュニティをBANされる
アンチAIが守るべき作品を攻撃するとは皮肉だねnomadoor.icon
https://www.reddit.com/r/StableDiffusion/comments/1078dhp/rdschan_personified_anime_version_of_soviet/RDS-chan! Personified anime version of Soviet nuclear bomb
https://gyazo.com/34ae4233fb327fdf9638042a6201eff3https://gyazo.com/0ab5249c2360f73d570b360139398560
とんでもないものを擬人化していたので…nomadoor.icon
https://ja.wikipedia.org/wiki/RDS-1RDS-1
ソ連で行なわれたソ連では初の核実験である。
https://laion.ai/blog/laion-stable-horde/https://dbzer0.com/blog/a-collaboration-begins-between-stable-horde-and-laion/LAIONとStable Hordeがコラボ
LAIONデータセット画像を評価できるようになるhttps://tinybots.net/artbot/rate
https://gyazo.com/740d2371c76fd116304d90f3d9049069
その評価をもとにデータセット(Aesthetic model)を作るよ
Stable Hordeで生成した画像とプロンプトを利用してデータセットを作る(予定)
Stable HordeはWaifuやAnalog Diffusion etc.のあらゆるモデルが使える
ファインチューニングされたモデル達から生成された画像でデータセットを作るぞ!
これは世界初!
生成した画像に対しての評価もデータセットに含む
余談nomadoor.icon
Midjourneyは生成された画像に対してそのままアップスケールするか、似た画像を再生成するか選べる
おそらく、この評価を利用してモデルをファインチューニングしている
これってRLHFなのかな?
DreamStudioとかNovelAIがやるべきだった気がするnomadoor.icon
それをオープンコミュニティのStable HordeとLAIONがやる意義はとても大きい
私、推します
誰がどういうモチベーションで評価するんだろう基素.icon
Stable HordeではNovelAIでいうAnlas的なものがもらえますねnomadoor.icon
なくても生成させてくれるけど
量が膨大すぎて太刀打ちできない予感
reCAPTCHAみたいについでに評価できると量をこなせるかも
2023/1 第3週 weekly AI news#63c6c69be2dacc0000049f2bnomadoor.icon
評価された画像の枚数は1週間で13万枚に
意外と無償で労働してくれる人たちは多い
2023/1/10
https://www.reddit.com/r/StableDiffusion/comments/107k5yv/comparing_the_different_upscalers_for_realistic/アップスケーラーの比較
https://gyazo.com/d81a2c80f8a2be7a484bd3bee9d7cb69https://gyazo.com/134559b498ee5d6b1073e8610c1ce9e1
これ以外にも好きなアップスケーラーの議論があったりして役立ちそうnomadoor.icon
https://gigazine.net/news/20230110-chatgpt-paid/無料のチャットAI「ChatGPT」を有料で使わせる非公式アプリが大量発生中
https://gigazine.net/news/20230110-donotpay-supreme-court/GPT-3ベースのAI弁護士が最高裁判所で弁論する予定
https://ainow.ai/2023/01/10/271543/Qosmo、動画に”しっくりくる”音楽をAIが自動で選曲する新製品「Video2Music」を提供開始
これまた同名のサービスがでてきそうなネーミングnomadoor.icon
https://coinpost.jp/?p=422000Microsoft、「ChatGPT」開発のOpenAIに1.3兆円を出資か
NVIDIA Canvasに360度マップの作成機能が追加
https://www.youtube.com/watch?v=PcDIUwvSji8&ab_channel=NVIDIAStudio
NVIDIA Broadcast 1.4
瞳が勝手にモニターへ向く機能が追加
https://www.youtube.com/watch?v=nR-vP_7XFHE&ab_channel=NVIDIAStudio
https://github.com/peterwilli/sd-leap-boosterLEAP
Textual Inversionとセットでテストされてるけど、他のファインチューニングにも応用が効くのかな?nomadoor.icon
2023/1/11
https://www.genseamless.com/シームレスなテクスチャ生成サービス
https://wardrobe-ai.com/wardrobe-ai.com
https://gyazo.com/b6650268e4d95d1fee1153f8bf9001e8
自分の顔を学習させて、いろんな服を着させるサービス
今売ってる服に対して使えるようになれば、zozoとかで採用されそうnomadoor.icon
なんならもうやってそう
十中八九ARPPUあがる基素.icon
正確なサイジングと、着用イメージ両方必要
ZOZO、サイジングは色々やった
イメージはまだまだ
https://github.com/thekitchenscientist/sd_litesd_lite
シンプルなSD2.0(2.1)の動作環境を作る
https://mobile.twitter.com/aaronsiim/status/1586412346817187840?cxt=HHwWgMCo9fnniIQsAAAAジェネレーティブAIサービスのカオスマップ
https://gyazo.com/8432a256d6ddcdaf8a3494f1cd9e3f5e
結構知らないサービスたくさんあるなnomadoor.icon
Cool Japan Diffusion 2.1.1 Beta has been released!🎉
2023/1/12
https://www.marktechpost.com/2023/01/10/artificial-intelligence-ai-research-innovations-in-2022-from-google-nvidia-salesforce-meta-apple-amazon-and-ai2/Artificial Intelligence (AI) Research Innovations in 2022 from Google, NVIDIA, Salesforce, Meta, Apple, Amazon, and AI2
2022年の革新的なAI技術まとめ
https://www.reddit.com/r/StableDiffusion/comments/109f3so/low_effort_inpainting/Low effort inpainting
https://v.redd.it/x1xxbzmk3hba1/DASH_360.mp4
この人の作品好きnomadoor.icon
https://www.marktechpost.com/2023/01/09/researchers-at-stanford-have-developed-an-artificial-intelligence-ai-model-summon-that-can-generate-multi-object-scenes-from-a-sequence-of-human-interaction/スタンフォード大学の研究者らが、人間とのインタラクションのシーケンスからマルチオブジェクトのシーンを生成する人工知能(AI)モデル「SUMMON」を開発
https://gyazo.com/ccc2d3ce932eddba0184a76aa2ebf72e
人間の軌跡から、それっぽくオブジェクトを配置する
https://www.marktechpost.com/2023/01/09/this-artificial-intelligence-ai-paper-introduces-hyperreel-a-novel-6-dof-video-representation/新しい6DoF映像表現「HyperReel」を発表
https://hyperreel.github.io/HyperReel: High-Fidelity 6-DoF Video with Ray-Conditioned Sampling
単一動画から6DoF動画を生成?
https://hyperreel.github.io/figures/hyperreel.mp4
https://www.marktechpost.com/2023/01/10/this-artificial-intelligence-ai-research-from-norway-introduces-tsetlin-machine-based-autoencoder-for-representing-words-using-logical-expressions/ノルウェーの人工知能(AI)研究者が、論理式で単語を表現する機械学習型オートエンコーダ「Tsetlin」を発表
https://www.marktechpost.com/2023/01/11/meet-speechbox-an-artificial-intelligence-ai-tool-that-transforms-audio-transcripts-for-tasks-like-punctuation-restoration-with-the-whisper-language-model/Speechbox : Whisper言語モデルで句読点の復元など音声記録を変換する人工知能(AI)ツール
https://levtech.jp/media/article/column/detail_183/イスラエルと米国の研究者らが開発 3Dモデルを簡単編集できるAIシステム「GeoCode」【研究紹介】
https://gigazine.net/news/20230112-chatgpt-chan/音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで
https://gigazine.net/news/20230112-cnet-publishing-articles-by-ai/ニュースメディアのCNETが2022年11月から「CNET Money」という署名を付けて密かにAIで記事を作成していると報じられる
https://aismiley.co.jp/ai_news/coefont-rinna-oshietehiroyuki-nenmatsunenshi/ひろゆき氏が適当な回答をしてくれるAI音声「おしえてひろゆきメーカー」、年末年始で17万件以上のお悩みに回答
2023/1/13
https://www.reddit.com/r/StableDiffusion/comments/10abhq8/short_video_i_made_using_stable_diffusion_ebsynth/Short video I made using Stable Diffusion, EbSynth and Faceapp
https://v.redd.it/ep9e2h353qba1/DASH_360.mp4
https://pals.ttic.edu/p/score-jacobian-chainingScore Jacobian Chaining: Lifting Pretrained 2D Diffusion Models for 3D Generation
https://meta-portrait.github.io/MetaPortrait
https://meta-portrait.github.io/static/videos/Cross_reenactment_4.mp4
Thin-Plate Spline Motion Model for Image Animationと同じ?
https://gigazine.net/news/20230113-generative-ai-design-voice/まったく新しい合成音声をユーザーが独自設計できる生成モデル「Design Voice」
記事だけ読むと声のモデルが無限にあるA.I.VOICE
https://www.reddit.com/r/StableDiffusion/comments/10amhzo/depth_preserving_sd_upscale_vs_conventional_sd/depth2imgを使ったアップスケーリング
https://gyazo.com/cd71aa0695543845ddd8d2d72fe63a9c
一部分をトリミングしてdepth2imgしている(SDのアップスケール用スクリプトがあるらしい)
img2imgのアップスケーリングと比べ、余計なものがあまり入り込まない
総務省がAI研究に10億円の予算
2023/1/14
https://www.reddit.com/r/StableDiffusion/comments/10au6ei/what_is_coming/なんかくるかも?
https://gyazo.com/f9bdef2df045a73a4b77ad0ee1179e0a
https://www.reddit.com/r/StableDiffusion/comments/10b9jae/to_be_miku/To be Miku
https://gyazo.com/7752eaf83b3b9f60a7f586cc2ef0b690
あまりにも秀逸なタイトルnomadoor.icon
Stability Al、DeviantArt、Midjourneyに対して集団訴訟
https://www.reddit.com/r/StableDiffusion/comments/10bfw2m/i_wrote_some_python_can_combine_stable_diffusion/2つの画像のメタデータに含まれるプロンプトを抽出して、混ぜたものを新たなプロンプトとして生成する
https://gyazo.com/a359eeb5563488314267df53faf62edb
ものすごくシンプルなimage promptかなnomadoor.icon
こんな単純なのでうまくいくもんだなぁ
https://zenn.dev/spreadknowledge/articles/76a51d7d69d2bdStableDiffusionで生成した画像で画像認識AIを作ってみた
https://gyazo.com/dac9fd96273653bb355b165ea62a1474
野菜のデータセットを集めるのは大変
SDで良品/不良品の野菜を作って、それで画像認識AIを作ったらいいのでは?
あんまりうまくいかなかった
2023/1/15
https://www.reddit.com/r/StableDiffusion/comments/10c5l2t/psa_the_automatic1111_webui_changed_the_behavior/Stable Diffusion web UIのKarrasサンプラーの動作が変更されているらしい
2023年1月1日以降
Karrasを使った生成画像だと同じプロンプトを入れても再現できない
https://www.reddit.com/r/StableDiffusion/comments/10c8wpl/even_if_you_pretend_that_the_detractors_are_right/もし万が一画像生成AI=コラージュツールだと認められてしまっても、コラージュは立派な芸術である
https://www.reddit.com/r/StableDiffusion/comments/10ccrqh/sd_webui_is_now_agplv3/Stable Diffusion web UIは現在AGPLv3です
https://www.marktechpost.com/2023/01/14/check-out-this-new-diffusion-probabilistic-model-for-video-data-that-provides-a-unique-implicit-condition-paradigm-for-modeling-continuous-spatial-temporal-changing-of-videos/VIDM : 動画を生成するための拡散モデル
2つの拡散モデルからなる
コンテンツジェネレータが最初のフレームを生成
モーションジェネレータがそれをもとに次のフレームを生成
1つで頑張らずに役割を分けたモデルを組み合わせるというのが面白い
2023/1 第1週 weekly AI news ← ここ → 2023/1 第3週 weekly AI news