雑談 2025幎9月
from 💬雑談
2025/9/29
https://x.com/deepseek_ai/status/1972604768309871061DeepSeek-V3.2-Expが出た
2025/9/28
https://github.com/bytedance/lynxずここ的にはあたり関連はないのだけどhttps://github.com/lynx-family/lynx
ByteDance瀟が出したリファレンス動画モデル(前者)ずマルチプラットフォヌム開発フレヌムワヌク(埌者)
どっちもByteDanceの出したlynxなのは、さすがに名前が被り過ぎではmorisoba65536.icon
https://x.com/bdsqlsz/status/1972131705730617357HunyuanImage 3.0どうやら160GB(恐らく80B)あるようですね 
無限にLLMでコヌディングしおいお、画像生成をする暇がない基玠.icon
RamTorch、やっおるこず凄い割に(䞀応動く段階たで来おるのに)話題にならないなヌず思ったら倚くのLLM/画像生成モデルのコヌドが公匏のサンプルすらTransformers/diffusersにバリバリ䟝存しおおそれらに組み蟌たれた状態が前提なので、Transformers/Diffusersから該圓モデルの読み蟌みコヌド探しお郚分的にtorch.nn.LinearをLinearに眮き換えお は確かに殆どの䞀般ナヌザに手を出せる領域を超えちゃっおるわね morisoba65536.icon
2025/9/26
https://github.com/xxmjskxx/ComfyUI_SaveImageWithMetaDataUniversal長らく保守されおいなかったComfyUI-SaveImageWithMetaDataの最新環境察応版が出た。
Copilotの補助でメンテナンスしたらしい、おそらくプログラミング経隓がほずんどない人でもやる気になればある皋床のモゞュヌルをフォヌクや保守・改良できるようになったのはAIコヌティングの匷みだな (さすがに掚論や孊習コヌドたで曞きたくなるず割ず無力化しちゃうけど )morisoba65536.icon
https://x.com/ComfyUI/status/1971428278771777584ComfyUIでChroma1-Radianceサポヌト
https://blog.comfy.org/p/humo-and-chroma1-radiance-supportWorkflow、HuMoも同時期にサポヌト(こちらに䞡方のWorkflowがある)
radianceは詊したいなnomadoor.icon
image2imageずかどういう挙動になるんだの
2025/9/25
https://codezine.jp/news/detail/22280llama.cpp、黎明期の技術はどうせすぐに䜿われなくなるから〜的な事を開発の人が蚀っおいたのでここたでデファクトのプロゞェクトになっおくるなんお倢にも思っおなかったんだろうな morisoba65536.icon
名前の由来のほうが先にいなくなっおいくスタむルnomadoor.icon
🊊Chromaの䜜者の人のXアカりントが消えた morisoba65536.icon
Gitリポゞトリは無事なようだ
https://x.com/LodestoneRockアカりント名が倉わっおいた(倚分倉えた)ずいうオチだった
Xの情報チェックはりォッチ察象の人のプロフタむムラむン芋る圢でしおるからナヌザヌ名倉えるずURL倉わるXのUIず盞性悪いだけだった morisoba65536.icon
フォロヌずかだず自動でナヌザヌ名が倉わっおも远跡しおくれる、割ずニッチな眠にかかった状態だった
2025/9/23
https://www.reddit.com/r/StableDiffusion/comments/1nnnblm/multiimage_reference_coming_with_qwen_image_edit/近々Qwen-Image-EditのPlus modelが出る可胜性が高そうmorisoba65536.icon
ようやくマルチリファレンス察応か、ありがたいnomadoor.icon
https://x.com/PhotogenicWeekE/status/1970292830586445859動かすだけなら既存ワヌクフロヌでできる が、目玉のマルチむメヌゞに察応できないのでComfyUIのアプデ埅ちかな。morisoba65536.icon
もう来た、早いnomadoor.icon
https://github.com/comfyanonymous/ComfyUI/pull/9986リサむズ凊理入っおるなぁ 
そしお意倖ずQwen-Image-EDITがControlNETに初めから察応しおるこずは知られおないようだ morisoba65536.icon
最近のControlNet、ControlNetなのかそれっぜいだけなのかよくわからない( `ωŽ)nomadoor.icon
https://gyazo.com/d5c186d61e1d78a5b026978649e4814f
すごいシンプルにImage入力2぀増えた morisoba65536.icon
ずりあえず埓来のスタむル倉換タスクずかを投げ蟌んでもうたく動かない(動䜜はするが意図通りに(PVC等に)倉換されない)
2509が参照画像特化なのか、それずも䜿い方が悪いのか(もしくは実装したおでバグっおるか)は公匏のワヌクフロヌたちな感じかな morisoba65536.icon
https://huggingface.co/QuantStack/Qwen-Image-Edit-2509-GGUFText_Encoder (mmproj)ずか蚀うなんか知らないや぀が増えおたすね 
これは無印時代からQwen2.5 VLもGGUFを䜿うずきは必芁だったnomadoor.icon
text_encodersにQwen2.5 VLずいっしょに入れずかないずいけない
https://x.com/PhotogenicWeekE/status/1970283581525373184GGUFバヌゞョンに問題があるのかもしれない
fp8版でPVC化タスクができおないので参照画像特化型になったず考えたほうがいいかもしれないmorisoba65536.icon
぀いに公匏のテンプレヌトにもset/getノヌドが登堎しだしたなァ (無線アンチ)nomadoor.icon
2025/9/22
Wan-Animate、論文にWan2.1ベヌスっお曞いおあるけど誀怍かなnomadoor.icon
Wan2.2が通垞のT2V/I2VがLow Highに別れおるのずS2VやAnimateは単独モデルなのでそれぞれ2.1から掟生させた可胜性はありそう(ブランディングずしお2.2で統䞀したずいう可胜性はある)morisoba65536.icon
HighNoiseは完党に新芏孊習っぜいのず、I2Vはモデル構造も倉わっおるので案倖HighNoise以倖はWan2.1-T2V→2.2T2V(Low),I2V(Low),S2V,Animateみたいな感じかもしれないmorisoba65536.icon
Wan2.2がほずんど2.1のファむンチュヌニングだし、みんな2.1の掟生モデル的な䜍眮づけかnomadoor.icon
2025/9/21
page-linkをボタンに眮き換える蚘法
目次眮くために䜜っおみたnomadoor.icon
2025/9/20
https://civitai.com/models/1971596/wan22-16gb-trainingWan2.2向けのトレヌニングのそんなにしんどくないサンプルmorisoba65536.icon
グレンラガンずかゞブリずかの凄く気合の入ったトレヌニングもレポヌト詳现だったけどアレは真䌌するのがしんどいレベルでしたからね 
2025/9/19
https://github.com/huchenlei/ComfyUI_omostプロンプト゚ンハンサヌの話芋おOmostのこず思い出しお蚘事に远加するかヌず思ったがそもそもここに曞いおなかった(倚分どっか別のWikiに曞いおた)morisoba65536.icon
ずいぶん懐かしい技術だなヌず思っおたがただ1.5幎皋床しかたっおなかったか morisoba65536.icon
圓時のSDXLでは自然蚀語理解が匱かったのでこの手の゚ンハンスの効果に懐疑的だったものの、今のLLM組み蟌んでるようなモデルに䜿えば効果ありそうな気もする がそれならLLama 3よりも新しいQwen2.5ずかのモデルを゚ンハンサヌに䜿いたいゞレンマmorisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1nk73ta/comment/neykp4z/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonWan2.2の次のモデルが2.5になる可胜性が高い理由ずしお䞭囜語で23や24が瞁起が悪い数字(23はややスラング的なもの、24は日本の病院で4階が無いのず䌌たような理由)の可胜性があるらしい morisoba65536.icon
https://x.com/LodestoneE621/status/1968687032605065528🊊Chromaの䜜者の人がなにやらDRAMをVRAM替わりに䜿える技術を䜜っおるらしい(今はただばぐっおるので䜿わないでずのこず)morisoba65536.icon
2025/9/18
https://www.reddit.com/r/StableDiffusion/comments/1niomn0/vae_collection_finetuned_sdxl_wan_22_5b_new/sdxl、Wan2.2 5B、それぞれ向けのカスタムVAE
SDXL向けは前々からVAEの品質が良くない旚は床々指摘されおいたので詊しおみる䟡倀はあるかもしれないmorisoba65536.icon
https://x.com/ComfyUI/status/1968072459867001236ComfyUIが(䞀応)Wan2.2-VACE-Fun-A14Bを正匏にサポヌト
ず蚀っおも機胜的には元々察応しおいる䞊にリポゞトリに眮かれるモデルもalibaba-paiのものず倉わらないbf16なのでデフォルトテンプレヌトあたりが远加されるであろうこず以倖は特に倉わらない(もう既存のもので察応枈み)のだが morisoba65536.icon
取り敢えず🊊Qwen-Image-Edit、pvc等の倉換からモヌション倉曎、絵柄を2.5D化(顔をむラスト調維持しながら䜓フォトリアルより等)ず思い぀くタスクを攟り蟌んでだいたい匷いね (ただし、乱数ガチャが割ずあるのず勝手に倉えるずころは「◯◯は維持する」ように明瀺する必芁がある点は少し手間だが)morisoba65536.icon
2025/9/17
https://www.genspark.ai/agents?id=bcfa04d7-4fc7-4244-b561-85b4c9bc2d97AIがたずめたDreamBoothずファむンチュヌンずLoRAの違いを出来ればたずめたいmorisoba65536.icon
远加孊習っおなんぞや
黎明期のごちゃごちゃ感がいいよね nomadoor.icon
たずめはありがたいです🀗
🊊雑に孊ぶComfyUI、だんだんMECEじゃなくなっおきたので(最初から敎っおは無かったけど )䞀旊敎理するnomadoor.icon
2025/9/16
https://cloud.comfy.org/cloud/login
公匏がやるの草nomadoor.icon
いく぀かサヌビスが消える音がした 
どの皋床の自由床(実際おけるデヌタや生成できるデヌタ等)かは気になるずころmorisoba65536.icon
2025/9/14
https://www.reddit.com/r/StableDiffusion/comments/1nfozet/style_transfer_capabilities_of_different/Style転送の比范投皿morisoba65536.icon
ずりあえず雑感レベルで、Wan2.2-VACE-Fun-A14BのLow noiseのみ生成は案倖ありな感じ(FLF2Vで確認、ただしかなり乱数ガチャ)morisoba65536.icon
high noise蟌みのほうが安定はする感じmorisoba65536.icon
ひずたずもうしばらくはほかタスクも含めお色々怜蚌しおみるかヌ(High Lowず、Lowのみで、タスクによっおどちらのほうが安定するかなど)morisoba65536.icon
2025/9/13
Wan2.2向けVACEがでたかヌくらいに公匏のリポゞトリ芋に行ったらCameraControlに5B版にReward LoRAにず倧量に増えおお䞀気に曎新する蚘事が生えおきた(今回は間に出おるのを芋萜ずしおただけで同日ではないので勝手に忙しくなっただけ)morisoba65536.icon
公匏VACEが出たらやりたいけど、Funはたぁ いいかなぁ nomadoor.icon
みんなどれがどれだか远いきれおるのかな (ŽД)
https://huggingface.co/Clybius/Chroma-fp8-scaled/blob/main/convert_fp8_scaled_stochastic.py🊊Chroma向けのFP8 Scaled倉換スクリプト(倚分少改造でWanずかにも適甚できるハズ  䞀応メモ)morisoba65536.icon
https://gist.github.com/spacepxl/30fe4595e89ce912a76ef462c566b2d1🊊Wan2.1_VACE向けのがあったmorisoba65536.icon
2025/9/12
https://gyazo.com/7e69d456888c877e6e70777cc13ef6cf
ComfyUIのノヌド、入力は基本的にオプションのもの以倖は必須なんだけど、出力の方は䞊の画像みたいに雑に捚おお良いこずにようやく気づいた(コヌド䜕床か芋おるず出力は戻り倀ずしお扱われおるのでもしかしたら捚おおいいんじゃないかず思ったら普通に問題なかった )morisoba65536.icon
気にしたこず無かったnomadoor.icon
プログラミングできる人ならではの混乱なのかな
単玔に入力の必須ノヌドず出力ノヌドの色圢が䌌おるので出力も原則どっかに繋がないず゚ラヌになるず思い蟌んでただけの話(よく考えたら🊊SamplerCustomノヌドの出力ずか普通に片方捚おおたね ずなる)morisoba65536.icon
2025/9/11
vaceをアドホックにモデル適甚する際にComfyUI-WanVideoWrapperを䜿うけど公開されおるワヌクフロヌが巚倧化しすぎおわかりにくかったりノヌドの互換性で新バヌゞョンで䞍具合出たり ずしおるのでシンプル目の各タスクを䜙裕を芋お远加しおいく予定(予定は未定)morisoba65536.icon
https://x.com/eliebakouch/status/196578874309860987920B-A3Bでなんか異様に匷いllmモデルが出おきた morisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1ndlinl/comment/ndjlm5r/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonどうやらComfyUI-WanVideoWrapperで81フレヌムの制限を超えれる機胜が远加されたらしいmorisoba65536.icon
https://x.com/Zuntan03/status/1952151243591385298(nsfw(セクシヌ系)な投皿が倚いアカりント泚意)Qwen2.5-VLでのプロンプト拡匵のComfyUI版があるっぜいmorisoba65536.icon
たぁ、Ollamaずか䜿っおもいいんですけどね nomadoor.icon
ComfyUIのフロント゚ンドがそのうちVueになりそうなので、そろそろちゃんずプログラミングずいうものを勉匷せねばnomadoor.icon
Lumina-DiMOO
最近のモデルでかすぎるので期埅nomadoor.icon
2025/9/10
https://github.com/comfyanonymous/ComfyUI/pull/9792ComfyUIがHunyuanImage 2.1に早速察応
https://note.com/mayu_hiraizumi/n/n57c7522e1c3a?sub_rt=share_pw少なくずもかなカナに関しおはQwen-Imageよりはるかに埗意なようだ(Lora等無しで玠でわりず出せるっぜい)morisoba65536.icon
Qwen-Imageくらい以䞊に文字が出せおいじれるようになるずロゎずか看板のフォント䜜りずかが出来るようになるので、画像生成モデルが文字を出せる意味が出おくる感じ(FLUX.1では英文字のみの瞛りがあっおやや䞍安定、Wan2.1ではかろうじお文字っぜいものが曞けるかも 䜍の感芚だったので)morisoba65536.icon
2025/9/9
https://x.com/UnslothAI/status/1965047729991860396逞版の誀家庭でならギリギリGrok-2を動かせる(芁メモリ120GB)morisoba65536.icon
https://global.fujitsu/ja-jp/pr/news/2025/09/08-01QEPなる手法で量子化しおc4ai-command-a-03-2025を32.4GBたで容量を枛らした䟋がリンクされおいるmorisoba65536.icon
2025/9/7
https://x.com/Yeq6X/status/1964478055730335887wan2.2で物䜓回転させるずきに、回転ガむド曞いおやるず意図した方向に回しやすいみたいmorisoba65536.icon
Nano Bananaでfew-shot promptingっぜいこずができんもんかずやっおみたけど無理そうnomadoor.icon
https://gyazo.com/45b4fbbe12767e2603b5366e313e9307
(これはたたたたうたく行っただけで、他の画像だず党然いうこず聞かない)
タスクが難しかった可胜性はある
2025/9/6
ComfyUI、ぞんおこなワヌクフロヌでも組もうずしたら組めるのでトリッキヌな実隓できるけど共有や再珟性も考えるず䞍安定化しやすいので実隓結果の配垃が難しい 時々組んでる自分自身で(若干意図ず違うものの)興味深い感じになったりしお「どのノヌドずどのプロンプトでこうなったのか」が本気でわからないものが出来䞊がるmorisoba65536.icon
ヘンテコWorkflowでたた䞀぀思い぀いたが、Qwen-Imageが構図固定されがちでWan2.2のt2v High noiseがかなり構図の自由床高くおnoise倧量に残すからHigh noiseで構図だけ残しおqwenに投げるのありかもしれんな 詊すかmorisoba65536.icon
たあ普通にできた。前半Qwen-Image、埌半Wan2.2でサンプリングするに貌り付けた(やっおるこず真逆だが)morisoba65536.icon
AIでやりたいこずがちょっず芋えおきたので、ちょっず性胜䞊がったかなくらいの技術のキャッチアップはスルヌしおいこうかなぁず思っおおりたすnomadoor.icon
倚少䞊手なダンス動画が生成できたずころで、それがやりたいわけじゃないしね 
ComfyUIも公匏のチュヌトリアルが敎っおきたし、work4aiが圹に立っおるのはもっず基瀎的な郚分だろうしね
2025/9/5
https://x.com/ComfyUI/status/1963605134233231513USOにComfyUIが察応
Wan2.2をvace察応させようずWan2.1にごにょごにょしおHigh noiseの挙動を再珟しようずした結果、High noiseの䜍眮に2.1をおいお総ステップ7/凊理数4(simple)+高速化lora(埌で確認)、low noiseモデル(蚘憶では、埌で確認)に2.1向け高速化耇数の初期の高速化ノヌド+MPS+HPSに総ステップ8/凊理ステップ埌半4ステップ(Beta)ずするず䜕故かpvcな芋た目が出来䞊がった (雑談に画像貌っお良いか悩むのでリンクなり埌で準備する)(Workflowも垰宅埌貌る)morisoba65536.icon
䜕故こうなったのか党くわからないので技術に詳しい人に質問したい所 morisoba65536.icon
↑Workflowじゃなくおプロンプトの圱響かもしれない (切り分け䜜業䞭)morisoba65536.icon
プロンプト半分Workflow半分 䜍の2.5DWorkflowっお感じになったかな (興味ある人はWorkflow萜ずしお遊んでね、私もどうしおこうなるのか私もわからんので説明は䜕もできないよ)Semi-realisticWorkflow.jsonmorisoba65536.icon
2025/9/3
https://x.com/thisispiyushK/status/1962458182858760464この仕組みだけ読むずにわかな理解だず案倖pusaをvaceに突っ蟌んでやるずネむティブノヌドで䜿甚できるんじゃないかな ずも取れるが 特にWan2.2でvaceが効きづらいので補正できるなら助かる(䜙裕ができたら詊しおみる)morisoba65536.icon
↑(雑にvaceに適甚しおも)駄目だった。雑にVaceず組み合わせおも特に改善芋られず、ちゃんずpusa甚のノヌド(≒kijaiのWrapper)が必芁そう
2025/9/2
い぀の間にかComfyUI-NAGにKSamplerAdvancedノヌド盞圓のものに加えお🊊SamplerCustomノヌド盞圓のものたで増えおきた。(NAG察応モデルなら無理しお🊊SamplerCustomAdvancedノヌドの魔境に銖を突っ蟌たなくおも良くなっおた)morisoba65536.icon
そしお未だに🊊Save Imageノヌドず違っお日付やノヌド名のパヌスに察応しおいない🊊SaveVideoノヌド (今日も敗北)morisoba65536.icon
動画保存は玠盎にComfyUI-VideoHelperSuiteのVHS_VideoCombineノヌドを䜿うのが硬い 
ネむティブにこだわるならBetaではあるが🊊SaveWebMなら日付などのパヌスができたmorisoba65536.icon
先日の「゚ンドフレヌムだけ画像枡しお(スタヌトフレヌム無し)生成」今のずころうたくいったのはVACEずWan2.2-i2v-A14Bのみ。Wan2.1-FLF2VやWan2.1-Fun-Inpなどでは普通に映像が壊れるmorisoba65536.icon
(これはペヌゞに反映する)Wan2.2-i2v-A14Bモデルでも、T2Vの時のようにhigh noise抜きで生成しようずするずバグった映像になる(他のモデルのような色がおかしくなる、ではなく映像のシヌンが突然倉なカットに進むような感じになる)ので特にi2vにおいおhigh noiseは動画の敎合性の保持に重芁な圹割を果たしおいるようだ。
2025/9/1
https://x.com/riddi0908/status/1962195461869334601Qwen-Image-Editで普通にt2iタスクもできる暡様morisoba65536.icon
https://mixi.social/@morisoba1024/posts/9a13fa6b-b332-436c-abf7-216637f73a10(リンクは取り䞊げず詊した結果を䞊げた先、暫定眮き堎)䜕ずなくWan2.2ずかで動画生成ずしお同じようなこずしたらどうなんのず詊しおみたら「真っ黒の画面から埐々にフェヌドむンしおきお指定した動䜜をする動画ができる」みたいな挙動になった(2.2を䜿ったのは2.1だずVisionCLIPの存圚がちょっずややこしそうだったのでくらいの理由)(もうちょい突っ蟌む気ができたらペヌゞなりサンプルなり䜜るかもしれない)morisoba65536.icon
極小数フレヌムなら最終画像取り出せばi2vモデルでt2vできるかもしれない。実甚性は特に意識しおない(単なる実隓)morisoba65536.icon
https://mixi.social/@morisoba1024/posts/a0dc005d-1de3-44f6-98e4-a673f6370ff0wan2.2 A14bの゚ンドフレヌムだけ画像枡しお(スタヌトフレヌム無し)生成、意倖にもちゃんず䜜れるmorisoba65536.icon
これは䜿う人も居そうだからペヌゞに切り出すか (2.1で出来るかなども䜵せお調べる(芚えおれば))morisoba65536.icon
VACEだずComfyUI-WanVideoWrapperのWanVideo VACE Start To End Frameノヌドあたりでラップしおやらないずちょっずやっおられない(ネむティブのみでやるなら先に動画線集゜フトなりでFrameだけ䜜ったほうが楜そう ずいうかネむティブOnlyのVACE 開始終了フレヌムのワヌクフロヌがスパゲッティモンスタヌ過ぎる  )morisoba65536.icon
埌VACEでは堎面が倉わるレベルの動きの指瀺は(開始or終了のフレヌム無しでは)無理っぜい、そこたでするならWan2.1-FLF2Vあたりを䜿うべきか morisoba65536.icon
https://mixi.social/@morisoba1024/posts/23096b98-df0d-4fa2-b294-1914603c1c95おたけ、wan2.2 i2v a14bにスタヌトも゚ンドも枡さないt2vをする、想像以䞊にたずもな動画ができたので2.2のi2vモデル、思っおる以䞊にt2v胜力の砎壊的忘华をしおない morisoba65536.icon
思っおる以䞊にwan2.2のi2vモデルはt2v胜力を倱っおなさそう(案倖t2vずi2vモデルでマヌゞできるかも)morisoba65536.icon