OSSの画像生成AI(Stable Diffusion)
Midjourneyめちゃ楽しいんだけど、一晩遊んだら$10分のトークン尽きちゃった
画像から画像を生成できればいいから、もっと安くできる方法ないかなぁって探したら
GPTにStable DiffusionっていうOSSを教えてもらったよぃ
びっくりしたのがメモリ8GB程度で動かせるってこと!
Colabの無料版でも余裕だしなんならローカルでも遊べるやんけ
↑のColabの下の方にも書いてるけど、元画像を8分の1程度に圧縮した状態でノイズ除去を繰り返すからメモリが少なくて済むらしい(Latent Diffusionっていう)
画像から画像を作ることもできるし(img2img)、
画像から線画とかポーズを抽出して他の画像を生成することもできるらしぃ(ControlNet)
OSSだから学習もできるんだよねぃ
すごくね?