StableDiffusion
Stable Diffsionが絶滅寸前に、後発のLuma AIやRunway Gen3が人気、AI業界の変動速度は異常
-
- カテゴリ:
- ニュース
- AI・ディープラーニング

1: 名無しさん@涙目です。(北海道) [US] 2024/07/16(火) 10:20:28.10 ID:8vPLWtL80 BE:422186189-PLT(12015)
発表後、悪い意味で話題になってしまっていた画像生成AI「Stable Diffusion 3 Medium(SD3M)」に動きがありました。開発元のStability AIは、Weta Digitalの元CEOのプレム・アッカラジュ(Prem Akkaraju)氏がCEOに就任し、新たな資金も調達しました。これで組織として当座の危機は脱したと言えそうです。また、Stable Diffusion 3(SD3)のライセンスについての変更を打ち出してきました。果たして失われた信頼は取り戻せるでしょうか。
(続きはこちら)
2: 名無しさん@涙目です。(北海道) [US] 2024/07/16(火) 10:20:49.21 ID:8vPLWtL80 BE:422186189-PLT(12015)
https://ascii.jp/img/2024/07/14/3764232/o/88ff4ee127eaf812.png
Googleトレンドの6月3日~7月3日まで。ブルーの線が「Stable Diffusion 3」でローンチ日の6月12日と13日のみ伸びているが、それ以外は低調
Googleトレンドの6月3日~7月3日まで。ブルーの線が「Stable Diffusion 3」でローンチ日の6月12日と13日のみ伸びているが、それ以外は低調
ミニPC・ノートパソコン用のIntel Core Ultra 5 125Hが発売、内蔵GPUはGeForce GTX 1660 SUPER相当に

1: hage(北海道) [US] 2024/05/23(木) 11:07:27.72 ID:FiY4tuhP0 BE:422186189-PLT(12015)
OpenVINOを使ってのStable Diffusion AUTOMATIC1111ベンチマークしてみた!
以前からCore Ultraシリーズ搭載のPCが手元に届いたら試したかったのが、Stable Diffusionの生成AI画像速度チェック。冒頭に書いたように、OpenVINOに対応しているため、少し前にIntel Arc A770で行なった環境と同じでいけるはずだ。
初めの1回だけ変換する時間がかかり1分27秒だが、2回目は25秒。=10回だと250秒。先のサイトを参照すると、GeForce GTX 1660 SUPER並みの生成速度だ。Arc A770は50秒だったので、5倍時間がかかることになる。ただし、参考までにCPUだと約3分15秒。つまり、NPUが動作せずGPUだけでも十分効果が出ていると言えるだろう。
遅いのは遅いのだが、SD 1.5の画像を25秒/20 Stepsで作れるなら、“お試し”としては十分許容範囲だろう(LCMやTurbo Modelを使うとStepsが10以下になるので約半分の時間で処理できる)。それがdGPUなしのミニPCで動くのだから、これはちょっとした事件と言えるのではないだろうか!? もっと上位のSKUではどうなるかが気になるところではある。
以前からCore Ultraシリーズ搭載のPCが手元に届いたら試したかったのが、Stable Diffusionの生成AI画像速度チェック。冒頭に書いたように、OpenVINOに対応しているため、少し前にIntel Arc A770で行なった環境と同じでいけるはずだ。
初めの1回だけ変換する時間がかかり1分27秒だが、2回目は25秒。=10回だと250秒。先のサイトを参照すると、GeForce GTX 1660 SUPER並みの生成速度だ。Arc A770は50秒だったので、5倍時間がかかることになる。ただし、参考までにCPUだと約3分15秒。つまり、NPUが動作せずGPUだけでも十分効果が出ていると言えるだろう。
遅いのは遅いのだが、SD 1.5の画像を25秒/20 Stepsで作れるなら、“お試し”としては十分許容範囲だろう(LCMやTurbo Modelを使うとStepsが10以下になるので約半分の時間で処理できる)。それがdGPUなしのミニPCで動くのだから、これはちょっとした事件と言えるのではないだろうか!? もっと上位のSKUではどうなるかが気になるところではある。
ただOpenVINOで動いているものの、NPUで作動していないのが残念。いろいろ検索してみたが有効な情報は見つからなかった。同社はデモでSD 1.5を見せてることもあり、AUTOMATIC1111のscriptなり、何か情報を出して欲しいところ。
以下ソース
2: hage(北海道) [US] 2024/05/23(木) 11:08:03.50 ID:FiY4tuhP0 BE:422186189-PLT(12015)
Intel Arc 最弱仕様を搭載
【生成AI】APUでStable Diffusionしたらメモリ足りなくてハングアップした
NVIDIAのドライバアップデートでStable Diffusionが2倍高速化

957: Socket774 2023/10/23(月) 01:00:07.02 ID:/624UbMc0
2023年10月17日に配信された「Game Ready ドライバー」のアップデートによりいくつかのゲームの起動時パフォーマンスが向上し、さらに画像生成AIのStable Diffusionが最大2倍速くなることが発表されました。
New Game Ready Driver Released: DLSS 3 For NARAKA: BLADEPOINT and Warhammer: Vermintide 2, Plus RTX Video Super Resolution Enhancements & Stable Diffusion Is Now Up To 2X Faster | GeForce News | NVIDIA
https://www.nvidia.com/en-us/geforce/news/game-ready-driver-dlss-3-naraka-vermintide-rtx-vsr/
New Game Ready Driver Released: DLSS 3 For NARAKA: BLADEPOINT and Warhammer: Vermintide 2, Plus RTX Video Super Resolution Enhancements & Stable Diffusion Is Now Up To 2X Faster | GeForce News | NVIDIA
https://www.nvidia.com/en-us/geforce/news/game-ready-driver-dlss-3-naraka-vermintide-rtx-vsr/


(続きはこちら)
https://gigazine.net/news/20231022-nvidia-boosts-stable-diffusion-performance/ もうだめぽ
958: Socket774 2023/10/23(月) 02:19:13.73 ID:SqMGyt4U0
それ使い物にならんやつ
まあラデ不利なことには変わらんが
まあラデ不利なことには変わらんが
インテル・シリコンに最適化された安定した拡散により、Arc A770のパフォーマンスが54%向上

958: Socket774 (ワッチョイ 1936-D+2o) 2023/08/21(月) 16:43:42.57 ID:CZAhgUTk0
AIが生成した画像をさらに高速に作成
Automatic1111のStable Diffusion WebUIは、インテルのOpenVINOツールキットの統合により、インテルGPUハードウェアで動作するようになりました。我々は、Stable Diffusionの最新リリースを再テストし、以前の結果と比較してインテルのGPUがどれだけ高速になったかを確認した。
Stable Diffusion(現在、結果の更新に取り組んでいるが、我々の以前のテストがある)は、テキスト記述から画像を生成するために使用されるディープラーニングAIモデルである。Stable Diffusionが特別なのは、ローカルの消費者向けハードウェアで実行できることだ。AIコミュニティには多くのプロジェクトがあり、中でもStable Diffusion WebUIは最も人気がある。使いやすく、実験しやすいブラウザ・インターフェースを提供している。
数ヶ月に及ぶ水面下での作業(我々は以前からこの噂を耳にしていた)を経て、最新のアップデートがIntel Arcオーナー向けに提供され、パフォーマンスが大幅に向上した。
https://twitter.com/bobduffy/status/1691974854705320111
以下は、Stable Diffusionの前回および最新のテスト結果です。前回のテストでは、少し手を加えたStable Diffusion OpenVINOを使用し、Automatic1111 webuiのフォークとOpenVINOで再テストを行いました。また、Nod.aiのSharkベースのStable Diffusionの新しいビルドで、AMDのGPUのいくつかを再テストしました。Nvidiaの結果はまだ更新されていませんが、近い将来、最新バージョンでの再テストを検討する予定です(終了次第、Stable Diffusionベンチマークのメイン記事を更新します)。
プロンプトも変更した。(新しいプロンプトは "messy room "で、AIが生成するためにより多くの労力を必要とする小さなディテールが画像に多く含まれる傾向があります)。実行ごとにばらつきがあり、特に今Arcに適用される注意点がありますが、以下が実行前と実行後の結果です。


インテルARCとAMD GPUはいずれも性能向上を示しており、ほとんどのGPUが大幅な向上を実現している。Arc A770 16GBは54%向上し、A750は同じシナリオで40%向上した。
(続きはこちら)
https://www.tomshardware.com/news/stable-diffusion-for-intel-optimizations
Automatic1111のStable Diffusion WebUIは、インテルのOpenVINOツールキットの統合により、インテルGPUハードウェアで動作するようになりました。我々は、Stable Diffusionの最新リリースを再テストし、以前の結果と比較してインテルのGPUがどれだけ高速になったかを確認した。
Stable Diffusion(現在、結果の更新に取り組んでいるが、我々の以前のテストがある)は、テキスト記述から画像を生成するために使用されるディープラーニングAIモデルである。Stable Diffusionが特別なのは、ローカルの消費者向けハードウェアで実行できることだ。AIコミュニティには多くのプロジェクトがあり、中でもStable Diffusion WebUIは最も人気がある。使いやすく、実験しやすいブラウザ・インターフェースを提供している。
数ヶ月に及ぶ水面下での作業(我々は以前からこの噂を耳にしていた)を経て、最新のアップデートがIntel Arcオーナー向けに提供され、パフォーマンスが大幅に向上した。
https://twitter.com/bobduffy/status/1691974854705320111
以下は、Stable Diffusionの前回および最新のテスト結果です。前回のテストでは、少し手を加えたStable Diffusion OpenVINOを使用し、Automatic1111 webuiのフォークとOpenVINOで再テストを行いました。また、Nod.aiのSharkベースのStable Diffusionの新しいビルドで、AMDのGPUのいくつかを再テストしました。Nvidiaの結果はまだ更新されていませんが、近い将来、最新バージョンでの再テストを検討する予定です(終了次第、Stable Diffusionベンチマークのメイン記事を更新します)。
プロンプトも変更した。(新しいプロンプトは "messy room "で、AIが生成するためにより多くの労力を必要とする小さなディテールが画像に多く含まれる傾向があります)。実行ごとにばらつきがあり、特に今Arcに適用される注意点がありますが、以下が実行前と実行後の結果です。


インテルARCとAMD GPUはいずれも性能向上を示しており、ほとんどのGPUが大幅な向上を実現している。Arc A770 16GBは54%向上し、A750は同じシナリオで40%向上した。
(続きはこちら)
https://www.tomshardware.com/news/stable-diffusion-for-intel-optimizations
ベンチの数値上で勝ってるだけ
960: Socket774 (アウアウウー Sa45-uDNR) 2023/08/21(月) 16:49:38.42 ID:hLR716oLa
ポテンシャルはあるから緑並みのドライバ出せれば実測も勝てるぞ
まあ前からやってる赤も出来てないのにできるはずもなく
まあ前からやってる赤も出来てないのにできるはずもなく
AMD、画像生成AIをPythonからC#に移植したらRadeonでの処理速度が10倍になったと発表

1: デスルフレラ(茸) [US] 2023/08/21(月) 22:30:08.39 ID:HIgbkDwa0 BE:422186189-PLT(12015)
AMDは18日に、Radeon RX 7900 XTX上で動作するStable Diffusionを最適化し、最大9.9倍高速化できる手法をブログで公開した。
最適化にはMicrosoft Oliveと呼ばれるPythonツールを利用する。
OliveはPyTorchの基本モデルをONNXに変換するツールであり、この段階でトランスフォーマグラフの最適化や、GPUメモリフットプリント削減のための量子化(ほとんどのレイヤーをFP32からFP16に変換)するなどの処理で、モデル処理を大幅に簡素化して高速化を実現するという。
最適化にはMicrosoft Oliveと呼ばれるPythonツールを利用する。
OliveはPyTorchの基本モデルをONNXに変換するツールであり、この段階でトランスフォーマグラフの最適化や、GPUメモリフットプリント削減のための量子化(ほとんどのレイヤーをFP32からFP16に変換)するなどの処理で、モデル処理を大幅に簡素化して高速化を実現するという。
(続きはこちら)
https://pc.watch.impress.co.jp/docs/news/1525079.html 2: ヘルペトシフォン(東京都) [US] 2023/08/21(月) 22:31:02.17 ID:8Q3QKrh00
Pythonは遅い、何やらせても遅いからな


