顯卡 AI 繪圖效能差異 Stable Diffusion webUI 測試

soothepain

full loading
已加入
9/17/03
訊息
21,273
互動分數
1,933
點數
113
網站
www.coolaler.com
使用 Stable Diffusion webUI 可以實現本地端 AI 繪圖,好處就是沒有限制數量,另外就是你可以算出瑟瑟的圖XD,相信很多人已經著手在進行,那麼顯卡對於 AI 算圖有沒有效能上的差異?有多大的差異?此次使用手邊既有的幾張顯卡來進行算圖測試。

使用 Stable Diffusion webUI 繪製以下圖片,相關繪圖資訊如下,採樣方式為 DPM++ SDE Karras ,採用步驟40步,這個越多細節越多就是跑越久,解析度 768x512,繪圖時會吃到8GB左右顯卡記憶體。

01.jpg



測試平台
CPU: Intel Core i9-13900K
CPU Cooler: MSI MEG CORELIQUID S360
RAM: GSKILL DDR4-4000 8GBx2
MB: MSI B760I EDGE WIFI DDR4
VGA: 如下圖
SSD: GIGABYTE AORUS RAID SSD 2TB
PSU: InWin 1065W
OS: Windows 11

使用模型:realdosmix
LORA 模型:koreanDollLikeness
提示詞:
masterpiece,extremely detailed CG unity 8k wallpaper,best quality,original figure painting,upper body,Raise right hand plucking hair , solo,in a gorgeous Chinese palace details,1 girl,Smile,medium breasts,black hair,messy hair,swept bangs,an extremely delicate and beautiful,Beautiful and detailed eye description,short hair,Beautiful and detailed facial depiction,standing,embroidery,blue winter Taoist robe,china dress,Han Chinese Clothing,detailed clothes,Hair accessories,detailed face,Look at the audience,<lora:koreanDollLikeness_v10:0.3>

反向提示詞:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet,ugly,pregnant,vore,duplicate,hermaphrodite,trannsexual,mutilated,morbid,extra fingers,fused fingers,too many fingers,long neck,mutation,poorly drawn face,poorly drawn hands,mutated hands,deformed,blurry,bad anatomy,bad proportions,disfigured,cloned face,extra limbs,malformed limbs,gross proportions,missing arms,missing legs,extra arms,extra legs,

繪圖資訊:
Steps: 40, Sampler: DPM++ SDE Karras, CFG scale: 20, Seed: 149120564, Face restoration: None, Size: 768x512, Model hash: 0d27c62ffa, Model: realdosmix_, Clip skip: 2


測試結果如下,這些顯卡之中 NVIDIA RTX 3090 Ti 最快,10秒就可以完成,RTX 4070 Ti 還輸 RTX 3080 Ti 有4秒之多,使用 RTX 3060 12GB 也能在26秒完成,也比 AMD RX 7900 XTX 要快1秒XD。
x1.png



該圖的繪製結果
3.png



當然圖片越大細節越多就是越花時間,另外測試一下把圖片放大解析度兩倍,繪圖資訊如下,其餘提示詞不變。
Steps: 40, Sampler: DPM++ SDE Karras, CFG scale: 20, Seed: 149120564, Face restoration: None, Size: 768x512, Model hash: 0d27c62ffa, Model: realdosmix_, Denoising strength: 0.5, Clip skip: 2, Hires upscale: 2, Hires upscaler: Latent (nearest-exact)

可以看到繪製時核心溫度74.2度,Hot spot 85.3度,記憶體溫度82度,記憶體使用已經超過10GB。這張顯卡是 GALAX RTX 3080 Ti HOF 是使用相當高階的散熱器,所以這樣的溫度算是已經偏高。
02.jpg



繪製結果,細節比還未放大的時候要多,不過手指也變得奇怪XD。這部分跟調用的放大演算法以及重繪幅度有關,要完美一點就要多次嘗試調整參數了。而放大所需要的繪製時間也相對變多,原本 RTX 3080 Ti 繪製 768x512 是12秒完成,放大一倍之後需要1分42秒,這與放大演算法以及重繪幅度有相對關係。
4.png



小結
目前 Stable Diffusion webUI 對於 NVIDIA 使用的 CUDA 是比較有優勢,在軟體安裝執行上也比較沒問題,而 AMD 顯卡則需要使用 DirectML ,這兩者在效能繪製上就有相當差異存在。原本所安裝的 Stable Diffusion webUI 以為換為 AMD 也能順利執行,結果並不是如此,得改安裝 Stable Diffusion webUI directml 的分支,安裝可參考 Install and Run on AMD GPUs ,而且在執行的時候可能需要添加一些參數才能正常,這部分一樣在上面連結內有提到。

相關文章
使用自己的顯卡進行 AI 繪圖, Stable Diffusion webUI 安裝教學
Stable Diffusion webUI Model 模型 安裝, 要真人還是動漫就靠它了
 
最後編輯:
  • Like
Reactions: 單純的宅宅

soothepain

full loading
已加入
9/17/03
訊息
21,273
互動分數
1,933
點數
113
網站
www.coolaler.com
AMD 顯卡有驅動更新,可縮短約一倍時間
 

翡璃月

榮譽會員
已加入
3/11/08
訊息
2,672
互動分數
21
點數
38
網站
bbs.hsq-rip.org
  • Like
Reactions: mana

fuzzy

初級會員
已加入
12/22/23
訊息
4
互動分數
0
點數
1
不知道、nv、AMD這兩種顯卡、在AI繪圖建模、輸出效果、兩者會有不同的差別嗎?例如顏色等?好奇!
 
▌延伸閱讀