小弟最近購入索泰ZOTAC GAMING GeForce RTX 3070 Ti AMP Holo,打算來淘汰我服役多年的GTX1080,
在與搶購機器人搏鬥後喜獲愛卡,先上幾張他的照片。
RTX 3070Ti 搭載了第三代Tensor Core,根據官方的說法:
NVIDIA Tensor 核心技術最先運用在 NVIDIA Volta™ 架構上,
不只大幅加速人工智慧,也將訓練時間從數週降至數小時,
同時顯著提升推論速度。
這使身為菜鳥AI工程師的我,
能夠在深度學習訓練模型時縮短大幅訓練時間(當然...回家後訓練的AI與工作無關)。
那今天就稍微比較一下我升級後能夠大幅度的縮短了多少的訓練時間。
測試數據集:CIFAR-10
運行環境:
CPU:Intel Core i7 6700 @ 3.40GHz
主板:Z170 PRO GAMING
RAM:24.0GB DDR4
硬碟:Samsung SSD 970 EVO Plus 2TB
顯示卡:索泰ZOTAC GAMING GeForce RTX 3070 Ti AMP Holo 、 微星GTX 1080 GAMING X 8G
軟體環境:
Windows 10 + Anaconda/Python 3.6
CUDA 11.4
Nvidia驅動版本:471.68
測試的標準是,在CIFAR-10數據集上訓練CNN模型,比較二者的運行時間,越短越好。
為了測試結果的可比性,執行了3個不同版本的Benchmark:
在相同batch size的條件下,運行FP32(float32)、FP16(float16)和FP64(float64);
使用batch size擴大一倍的條件(從64增加到128),運行FP16 bs * 2。
廢話不多說,下面開始跑分。
CIFAR-10 8層測試:運行30個epoch所需的時間,越短越好
CIFAR-10 12層測試:運行30個epoch所需的時間,越短越好
結論:
就結果來看GTX 1080直接被RTX 3070Ti輾壓(畢竟中間差了一代)。
不過當深度學習模型層數增多,RTX 3070Ti增加的訓練時間按比例增幅的比較多%,
GTX 1080相對來說除了FP16 bs *2以外訓練時間增加的比例均較少。
AI相關的不負責任數據測試就到這,主要還是以遊戲為主,畢竟光追真的太香了。
購買後也研究了一下索泰,看到最多的評論就是堆料王跟保固問題,
因為NVIDIA給顯卡廠商的晶片都一樣,各家廠商只能從設計與風扇等料件來做出差異,
而索泰推出的顯示卡,外觀是紅點設計獎,雖然不懂這個獎項,但外觀整體設計感是真的很潮,完全就是我的菜
散熱器的部分是IceStorm2.0冷卻系統,散熱是我滿注重的一點,這幾天玩遊戲看溫度都在65左右,升級超有感的
就以優良的風扇與富有創意的設計來得到堆料王的稱號確實是實至名歸。
保固的部分,早年還沒登陸台灣時保固很混亂,
現在登陸台灣後,保固找聯強可以解決大部分的問題。
如果聯強搞不定,就直接找原廠,看蠻多評論說索泰官方態度極佳。
不過還是要記得購買後要去ZOTC官網進行登記延長保固,基本3年,登記保固再賺1年或2年(取決於型號)。
在與搶購機器人搏鬥後喜獲愛卡,先上幾張他的照片。
RTX 3070Ti 搭載了第三代Tensor Core,根據官方的說法:
NVIDIA Tensor 核心技術最先運用在 NVIDIA Volta™ 架構上,
不只大幅加速人工智慧,也將訓練時間從數週降至數小時,
同時顯著提升推論速度。
這使身為菜鳥AI工程師的我,
能夠在深度學習訓練模型時縮短大幅訓練時間(當然...回家後訓練的AI與工作無關)。
那今天就稍微比較一下我升級後能夠大幅度的縮短了多少的訓練時間。
測試數據集:CIFAR-10
運行環境:
CPU:Intel Core i7 6700 @ 3.40GHz
主板:Z170 PRO GAMING
RAM:24.0GB DDR4
硬碟:Samsung SSD 970 EVO Plus 2TB
顯示卡:索泰ZOTAC GAMING GeForce RTX 3070 Ti AMP Holo 、 微星GTX 1080 GAMING X 8G
軟體環境:
Windows 10 + Anaconda/Python 3.6
CUDA 11.4
Nvidia驅動版本:471.68
測試的標準是,在CIFAR-10數據集上訓練CNN模型,比較二者的運行時間,越短越好。
為了測試結果的可比性,執行了3個不同版本的Benchmark:
在相同batch size的條件下,運行FP32(float32)、FP16(float16)和FP64(float64);
使用batch size擴大一倍的條件(從64增加到128),運行FP16 bs * 2。
廢話不多說,下面開始跑分。
CIFAR-10 8層測試:運行30個epoch所需的時間,越短越好
CIFAR-10 12層測試:運行30個epoch所需的時間,越短越好
結論:
就結果來看GTX 1080直接被RTX 3070Ti輾壓(畢竟中間差了一代)。
不過當深度學習模型層數增多,RTX 3070Ti增加的訓練時間按比例增幅的比較多%,
GTX 1080相對來說除了FP16 bs *2以外訓練時間增加的比例均較少。
AI相關的不負責任數據測試就到這,主要還是以遊戲為主,畢竟光追真的太香了。
購買後也研究了一下索泰,看到最多的評論就是堆料王跟保固問題,
因為NVIDIA給顯卡廠商的晶片都一樣,各家廠商只能從設計與風扇等料件來做出差異,
而索泰推出的顯示卡,外觀是紅點設計獎,雖然不懂這個獎項,但外觀整體設計感是真的很潮,完全就是我的菜
散熱器的部分是IceStorm2.0冷卻系統,散熱是我滿注重的一點,這幾天玩遊戲看溫度都在65左右,升級超有感的
就以優良的風扇與富有創意的設計來得到堆料王的稱號確實是實至名歸。
保固的部分,早年還沒登陸台灣時保固很混亂,
現在登陸台灣後,保固找聯強可以解決大部分的問題。
如果聯強搞不定,就直接找原廠,看蠻多評論說索泰官方態度極佳。
不過還是要記得購買後要去ZOTC官網進行登記延長保固,基本3年,登記保固再賺1年或2年(取決於型號)。
最後編輯: