目前 NVIDIA TITAN V 是市售中最強的顯卡,不過它的售價以及架構都說明了它不只可用於打遊戲,也是一張算是半專業的運算卡,不少研究機構、實驗室都會用它於科學運算,但最近有一些工程師反映,TITAN V 在某些特定情況下的科學模擬計算中無法給出可靠的答案,懷疑是記憶體不支援 ECC 糾錯造成的。
TITAN V 的規格強悍,史無前例的80組SM單元,5120個CUDA單元,211億個晶體管。新加入的專門用於深度計算Tensor單元,注定 TITAN V 就不是一張普通的遊戲卡。
因此很多科學家都用它來跑科學模擬運算,但有些科學家卻發現 TITAN V 處理出來的結果似乎不太可靠,比方說用四張 TITAN V 顯卡來處理蛋白質與酶之間合成計算,在相同的測試參數下,每一次的測試結果都應該是相同的,但實際上跑出來的結果卻不一樣。
而一位不願意透露姓名的資深業內人士表示,這很可能是 NVIDIA TITAN V 顯卡的記憶體出現了溢出錯誤導致的,因為 NVIDIA TITAN系 列顯卡中全面禁用了 ECC 糾錯功能,在處理像科學計算超龐大體量數據時,沒有糾錯功能下,記憶體很可能會來不及處理部分數據進而導致溢出,最後運算結果自然是不相同的,目前已確認一款稱為 Amber 的分子動力學科學應用程序受到影響。
目前 NVIDIA 對這件事情表態,“All of our GPUs add correctly. Our Tesla line, which has ECC [error-correcting code memory], is designed for these types of large scale, high performance simulations. Anyone who does experience issues should contact support@nvidia.com.”言外之意就是,“首先遇到問題請馬上聯繫我們,另外你們這些科學家應該用更加專業更加昂貴的 Tesla 顯卡,因為它們都是帶有 ECC 糾錯功能的”。
來源:http://www.expreview.com/60182.html
TITAN V 的規格強悍,史無前例的80組SM單元,5120個CUDA單元,211億個晶體管。新加入的專門用於深度計算Tensor單元,注定 TITAN V 就不是一張普通的遊戲卡。
因此很多科學家都用它來跑科學模擬運算,但有些科學家卻發現 TITAN V 處理出來的結果似乎不太可靠,比方說用四張 TITAN V 顯卡來處理蛋白質與酶之間合成計算,在相同的測試參數下,每一次的測試結果都應該是相同的,但實際上跑出來的結果卻不一樣。
而一位不願意透露姓名的資深業內人士表示,這很可能是 NVIDIA TITAN V 顯卡的記憶體出現了溢出錯誤導致的,因為 NVIDIA TITAN系 列顯卡中全面禁用了 ECC 糾錯功能,在處理像科學計算超龐大體量數據時,沒有糾錯功能下,記憶體很可能會來不及處理部分數據進而導致溢出,最後運算結果自然是不相同的,目前已確認一款稱為 Amber 的分子動力學科學應用程序受到影響。
目前 NVIDIA 對這件事情表態,“All of our GPUs add correctly. Our Tesla line, which has ECC [error-correcting code memory], is designed for these types of large scale, high performance simulations. Anyone who does experience issues should contact support@nvidia.com.”言外之意就是,“首先遇到問題請馬上聯繫我們,另外你們這些科學家應該用更加專業更加昂貴的 Tesla 顯卡,因為它們都是帶有 ECC 糾錯功能的”。
來源:http://www.expreview.com/60182.html