最近在Hot Chips會議中,NVIDIA正式揭露了代號 Denver 的Tegra K1 64bit處理器細節,號稱可以在行動裝置上提供PC等級的效能。
NVIDIA Tegra K1 同時有32bit以及64bit兩種版本,一樣基於Kepler GPU,擁有192個CUDA核心,主要差異在於32bit版本是使用A15四核心處理器,3-Way超純量架構,核心時脈2.3GHz,L1快取為32K+32K;而64bit版本則是採用Denver雙核心處理器,7-Way超純量架構,核心時脈2.5GHz,L1快取為128K+64K。另外Denver Tegra K1 64bit的版本與32bit封裝接腳一樣,所以現有K1 32bit的裝置都可以直接換裝上陣。
雖然 Denver Tegra K1 64bit 只是雙核心架構,但是每個CPU擁有7-Way超純量架構,可同時執行7個微指令,並各自擁有4-way的128KB L1快取以及64KB的L1資料快取,另外也共用2MB 16路L2快取。
另外,Denver 採用了"動態程式碼最佳化"(Dynamic Code Optimization)的新技術,在快取中儲存常用的應用程式,並最佳化,加速指令的執行,配合7-Way超純量架構,可以有更快的效能。主要這項優化基於所有ARM應用軟體,不需要在另行設計,也不會更耗電。
最後NVIDIA宣稱Denver的效能可以超越目前大部分的ARM處理器,包括Apple A7在內。
NVIDIA Tegra K1 同時有32bit以及64bit兩種版本,一樣基於Kepler GPU,擁有192個CUDA核心,主要差異在於32bit版本是使用A15四核心處理器,3-Way超純量架構,核心時脈2.3GHz,L1快取為32K+32K;而64bit版本則是採用Denver雙核心處理器,7-Way超純量架構,核心時脈2.5GHz,L1快取為128K+64K。另外Denver Tegra K1 64bit的版本與32bit封裝接腳一樣,所以現有K1 32bit的裝置都可以直接換裝上陣。
雖然 Denver Tegra K1 64bit 只是雙核心架構,但是每個CPU擁有7-Way超純量架構,可同時執行7個微指令,並各自擁有4-way的128KB L1快取以及64KB的L1資料快取,另外也共用2MB 16路L2快取。
另外,Denver 採用了"動態程式碼最佳化"(Dynamic Code Optimization)的新技術,在快取中儲存常用的應用程式,並最佳化,加速指令的執行,配合7-Way超純量架構,可以有更快的效能。主要這項優化基於所有ARM應用軟體,不需要在另行設計,也不會更耗電。
最後NVIDIA宣稱Denver的效能可以超越目前大部分的ARM處理器,包括Apple A7在內。