AMD 推出支援 Bolt C++ Template Library 的 APP SDK 2.8


這算是前一段時間的消息了。不過當時 Heresy 在忙別的事,沒有時間認真看,所以就還拖到現在才寫了。整體來說,就是 AMD 針對了自家的 GPGPU 開發軟體,做了一批的更新~不過,由於 AMD 自己正在搞 APU、希望可以同時使用 CPU 和 GPU 來做計算,所以這邊的字樣,似乎也都變成「Heterogeneous Computing」(HC)了。

首先,就是 AMD 最主要的 APP(Accelerated Parallel Processing) SDK 的版本更新到了 2.8,也加入了對 OpenCL 1.2 的正式支援(之前 2.6 算是 preview);他的方網站是:http://developer.amd.com/tools/heterogeneous-computing/amd-accelerated-parallel-processing-app-sdk/,目前也已經可以下載了。

而在 Heresy 來看,這次更新最重要的,應該就是 AMD 推出了一個名為「Blot」新的 C++ template library(官網)~他的設計概念,基本上就是希望可以用類似 STL(C++ Standard Template Library)、標準 C++ template library 的形式,來提供一個 HC 的開發環境,降低這類大量平行化程式的開發門檻;在 Heresy 來看,他應該是類似 nVIDIA CUDA 上的 Thrust 這個函式庫(官網)的存在。

目前 Bolt 這個函式庫還在 preview 階段,僅提供了 Scan、Sort、Reduce、Transform、Transform reduce、Counting 這六項功能;在 APP SDK 裡有有提供對應的範例可以參考。如果只是想看看他要怎麼用的話,則可以參考官方部落格的《Implementing Black-Scholes using Bolt》這篇文章,裡面有提供部分的範例程式。

完整的更新訊息,可以參考官方的 release note(PDF)。


另外,應該是源自於 dDEBuggerAMD CodeXL,這次也更新到 1.0 的正式版了~它的官方網站是:http://developer.amd.com/tools/heterogeneous-computing/codexl/

由於他的 GPU API level 的偵錯(OpenCL / OpenGL)並不一定要 AMD 的顯示卡才能用,nVIDIA 的顯示卡也是可以用的~所以對 Heresy 這邊在寫 OpenGL 程式來說,也是一套相當方便的工具。不過很可惜,1.0 版也還是只有支援 Visual Studio 2010,而沒有支援最新的 Visual Studio 2012。


在 Heresy 來看,近年來 GPGPU 這種大量資料平行化的程式開發,發展真的是相當地快~而相關的開發環境,也越來越多了。除了 nVIDIA CUDAOpenCL 外,不管是像 Thrust 或 Bolt 這種以函式庫形式出發的,還是 C++AMP 以及 OpenACC 這種以現有語言做擴展的,都是在使用上更為方便、高階的開發環境,讓程式開發者可以更快地寫出大量平行化的程式。

而在硬體方面,nVIDIA 的 GPU 在通用計算上的彈性也越來越大了~以 nVIDIA 最新的 Tesla K20X / K20(官網)來說,不但大量地提高了計算能力,更在完整的 Kepler 上,提供了 Dynamic Parallelism 這類具有更高彈性的開發架構~今年底的 Top500,美國的超級電腦 Titan,也就靠著 Tesla K20X,成功地攻佔了首位~

其他像是 AMD 試圖整合 CPU 以及 GPU 的 APU(維基百科)、或是 Intel 的 many x86 core 處理器 Xeon Phi(官網),也都為了高速平行計算,帶來了更多的可能性。


最後,分享一個新聞:《只需 25 張顯示卡!Windows 伺服器密碼可在 6 小時內被破解》。

顧問組織 Stricture Consulting Group 的 CEO Jeremi Gosney 就展示了一部 4U 伺服器,內裡安裝了多張 AMD Radeon 6990 顯示卡,並透過 Virtual OpenCL Cluster Platform 及 ocl-Hashcat Plus 軟件的配合,可以做出強大的處理能力。Gosney 表示只需要 25 顆 Radeon HD 顯示核心便能夠以每秒 3,500 億次的運算速度逐一列出 Windows Server 2003 的 NTLM 加密演算法,只需要 5.5 小時左右時間可以完整地破解包括大小寫、數目字及符號的 8 字密碼。當密碼由改為 9 位字元就需要多 500 小時, 10 位字元就要 5.4 年時間。如果是舊式的 Windows LM 加密方式,更可以在 6 分鐘內完成。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.