支援 64bit ARM 架構:CUDA 6.5 推出

NVIDIA CUDA 又更新囉~這次的版本編號是 6.5,相較於去年年底的 6.0 版,這次的改版,最主要的變化、是加入了對於 64-bit ARM 的支援!之前在 CUDA 5.5 的時候,NVIDIA 是第一次支援 ARM 的架構,而當時都還是僅有 32 位元版;而現在則是正式支援 64-bit 的 ARM 系統了!某方面來看,或許算是 NVIDIA 在為自家的 Denver 版 Tegra K1 鋪路吧?

如果要下載的話,則可以到官方網頁:

https://developer.nvidia.com/cuda-toolkit

而除了支援 64bit ARM 以外,其他的新功能還包括了:

閱讀更多»

Khronos 發布 OpenGL 4.5

官方新聞是《Khronos Group Announces Key Advances in OpenGL Ecosystem》,內容主要就是這次 Khronos 在 SIGGRAPH 上針對相關環境所做的發表。

在 OpenGL 的部分,這次是把 OpenGL 的版本更新到 4.5、並放出了相關的規格;他的更新內容,主要包括了:

  • Direct State Access (DSA) – object accessors enable state to be queried and modified without binding objects to contexts, for increased application and middleware efficiency and flexibility;

  • Flush Control – applications can control flushing of pending commands before context switching – enabling high-performance multithreaded applications;

  • Robustness – providing a secure platform for applications such as WebGL browsers, including preventing a GPU reset affecting any other running applications;

  • OpenGL ES 3.1 API and shader compatibility – to enable the easy development and execution of the latest OpenGL ES applications on desktop systems;

  • DX11 emulation features – for easier porting of applications between OpenGL and Direct3D.

閱讀更多»

OpenCL 的 C++ 函式庫:Boost.Compute

這是前幾天在 GPGPU.org 上看到的消息,原文是《Boost.Compute v0.2 Released》。

基本上,Boost.Compute 是一個基於 OpenCL 的 C++ GPGPU、大量平行化函式庫,主要的設計目的,是用來簡化 GPGPU 程式的開發。Boost.Compute 實際上是一個 OpenCL C API 的一個 C++ wrapper,讓開發者可以用 C++ 的概念、以及 STL-like 的程式風格、來開發 OpenCL 的程式。個人會覺得他的形式應該相當接近 nVIDIA CUDAThrust 這個函式庫。

他的原始碼目前是放在 GitHub 上,網址是:

https://github.com/kylelutz/compute

目前還僅只是 0.2 版、同時也還沒有被納為 Boost C++ Libraries 的一部分,基本上,應該還是算是在測試階段吧~

閱讀更多»

OpenGL: Approaching Zero Driver Overhead

這篇的原出處是 NVIDIA 官方部落格的《NVIDIA, AMD, Intel Explain How OpenGL Can Unlock 15x Performance Gains》,內容基本上是今年 GDC(Game Developer Conference)時,由 AMD 的 Graham Sellers、Intel 的 Tim Foley 和 NVIDIA 的 Cass Everitt 與 John McDonald,一起說明要如何在撰寫 OpenGL 程式的時候,盡量減少驅動程式的 overhead、進而達到加速的效果。

內容,基本上就是類似之前也貼過的《如何加強 OpenGL 的繪圖效率》一文(由 nVIDIA 同樣兩位所提供)類似,都是希望可以讓 3D 顯示的程式能夠更好地發揮顯示卡的效能。

下面就是《OpenGL: Approaching Zero Driver Overhead》這份投影片,有興趣也可以到 slideshare 上觀看

閱讀更多»

如何加強 OpenGL 的繪圖效率

這篇文章是參考 Geeks3D 的《How to Increase the Number of Draw Calls in OpenGL》一文。

會有這篇文章,主要是因為 AMD 在日前推出了名為「AMD Mantle」(官網)的新的繪圖 API,他和一般普遍使用 Direct 3D、OpenGL 這類跨硬體的 API 不同的地方在於,AMD Mantle 是針對自家的 Radeon GPU 做設計的,所以在自家的顯示卡上,會有更好的效能(draw call 數目)!(參考《AMD Mantle: First Interesting Slides and Details, Target: 100K Draw Calls per Frame》)

而由於它號稱的效能增進相當地顯著,就有人提出來,其實透過 NVIDIA 的 OpenGL Extension,也可以到達類似的效能增進!NVIDIA 的這份投影片標題是《Beyond porting》,作者是 NVIDIA 的 John McDonald 和 Cass Everitt 在 slide share 上可以看到(連結),內容重點,就是「新的 OpenGL 如何減少驅動程式的 overhead」(How modern OpenGL can radically reduce driver overhead)下面就是投影片的內容:

閱讀更多»

SIGGRAPH 2014 OpenGL 程式開發簡介

這是 ACMSIGGRAPH 放在 YouTube 上的教學影片、《SIGGRAPH University – "An Introduction to OpenGL Programming" 》。他基本上是 SIGGRAPH 2013 上面的一個課程,在介紹 OpenGL 的程式架構、以及該怎麼寫 OpenGL 的程式,長度超過三個小時。

Heresy 自己也還沒看完,不過如果要學習/複習 OpenGL 的程式的話,應該算是個不錯的影片~

閱讀更多»

提供統一記憶體架構:NVIDIA CUDA 6

話說,NVIDIA CUDA 這個 GPGPU 的程式開發架構從 2007 年推出 1.0 版發展至今,也已經好一段時間了;這段期間,NVIDIA 也不斷地推出新的 GPU 架構、以及對應的新版 CUDA SDK,在效能和功能上做強化,基本上應該也算是目前最成熟的 GPGPU 開發環境之一。

而日前,NVIDIA 也發表了還沒正式發布的最新版的 CUDA 6.0(現在還沒有可以下載的 SDK)的一個主要的功能,那就是「統一記憶體」(Unified Memory);原文可以參考官方的《Unified Memory in CUDA 6》一文。

閱讀更多»

Dolphin 眼中的各家顯示晶片廠商

Heresy 是在 Geeks 3D 看到《Dolphin Emulator: Graphics Drivers Hall of Shame》這篇文章的,而其引用的,則是任天堂遊戲機模擬器、Dolphin Emulator 的《Dolphin Emulator and OpenGL drivers – Hall of Fame/Shame》一文。

基本上,Dolphin Emulator 是一款模擬任天堂的 Wii 以及 GameCube 這兩款遊戲機的開放原始碼、跨平台的模擬器,他在維基百科上也有相關的條目(參考)。而《Dolphin Emulator and OpenGL drivers – Hall of Fame/Shame》這篇文章,則是其開發團隊,針對他們將 Dolphin 的 OpenGL 後臺重新改寫、使其支援 OpenGL ES 3.0 的經驗分享;他們基本上,是針對開發時面對到的問題,來針對各家顯示晶片廠商對於 OpenGL / OpenGL ES 3.0 的支援做評價,某種程度上,應該也代表了這些顯示晶片廠商對於開放社群的友善度了~

閱讀更多»

支援 ARM 和 VIsualStudio 2012:CUDA 5.5 Production Release

這應該是幾天前的消息了,nVIDIA 的 CUDA 這個使用顯示卡來做平行計算的開發套件,又推出新的版本了~這次的版本是 5.5 正式的 Production Release 版(之前有推出過 Release Candidate,這次版本編號是 5.5.20),下載頁面是:

https://developer.nvidia.com/cuda-downloads

而他比較重要的更新,可以參考 CUDA Toolkit 的頁面,主要包括了:

閱讀更多»