AMD Ryzen Threadripper 3970x 原廠 RMA 簡單紀錄


在 Heresy 個人的印象中,在正常使用下,CPU 應該是電腦零組件最不容易壞的(最容易的:硬碟、電源供應器 XD)。在 Heresy 以往自己碰過、還有看過許多電腦的經驗,在保固內壞掉的 CPU 似乎只有一顆;而那顆 CPU 是大學同學古老的 AMD Athlon K7,壞掉的原因是買來裝上去散熱器沒裝好,開機就沒了。 XD

而前陣子,Heresy 終於碰到第二顆保固內掛掉的 CPU 了,這次還是 AMD、是超高階的 AMD Ryzen Threadripper 3970X(官網)。

這顆 3970X 是 2020 年底,公司這邊一口氣買進三台幾乎同規格的電腦中的其中一台。他是 Heresy 同事的工作機,之前都正常使用、也沒特別操他,但是某天就忽然不能開機了。

他不能開機的狀況,基本上就是從頭到尾都沒螢幕,主機板有接蜂鳴器也沒任何聲音,算是很麻煩的問題。不過由於這台電腦搭配的主機板是 ASUS ROG Zenith II Extreme(官網),上面有 OLED 可以監控開機的過程,這時候就比較方便了~

可以看到,他卡在「MEMORY CODE:00」的狀況,比較合理的猜測,應該會是記憶體吧?

但是實際上,就算把所有記憶體都拔了、或是換差別的記憶體,狀況也都還是類似,而且都沒聲音;所以接下來的猜測,要不就是主機板,不然就是 CPU(現在的記憶體控制器在 CPU 裡)了。

還好當時是一次買三組幾乎同規格的,所以這邊就直接把另一台電腦拆了,交換 CPU 來測試了!結果…還真沒想到,掛的還真的是 CPU…

另一台電腦的 CPU 換裝過來,這台電腦馬上復活;而這台電腦的 CPU 裝到那台電腦上,也是完美地重現了問題;某方面來說,算是運氣好,問題找到的還滿快的。


由於這顆 3970X 還在保固內,所以自然就是要跑送修了~

但是這邊碰到了一個頭大的事,那就是當和購買廠商聯絡送修事宜後,得到的回應是:「這顆 CPU 已經停產了,也沒庫存可以換新品,所以只能退現值」…

這邊也有試著反映希望可以向美國原廠詢問一下有沒有庫存,但是後來都還是被打槍了。

結果又花了點時間,才發現原來這顆 CPU 當時廠商是和「精技電腦」買的,所以也是跑去和他們連絡;但是精技電腦在 2021/12/24 開始就和 AMD 終止合作、並把相關業務丟給「威健實業」了…(參考)(其實還有一些讓人有點火大的狀況,但是這邊就先不提了)

總之,後來又花了點時間把 CPU 拿了回來,並決定自己跑 AMD 美國的 RMA 試試看了。

AMD 的 RMA 網址是:https://www.amd.com/en/support/kb/warranty-information/rma-form;這邊主要是填聯絡資訊,還有產品名稱、part number、以及序號,雖然有一欄問題描述,但是個人的經驗是…這邊簡單寫就好,因為之後他會重新問一次。

送出之後過沒幾天,會收到他以電子郵件的形式,詢問細節,包括了:

  • 處理器是否有物理性的損傷
  • 把 RMA 編號寫在紙上、然後和裝在主機板上的處理器一起拍照,應該是要證明 CPU 真的在手邊
  • 原始購買的證明(發票、中文的也可以)
  • 主機板型號以及 BIOS 版本
  • 問題的詳細描述

而這邊 Heresy 比較麻煩的,是發票早就被公司收走了,要拿到影本也有點麻煩…所以就先請 AMD 那邊確認是否還有貨可以換了。

AMD 客服也還不錯,也有幫忙確認當下還有庫存可以更換(也是這時候確認發票是中文的野也可以的),所以 Heresy 這邊就得再去想辦法生出當時的購買憑證了。(感謝當初的購買廠商)

把購買的發票電子檔寄給 AMD 後,在他確認完後,就告知可以進行換貨的流程了~這邊基本上就是要透過跨國物流、把包裝好的 CPU 寄到新加坡去了~

在打包的時候,記得只要寄 CPU 本體就可以了,散熱器、或是 CPU 本來的配件都不用寄;而 RMA 編號記得要明顯地寫在包裝外側,讓他可以清楚地被看見。

同時,這邊他也有建議透過 FedEX 或 DHL 會比較好;Heresy 這邊最後就是透過 DHL 寄出的,這次的寄送得自費。

而這邊的時間呢,7/1 號收到第一封信、最後通知可以寄出是 7/19,還滿久的;不過印象中 AMD 大致上都會在三個工作天內回信,中間很大一部分時間是 Heresy 這邊的問題…


後來比較搞笑的,是在 7/27 的時候收到兩封通知,分別是「AMD RMA# 0000000000 Passed」和「AMD RMA# 0000000000 Shipped」,感覺上似乎是替換的 CPU 已經寄出了?後者也有說,五個工作天內沒收到應該和他們連絡。

但是後來都還沒能收到,又發了一個 request 去問,才又告知「已經收到 CPU 了,但是替換品還沒寄出」…這也讓 Heresy 很好奇,前面那個「shipped」到底是什麼鬼?

後來到了 8/11,這邊又收到 AMD 寄來的電子郵件,說台灣 DHL 進口團隊(import team)這邊沒辦法根據當初給的電話連絡上人,所以沒辦法完成清關(現在要實名制委任、參考),所以要求重新給他們聯絡資訊。

回復之後沒多久,也就收到 DHL 的電話聯絡,並發簡訊要求透過 EZ Way 來填寫「紙本委任書」;而又過了幾天後,也終於拿到 CPU 了!(附註:不用關稅)

這段時間的狀況,大概是:8/8 新加坡寄出、當天到香港,8/9 到台灣,8/11 紙本委任、8/13 清關完成、8/15 拿到;如果能第一時間連絡上的話,應該可以早兩天拿到?


而換貨回來的 CPU 看起來應該是全新品,包裝和當初買到的應該是一樣的,所有配件也都有。

不過話說,好像也沒聽過 CPU 真的在維修就是了;只是本來還在想 RMA 的東西會不會和市售品有不同的包裝做區別就是了。

個人覺得比較可惜的,是由於 Threadripper 3000 基本上是目前 AMD TRX40 唯一的 CPU、也沒有升級更換的可能性,所以也不可能換回來更新的東西了。

話說,AMD 大部分的主機板都可以跨好幾代升級,但是 TRX40 到現在還是只有 Threadripper 3000 可以用,某種意義上真的是 AMD 目前最悲劇的平台了… orz

總之,裝上回來的 CPU 後,電腦也就復活、可以正常開機看到螢幕了!

但是,沒想到接下來看到的就是下面的畫面:

簡單講,就是因為換了新的 CPU,所以韌體 TPM 的內容與結構也會跟著變,而相關的功能,可能就會受到影響;這邊的選項有兩個:

  • 按「Y」來 reset TPM,但是如果有使用 BitLocker 或啟用加密功能的話,那就需要 recovery key 才能開機了。
  • 按「N」保持 TPM 的狀態,firmware TPM 會被關閉。

也就是說,如果有開啟 BitLocker(參考)的話,在換了 CPU 之後,有加密的資料會因此無法存取!要恢復的方法,就得靠之前存下來的 recovery key 才行了!

而之前如果沒有儲存 recovery key 的話,就只能先把 CPU 換回舊的,產生 recovery key 後再換成新的 CPU 了~

還好 Heresy 開啟 TPM 只是為了安裝 Windows 11,並沒有真的去使用他的加密功能,所以這邊就直接按 Y 來重置 TPM 了。

而開機進了 Windows 後…恩,在登入畫面馬上就告知 Windows 的 PIN 碼失效了,要重新設定才行。

果然,這些安全功能都是很麻煩的。 XD


印象中,以前 Surface Pro 在要進安全模式的時候,也會需要 recovery key(修復金鑰);這應該代表了 Surface Pro 預設就開啟了 BitLocker?

感覺上,以後買套裝電腦的話,最好先檢查一下 BitLocker 有沒有開啟?有的話要記得把 recovery key 自己保存好啊~否則搞不好哪天會因為 CPU 壞了,結果硬碟資料就讀不出來了。 XD

對「AMD Ryzen Threadripper 3970x 原廠 RMA 簡單紀錄」的想法

  1. TPM加密RAID這事情我還沒聽說過,理論上也不切實際,畢竟RAID壞盤壞硬件都是期望內發生,基於硬件設備的恢復密鑰在數據中心這個級別根本沒法管理,因爲目前沒聽說過各大存儲廠商有相應的協議標準,無法做集中管理。
    正常來講都是軟件級別比硬件級別更可靠也更靈活。
    當然摩根這種大戶,後臺應該是有個專門的IT機構做專用開發,不會像外界其他IT公司一樣一大堆客戶,搞私有協議也沒什麼不可能。

  2. CPU損壞是真的極爲少見。我遇到過的CPU損壞大多數都是公司服務器的,而且都是從二手市場收上來的志強系散片,本身都是爲了做開發測試用的。
    我自己的桌面機2020年壞掉,因爲沒有條件,最終只能確定是電源主板CPU三者其中一個或者三個全壞,然後拍了照片發到社區,多數人都說是CPU壞了讓我換CPU。結果我去年年末收了個Hasewell的二手主板(感覺再不收就真的快沒有了),然後用橡皮蹭蹭CPU,就好了。結果只是針腳接觸不良。只不過舊主板是真的壞掉了。
    TPM這種加密硬件在開源社區是真不受待見,主要是一旦硬件有損壞,那麼大概率資料就得拜拜,而且現在加密算法都是靠AES,CPU都是自帶這個指令集的,連ARM都支持AES指令集了,TPM根本沒優勢。

    • 盒裝 CPU 會掛掉真的也是…罕見啊…玩了幾十年了,自己第一次送。 XD

      至於 TPM…大概就是只有企業怕硬碟被幹走會用? o_O

      • 我是真的沒遇到過送修CPU的情況,在公司的時候服務器主板內存電源可以說都送修過,唯獨沒有CPU,公司甚至經常無風扇就開搞,也沒燒過。
        企業加密,我接觸過的公司,一般來講或者乾脆沒有加密(我在公司也談過很多次,就是敵對廠商會從客戶那繞路買我們的設備然後拆硬盤,老底都爆光了,結果公司不當回事,這是也不歸我管),或者是LUKS,不過密鑰是放在硬盤上的所以其實就是增加了點複雜度。
        數據層面的加密還是都用的基於密碼或者證書文件的私有加密軟件或者VeraCrypt這種開源軟件,畢竟有要把資料到處拿着走或者保存到服務器端的需求,TPM更是不能用。

        不過這麼一想,如果TPM跟主板和CPU都是綁定的話,倒是很有可能防止別人從服務器主機上的硬盤中直接偷資料,或許也是個辦法。

        • 極端案例:https://ccc.technews.tw/2022/09/21/morgan-stanley-fine-35m-for-harddrive-sold/
          這個有開 TPM 可能就不會被罰了 XD
          (來亂的

          不過認真講,很多公司真的都不重視資安就是了…
          或是只走形式上的認證。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.