那我就不買了!5090被曝虛擬化故障,云服務(wù)商懸賞1000美元解決問題
脆脆鯊

電競體育9月8報(bào)道?GPU 計(jì)算云服務(wù)提供商 CloudRift 在上個(gè)月發(fā)布公告,GeForce RTX 5090 和 RTX PRO 6000 已被證實(shí)存在可復(fù)現(xiàn)的虛擬化故障,導(dǎo)致顯卡無法使用
,直到整個(gè)系統(tǒng)重新上電 ,將懸賞 1000 美元(約 7128 元人民幣)解決這個(gè)問題。CloudRift 表示
,在一些配備 RTX 5090 和 RTX PRO 6000 顯卡的節(jié)點(diǎn)上,這些顯卡偶爾會(huì)完全無響應(yīng) —— 通常在使用虛擬機(jī)幾天后,或在啟動(dòng) / 關(guān)閉過程中看似隨機(jī)的時(shí)間點(diǎn)。一旦發(fā)生這種情況,顯卡就無法重新分配。唯一的解決辦法是重啟整個(gè)節(jié)點(diǎn)。CloudRift 已經(jīng)排除了大多數(shù)常見問題:IOMMU 的 quirks、內(nèi)核版本
、驅(qū)動(dòng)綁定以及 libvirt 的配置錯(cuò)誤。該公司的 H100s、B200s 和較舊的 RTX 4090 都在運(yùn)行穩(wěn)定,但這些較新的 RTX 顯卡給他們帶來了大麻煩。據(jù) Tom's Hardware 昨日報(bào)道,Proxmox 論壇和 Level1Techs 上的用戶也報(bào)告了類似的問題
。在其中一個(gè)案例中 ,Windows 虛擬機(jī)關(guān)閉后系統(tǒng)掛起,即使操作系統(tǒng)重啟后 GPU 也無法重新初始化 。另一位用戶描述了 Linux 虛擬機(jī)關(guān)閉時(shí) FLR 超時(shí)后主機(jī) CPU 軟鎖 ,切換 PCIe ASPM 或 ACS 設(shè)置等嘗試未能解決問題。
脆脆鯊
電競體育9月8報(bào)道?GPU 計(jì)算云服務(wù)提供商 CloudRift 在上個(gè)月發(fā)布公告,GeForce RTX 5090 和 RTX PRO 6000 已被證實(shí)存在可復(fù)現(xiàn)的虛擬化故障,導(dǎo)致顯卡無法使用
,直到整個(gè)系統(tǒng)重新上電
,將懸賞 1000 美元(約 7128 元人民幣)解決這個(gè)問題
。
CloudRift 表示
,在一些配備 RTX 5090 和 RTX PRO 6000 顯卡的節(jié)點(diǎn)上,這些顯卡偶爾會(huì)完全無響應(yīng) —— 通常在使用虛擬機(jī)幾天后
,或在啟動(dòng) / 關(guān)閉過程中看似隨機(jī)的時(shí)間點(diǎn)
。一旦發(fā)生這種情況,顯卡就無法重新分配
。唯一的解決辦法是重啟整個(gè)節(jié)點(diǎn)
。
CloudRift 已經(jīng)排除了大多數(shù)常見問題:IOMMU 的 quirks、內(nèi)核版本
、驅(qū)動(dòng)綁定以及 libvirt 的配置錯(cuò)誤
。該公司的 H100s、B200s 和較舊的 RTX 4090 都在運(yùn)行穩(wěn)定
,但這些較新的 RTX 顯卡給他們帶來了大麻煩
。
據(jù) Tom's Hardware 昨日報(bào)道,Proxmox 論壇和 Level1Techs 上的用戶也報(bào)告了類似的問題
。在其中一個(gè)案例中
,Windows 虛擬機(jī)關(guān)閉后系統(tǒng)掛起,即使操作系統(tǒng)重啟后 GPU 也無法重新初始化
。另一位用戶描述了 Linux 虛擬機(jī)關(guān)閉時(shí) FLR 超時(shí)后主機(jī) CPU 軟鎖
,切換 PCIe ASPM 或 ACS 設(shè)置等嘗試未能解決問題。