tin tức Tất tần tật về vụ việc CPU AMD Ryzen 7000 lên bàn thờ ngắm gà

Morgan le Fay

Senior Member

Update 1: Thử nghiệm của der8auer - Lỗi tiềm tàng liên quan bộ nhớ EXPO​

*der8auer là giám đốc công ty chuyên giải pháp tản nhiệt nổi tiếng - Thermal Grizzly, và cũng là người nổi tiếng trong giới OC
Video:

1. Der8auer xác nhận là vụ việc này ảnh hưởng tới toàn bộ nhà sản xuất bo mạch chứ không chỉ Asus. Vụ việc xảy ra ở các phiên bản BIOS cũ và hiện các hãng đã và đang tung ra bản cập nhật để hạn chế tình trạng này. Ai đang dùng AM5 thì hãy cập nhật lên BIOS mới nhất từ nhà sản xuất bo mạch. Hiện tình trạng cụ thể chưa được công bố nhưng sơ qua thì mời đọc tiếp topic...

2. Asus nói với der8auer rằng họ gỡ bỏ BIOS cũ đi vì họ nhận thấy BIOS cũ có đôi chút vấn đề với sensor theo dõi và về việc set thông số V-core. Họ cũng cho biết rằng họ đang làm việc chặt chẽ với AMD để giải quyết thông số của AMD EXPO và voltage.​
rqp1yu.png

Fig 1. Lời nhắn của Asus cho der8auer về vụ việc

3. der8auer cũng chỉ ra điểm khác nhau giữa các CPU, CPU V-cache bị cháy và CPU none V-cache bị cháy:
  • Với các CPU V-cache, phần bị cháy nằm ở VDDCR core hay là Core Voltage và lẹm chút sang IOD
  • Với các CPU none V-cache, phần bị cháy nằm ở IOD
ed1zdv.png
bt11ne.png

Fig 2. 7950x3D bị cháy và vị trí ở trên die (mũi tên - và bao gồm cả IOD như ở hình dưới)


4bxean.png
7r6bii.png

Fig 3. 7700x bị cháy và vị trí ở trên die (khoanh tròn)

4. Ngoài các mẫu kể trên, còn một CPU mà der8auer và đội ngũ của anh nhận được từ một người khác từ cách đây 3 tuần, nói rằng CPU của họ có IHS rất nóng. Con CPU này vẫn xảy ra hiện tượng tương tự như vậy khi der8auer dùng trên main Gigabyte của họ, và nó tự bung IHS, xuất hiện điểm đen như hình 4. Có thể thấy rằng vị trí tương đối tương đồng với vị trí Core Voltage.​
t9vn97.png

Fig 4. CPU có điểm đen bất thường

5. Do có tới tận 3 trường hợp khác nhau dính ba lỗi khác nhau, nhưng sau khi chú ý vào tuyên bố của Asus, der8auer cũng đã tự đặt vấn đề lại là, có thể việc ảnh hưởng này liên quan đến profile ép xung RAM - EXPO. Khi mà các trường hợp dính vấn đề này, người dùng hầu hết chạy ở thông số stock hết, chỉ trừ một thông số, đó là profile EXPO dành cho bộ nhớ. Với profile EXPO sau khi bật, nếu ai sử dụng Ryzen 7000 thì có thể biết, là mức voltage auto được đẩy lên tương đối cao sau khi thiết lập. Nhưng lại tiếp tục lại không phải vấn đề, khi mà anh lại test với mức voltage tận 1.5v với profile EXPO dành cho CPU Ryzen 5 7600 của mình, và không có gì bất ngờ xảy ra.
FDjGmyH.png

9zxd22.png
cvqw69.png

Fig 5. Core Voltage trước và sau khi dùng EXPO profile (MC Volt.)

i3peu8.png

Fig 6. Stress test Cinebench R23 30 phút với voltage 1.5v
6. Do không có công cụ test phù hợp và không có CPU dính lỗi tương tự ở trong lab, nên der8auer vẫn chưa thể tìm ra kết luận chính thức của mình. Hiện tại, ngoài der8auer thì còn Igor's lab và Gamer Nexus đang theo vụ việc này, đặc biệt là GN khi họ đang ưu tiên hàng đầu cho vụ việc này, đã liên hệ và mua lại CPU + GPU của một trong những người đầu tiên bị ảnh hưởng để kiểm tra nguyên nhân.

Vậy kết luận đưa ra là:

1. Chưa rõ nguyên nhân là gì nhưng theo nhận định của der8auer, nhiều khả năng liên quan EXPO profile gây ảnh hưởng Core Voltage ở các BIOS cũ?!
2. Ở BIOS mới nhất, cái tên bị réo nhất lần này đã ra BIOS khoá tính năng Offset Voltage và giới hạn Voltage xuống. Với các bên khác, MSI cũng đã ra BIOS giới hạn voltage; còn hai cái tên còn lại như Asrock và Gigabyte khuyến nghị bật máy ở auto nếu không có kinh nghiệm vọc và cập nhập BIOS mới nhất, với những người muốn tiếp tục vọc thì hãy cập nhật BIOS mới nhất và set mức Voltage xuống 1.2v (và nhớ stress test + dùng hwinfo để check lại nữa). Cũng lưu ý thêm là hệ thống sensor ở các BIOS cũ có vẻ hoạt động không hiệu quả, cập nhật BIOS mới có vẻ cho thông tin Sensor chính xác hơn. Cách giải quyết tạm thời vẫn là, hãy cập nhật BIOS mới nhất.

Update 2: Nhận xét của buildzoid

*buildzoid là tiến sĩ chuyên hệ thống nhúng và vi mạch, kiêm OC thủ nổi tiếng
Video:
  • Để có thể làm một con CPU thổi phồng lên được như thế thì cần rất rất nhiều nhiệt năng để có thể khiến silicon hoá lỏng và tạo áp suất khiến nó phồng rộp lên như thế. Để đạt được điều này thì buildzoid nghĩ ra hai khả năng có thể xảy ra:​
    • Lỗi sản xuất từ nhà máy kết hợp với việc chu kỳ nhiệt cao (thermal cycling stress): Lỗi sản xuất ở đây là hiện tượng đoản mạch trong chất nền (short circuit in substrate), nhưng giờ đây chu trình sản xuất có độ chính xác cực cao nên theo buildzoid thì trường hợp này khó xảy ra. Khi mà CPU phồng rộp như thế thì có thể gặp liên hoàn tình trạng đoản mạch ở trong đoạn phồng rộp này (do tính chất bán dẫn). Mà nếu hiện tượng phồng rộp này xảy ra, như nói ở trên, thì lại cần rất nhiều năng lượng nên khó khả thi. Trong trường hợp điều này có thể xảy ra, thì chỉ có một thứ có thể xảy ra, là đến từ V-core của VRM. Trường hợp khác cũng có thể dẫn đến việc này là AMD chỉnh rất ngu thông số nào đó và trong cùng một BIOS AGESA, các hãng cập nhật đều bị dính chưởng.​
    • Do chính chu kỳ nhiệt cao: Cái này là "lỗi phần cứng phổ biến" nhưng do nó khá ngẫu nhiên, trừ khi rơi vào trường hợp AMD bóp BIOS.​
  • Tổng kết lại thì buildzoid cho rằng "V-core SOC không phải nguyên nhân, mà nó là thằng dính chưởng từ nguyên nhân. Và nguyên nhân ở đây có thể là do hiện tượng đoản mạch ở VRM."​

Update 3: Tuyên bố chính thức từ đội ngũ marketing của Asus​

  • Để ổn định cấu hình EXPO cho bộ nhớ RAM, nhà sản xuất bo mạch đã tinh chỉnh làm cho V-soc cao bất thường. Do mỗi con CPU là khác nhau, nên một vài con chỉ cần chích ít voltage để có mức bus cho RAM cao hơn, nhưng một vài con lại cần có voltage cao.
  • Sau khi được xác nhận từ AMD về tình trạng này có thể xảy ra, Asus đã làm việc chặt chẽ với AMD để có thể ổn định lại thông số dành cho kits EXPO. Ở BIOS mới nhất của họ, để đảm bảo điều này không diễn ra thì họ đã limit voltage của V-soc xuống mức 1.3v.
  • Tất nhiên, khuyến cáo đưa ra vẫn là hãy update BIOS mới nhất.
  • Asus cũng khuyến khích dùng tản khí to nạc hoặc AIO 240mm trở lên để có thể phòng trừ cho sự cố này diễn ra.
~~~
Tổng kết lại vụ việc:
  • Asus push voltage của V-soc lên để ổn định EXPO profile cho RAM, mà do Ryzen 7000 V-cache nhạy cảm với V-soc khiến cho đa số bo mạch bị dính nằm ở Asus.​
  • Khuyến cáo cập nhật BIOS mới nhất để tránh tình trạng này nhất có thể.​
  • Bo mạch các hãng khác hầu như không gặp trường hợp này, vì không tham lam các hệ số như Asus. Các bo mạch nhận được BIOS limit voltage của Gigabyte và Asrock đã được ra mắt vài tuần trước, trong khi đồng hương MSI chỉ mới công bố báo chí BIOS vừa ra có tính năng này gần đây trong tình trạng này để marketing.​
  • Tình trạng này chỉ diễn ra ở BIOS cũ, ở BiOS mới thì nhiều người đã được giảm voltage cho CPU Ryzen 7000 trên các mẫu bo mạch Asus nói riêng và đã khắc phục trước đó cho các hãng khác nói chung.​
  • Nhưng tất cả lỗi chắc chắn là tại AMD vì tôi là anti AMD nên tôi nghĩ thế.​

Update 4: Drama time - Chắc chắn là tại AMD rồi... AMD chuẩn bị bị Tech Jesus tế sống #RIPAMD​

  • 1usmus, người làm ra công cụ tuning huyền thoại cho CPU Ryzen đã có một phàn hồi đáng chú ý (Hydra là công cụ tuning nổi tiếng ở thế hệ Ryzen trước, Zen 4 đáng tiếc ra mắt trong thời điểm mà vấn đề chính trị giữa Nga Ú, do ông này người Ú nên không maintain được trong thời điểm này). Phản hồi này cho rằng, AMD đã biết về sự nhạy cảm của Zen 4 với voltage từ đầu, nhưng họ muốn các bên reviewer giữ kín tiếng chuyện này. Đây không phải là mẫu CPU duy nhất bị và bo mạch thời điểm đó đã hỗ trợ tương thích voltage phần nào, nhưng thời gian gần đây các kits EXPO với tốc độ cao hơn (mức 6400 MT/s) được ra mắt, nên các bên dường như đã lơ là trong khâu kiểm thử.​
  • Ông cũng đưa ra mức giới hạn mà người dùng nên set trong BIOS để đảm bảo độ an toàn cho CPU như trên​

Update 5: Tỉ lệ đổi trả của Ryzen 7000 thấp nhất trong hai vòng đời trở lại đây​

gpvs00.png


ypwner.png


https://www.igorslab.de/en/extreme-load-peaks-measured-for-amds-ryzen-7000-cpus-also-in-idle/
q13l64.png


Liên tiếp ba nguồn tin khác nhau cho hay, tỉ lệ đổi trả của CPU Ryzen 7000 đang rất thấp, tức là tình trạng cháy CPU này dường như là lỗi cực kỳ hiếm gặp.

Update 6: AMD đưa ra thông tin chính thức về nguyên nhân vụ việc​

https://www.anandtech.com/show/1883...yzen-7000x3d-burnout-issues-caps-soc-voltages
  • AMD xác nhận lỗi này gặp khi mà một vài cấu hình từ bo mạch cho phép V-soc được đẩy lên cao để EXPO ổn định hơn.​
  • BIOS cập nhật mới nhất đã được ra mắt để giới hạn việc chích voltage tùm lum này.​
    • Hiện tại BIOS có hỗ trợ đã được các hãng ra mắt bản beta, riêng Asus và Asrock cũng nhanh chân biến nó thành bản chính thức:​
      • Asus với bản BIOS 1303.​
      • Asrock với bản 1.21.​
      • Gigabyte với bản F5d (stable) hoặc F8c (beta).​
      • MSI với bản cập nhật mới nhất (cảm ơn MSI vì tên BIOS đặt quá rối).​
  • AMD cũng ngầm xác nhận lỗi này có thể gặp ở bất cứ CPU Zen 4 nào chứ không riêng gì dòng V-cache.​
  • Với những trường hợp CPU có vấn đề thì có thể liên hệ với AMD qua AMD customer support (nhắn bằng tiếng Anh) để được hỗ trợ.​

Update 7: Thử nghiệm chi tiết của Gamer Nexus​

Do bài viết này dài rồi nên em sẽ làm thêm bài tổng hợp lỗi ở vid sau. Tóm tắt vid của GN gồm có:
1. Lỗi chủ yếu vẫn là Asus (và có thể các vendors khác): do không có cơ chế bảo vệ OCP (bảo vệ quá dòng) khi mà voltage vượt ngưỡng cần thiết. Asus cũng là vendors duy nhất đẩy ngưỡng EXPO voltage lên quá cao để có thể tương thích nhiều kits EXPO hơn.
2. AMD có lỗi ở chỗ đã không công bố guideline chi tiết đến các vendors cho vụ việc lần này, khi mà đến khi hàng loạt CPU bị lỗi thì họ mới bắt đầu tìm nguyên nhân hoặc công bố dần đến các vendors để khắc phục. Theo GN thì có vẻ như AMD vẫn đang gặp vấn đề về liên lạc đến các vendors, ví dụ khi mà thông tin về thermal strips ở ba vendors là MSI - Mông Đá - Gigay không hiển thị đúng cho CPU Bê Đê, của Asus đúng nhưng chập chờn, và điều này khiến cho CPU không thể tự thrott khi nhiệt vượt ngưỡng cần thiết.
3. Quá trình lên bàn thờ: khá dài nên sẽ cập nhật ở bài viết này
4. Với trường hợp của thím @delimart, có vẻ là một lỗi nữa của Asus, khi set thông số VDDIO quá thấp ở các BIOS cũ khiến cho hệ thống không ổn định, bị bug màn hình xanh. Ngoài ra còn một thông tin đáng chú ý là thông số set trong BIOS Asus có khả năng hiển thị không đúng.
5. AMD thông tin thêm là mọi trường hợp, kể cả trường hợp dùng EXPO, nếu CPU có vấn đề thì chỉ cần trực tiếp liên hệ đổi trả là được.

Do vid khá dài (gần 40 phút) nên đại ý tóm tắt ở trên, em sẽ cập nhật bài viết chi tiết khác sau, nay đi chạm cỏ tiếp đã.
 
Last edited:
Buildzoid bảo là do Short Circuit nhưng nguyên nhân như thế nào thì chịu, có CPU đo đạc các thứ mới biết được
 
:doubt: các con giời thử nghiệm Zen mới như Zen 1 năm nào thôi, sang 8xxx hay 9xxx hay 10xxx mới ổn định được
Cái này do tính năng Precision Boost của AMD boost volt quá tay làm chết chip.
Con Zen3 tôi đang xài cũng thế, toàn phải limit volt. Cũng may là mặc định chỉ lên được 1.4V, chứ lên chút nữa 1.5V không khéo con CPU của tôi cũng đi toi rồi.
 
Mình nghĩ ko phải do bios đâu. Agesa giống nhau mà thằng vol cao thằng vol thấp hồi năm ngoái mới ra. là thấy ảo ma canada rồi. Giờ lại cháy nổ nữa. Có khi do soc lỗi như thím kia đoán thật.

Sent from Xiaomi Mi 10 using vozFApp
 
lab xịn có tool hiển vi soi sili(p)con
có đồ điện thế chuyên dụng để test

Chủ yếu là kiến thức chứ có đưa mình điện kế mình cũng chẳng biết chích điện chân nào ra kết quả gì.. :nosebleed:
Phải hiểu rõ cấu trúc chíp nói chung cũng như là chíp amd nói riêng.

Sent from Xiaomi Mi 10 using vozFApp
 
Mình nghĩ ko phải do bios đâu. Agesa giống nhau mà thằng vol cao thằng vol thấp hồi năm ngoái mới ra. là thấy ảo ma canada rồi. Giờ lại cháy nổ nữa. Có khi do soc lỗi như thím kia đoán thật.

Sent from Xiaomi Mi 10 using vozFApp
tôi nói thẳng ra là do LGA éo thể chịu nổi volt cao như PGA
 
Back
Top