Frage Elektromigration bei kleinerer Fertigung/shrink AMD (Intel)

Mitglied seit
Mrz 6, 2021
Beiträge
198
Bewertungspunkte
84
Punkte
28
Standort
Bayern
Moin zusammen.

Es wird in den letzten Jahren dank zb. AMD Ryzen immer wieder die kleinere Fertigung gehyped um die effizienz zu steigern.Nun stelle ich mir die Frage wie es dabei mit der Elektromigration also den elektrischen verschleiß aussieht.Der Hintergrund für meine Frage ist das mir eine Aussage zu Ohren gekommen ist daß bei Simulierungen eines Lebenszyklus von 5 Jahren durch Mainboardhersteller die Fehlerquote unter anderem bei AMD extrem stark ansteigen soll (Drops / instabilität).
Wieviel Wahrheit hinter diesen Aussagen steht ist natürlich immer schwer einzuschätzen,interessiert mich jedoch sehr zumal ja AMD mit den Threadripper PRO 5xxx Modellen für Server kommt ,die dann ja Sicherlich auch in 7µm gefertigt werden.Klar ist eine Standard Desktop CPU nicht mit einer Server CPU vergleichbar da die Server CPUs selten bis nie übertaktet werden, dafür werden Server CPUs dauerhaft belastet.
Ist dieser Hintergrund der Grund warum Intel an der (noch) an der etwas größeren Struktur festgehalten hat bzw so lange auf den 14µm rumgeritten ist und nun "nur" in 10µm fertigt?
Hier würde mich auch die Meinung von Igor interessieren, der wesentlich tiefere Einblicke durch direkten Kontakt mit den Herstellern hat.
Wenn hinter dieser stärkeren eingeplanten Elektromigration Warheit steckt fällt mir im gleichen Moment geplante obsoleszenz ein,also geplante reduzierte Lebensdauer.
Dieses würde für die Endverbraucher sicherlich die Kaufentscheidung verändern und würde mir persönlich auch dabei helfen Kaufempfehlungen zu geben wenn ich entsprechd angesprochen werde.

Was denkt ihr über dieses Thema bzw. hat jemand entsprechende Kenntnisse oder schon ähnliches gehört ?
 
Hallo BamBamnoob

Die Entwicklung von neuen Prozessorfertigungen ist ein hochkomplexes Milliardenprojekt. Man kann das vielleicht etwas mit der Entwicklung eines neuen Flugzeugtyps vergleichen. Daran sind über hundert Firmen beteiligt, die jede eine Komponente dafür entwickelt, die dann alle zusammen die Herstellung des ganzen ermöglichen. Aus dem ganzen Entwicklungsprozess dringen aber nur einzelne technische Details an die Öffentlichkeit, die dann von der Presse ausgeschlachtet und verbreitet werden. Das sollte man bei solchen Informationen immer im Hinterkopf behalten. Mit etwas technischem Verständnis kann man manchmal abschätzen, ob die Aussage Sinn macht. Wenn man aber einmal mit einem Fachmann aus einer Branche plaudert, bekommt man schnell einen viel besseren Einblick in ein Fachgebiet. Aber man merkt dann auch, dass man nur einen kleinen Teil des grossen Ganzen gesehen hat.

Elektronenmigration ist bei der Entwicklung kleinerer Prozessoren ein wichtiges Thema. Man möchte ja die Leiterbahnen schmaler und die Abstände kleiner machen. Kleinere Leiterbahnen haben einen höheren Widerstand und dadurch mehr Verlust. Die dünnere Isolation zu den anderen Leiterbahnen isoliert weniger gut. Dadurch migrieren mehr Elektronen zu den Leiterbahnen daneben. Durch diese Verluste braucht man mehr Strom und das Signal kommt am Ende der Leitung nicht mehr gleich sauber an. Wenn das Material durch die Elektronenmigration altert, können Kurzschlüsse entstehen und der Chip unbrauchbar werden.

Die möglichen Isolationsmaterialien in dieser Grössenordnung kann man vermutlich an einer Hand abzählen. Die Schichten sind nur noch ein paar Atome dick. Somit bracht man ein Element, das man in dieser Dicke zuverlässig auftragen kann. Um zu erfahren, wie langlebig die aktuell verwendete Technik ist und in welche Richtung weiter entwickelt wird, müsste man mit jemandem reden, die genau in diesem Bereich arbeitet.

Ist dieser Hintergrund der Grund warum Intel an der (noch) an der etwas größeren Struktur festgehalten hat bzw so lange auf den 14µm rumgeritten ist und nun "nur" in 10µm fertigt?
Damit eine neue Fertigung in Betrieb genommen werden kann, müssen die Techniken in jedem Teilbereich so viel weiter entwickelt sein, dass sie sehr zuverlässig funktionieren. Für jeden der über hundert Produktionsschritte müssen die nötigen Materialien in entsprechender Feinheit produziert und angewendet werden können. Jede Maschine in der Produktionskette muss ihren Arbeitsschritt zuverlässig ausführen. Wenn nur bei einem der Schritte einige falsche Atome am falschen Ort landen, funktioniert das ganze nicht mehr. Ich glaube nicht, dass eine Firma wie Intel eine bereits angekündigte Strukturverkleinerung um mehr als 3 Jahre verschieben würde, wenn sie nicht mit einigen Problemen zu kämpfen gehabt hätten. An welchen Punkten die Entwicklung nicht die nötige Zuverlässigkeit erreichte, kann man von aussen aber nicht sagen.

Wenn hinter dieser stärkeren eingeplanten Elektromigration Warheit steckt fällt mir im gleichen Moment geplante obsoleszenz ein,also geplante reduzierte Lebensdauer.
Das Argument der geplanten Obsoleszenz hört man in verschiedensten Bereichen immer wieder. Die physikalischen Schwierigkeiten auf die man bei einer solchen Entwicklung stösst, hat sich aber niemand ausgesucht und schon gar nicht herbei gewünscht. Da arbeiten hunderte von Entwicklern daran, wie man mit den Problemen umgehen kann. Jeder von denen möchte seine Arbeit gut machen und seinen Beitrag zum Projekt bringen. Von geplanter Obsoleszenz kann man reden, wenn man die Produktion eines Gerätes von hier in eine billige asiatische Fabrik verlagert und verlangt zu sparen wo es geht (oder auch nicht). Vor der Entwicklung in der Hightech-Elektronik habe ich aber zu viel Respekt, um von so etwas zu reden. Bei Billigprodukten wüsste man ja, wie man es besser machen kann, aber man macht es absichtlich nicht um den Gewinn zu optimieren. Das ist etwas anderes, als wenn man nochmals ein paar Milliarden in die Hand nehmen muss, um die Entwicklung weiter zu bringen. Da hat keiner ein Interesse durch bewusst eingebaute Fehler das ganze Produkt schlechter zu machen.
 
Die Isolation ist ein Thema, aber die Meisten unterliegen immer wieder dem Trugschluss mit dem höheren Widerstand durch geringere Breite. Sicher, die Bahnen werden schmaler, nur vergisst man gern, dass sie damit auch kürzer werden. In der Gesamtbetrachtung beibt also der Widerstand in etwa gleich. Solange man mit der neuen Fertigung auch die Spannungen absenken kann, relativiert sich auch die Problematik der Isolation, denn die Elekromigration entsteht primär durch Spannungen und nicht durch die Ströme. Man muss wirklich genau abwägen, wo man die Probleme verortet. Ich sehe primär, auch und vor allem bei Stacks, das Problem der hohen Wärmestromdichte und die Abführung der Abwärme. Maturing durch Hitze ist ebenfalls ein Thema, das man nicht außer auch lassen darf. :)
 
@Martin Gut : Es klingt sehr plausibel wenn Du sagst daß niemand will daß sein Produkt schlecht ist oder es in Kauf nimmt, jedoch muß man ja in gewisser weise auch im Hinterkopf behalten daß wenn ein Produkt zu gut ist und zu lange hält auch weniger Umsatz im langfristigen Zeitraum zu erwarten ist.Wenn also ein geplanter schleichender Verfall stattfindet beziehungsweise in Kauf genommen wird würde es mich nicht sehr wundern,da unter den Enthusiasten ja eher eine kurze Nutzungszeit üblich ist.Soll heißen Hardwarenerds (zu denen ich mich auch zähle) behalten ihre Hardware meist nicht lange genug um zu merken daß ein Leistungsabfall stattfindet.
Im Serverbereich darf soetwas natürlich nicht passieren was dann eine bessere selektion erfordert und somit höhere Preise durch höheren Ausschuß bedeutet.

@Igor Wallossek : Genau dieser Gedanke hat mich auch beschäftigt.Ich habe mich immer gefragt wieso die nominalen Spannungen bei AMD und am ende letztendlich auch bei Intel (Rocketlake/cometlake) so hoch sind und ob die entstehende Wärme nicht so gut für die Prozessoren ist.Ich sehe es an meinem 5800X , der doch sehr schnell sehr warm wird trotz Dark Rock 4 Kühler.Schon zur Zeit des Phenom II hab ich mich immer gefragt warum eine spannung von >1,4V gebraucht wird und als ich von Intel coffeelake zum 5800X gewechselt bin war das immer noch so.
Jetzt könnte man auch hier natürlich böses denken und auch hier verkaufsrelevante Hintergründe vermuten.
Ich selber habe mich auch sehr schwer getan die Finger vom Übertakten zu lassen.Nach kurzen Versuchen und zu hohen Temperaturen habe ich aber die Finger davon gelassen und arbeite lieber im Bereich vom undervolten.

Nachdem ich deine Aussage vom deaktivierten AVX-512 bei Alderlake gelesen habe und der damit verbundenen erwägung das es zur vermeidung der erhöhten Elektromigration sein könnte hat das bei mir die Alarmglocken schlagen lassen.

Das hat mich auch dazu bewegt diesen Fred entsprechend aufzumachen.Der Anstoß kam allerdings von jemandem der bei einem Mainboardhersteller arbeitet , der die Spannungen nicht für einen längeren Balken beim Benchmark frei gibt.
Das hat mich auch nach längerer Beschäftigung mit dem Thema Hardware etwas verunsichert , so daß ich mit dem Gedanken gespielt habe auf ein paar % mehr leistung zu verzichten und auf eine ältere und vermeindlich haltbarere Plattform zurückzukehren.
 
jedoch muß man ja in gewisser weise auch im Hinterkopf behalten daß wenn ein Produkt zu gut ist und zu lange hält auch weniger Umsatz im langfristigen Zeitraum zu erwarten ist.
In den 30 Jahren, die ich mich mit PCs befasse, habe ich diesen Vorwurf immer wieder gehört, aber er hat sich bei CPUs noch nie bestätigt. Den Vorwurf gab es schon lange, bevor ein Journalist das Wort Elektronenmigration entdeckt hat. Es gab in den 30 Jahren keinen Zeitpunkt, zu dem sich die Hersteller wirklich Sorgen darum machen mussten, dass nicht alles gekauft wird, was sie produzieren können. Klar, die Preise haben dadurch etwas geschwankt, aber mehr nicht. Vor 30 Jahren war ein PC nach 3 bis 4 Jahren nicht mehr brauchbar, weil er für neuere Software zu wenig Leistung hatte.

Heute steigt der Leistungsbedarf weniger schnell, so dass es für weniger anspruchsvolle Anwendungen und Nutzer meist erst nach etwa 10 Jahren ein Thema wird. Dadurch leben heute viele PCs auch länger. In diesem Zeitraum verändert sich auch die Steckplätze, Anschlüsse, Peripherie, Treiber und Programme so stark, dass zu altes nicht mehr mit dem aktuellen zusammen funktioniert. Wenn dann irgend etwas nicht mehr funktioniert und neu gemacht wird, zieht es oft mit sich, dass man auch anderes wechseln muss.

Die Prozessoren sind viel zu zuverlässig, als dass sie an diesem normalen Prozess etwas bedeutendes verändern würden. Bei den Prozessoren die aussteigen, passiert das meist schon in den ersten Monaten. Möglicherwiese sind sie irgendwo etwas unsanft behandelt worden. Danach ist die Ausfallrate aber vernachlässigbar klein. Die allermeisten belasten den PC auch zu wenig, dass solche Abnutzungserscheinungen überhaupt irgend wann bedeutend würden. Bei normaler Nutzung ist es auch nach 20 Jahren noch nicht wahrscheinlich, dass eine CPU ausfällt. Wenn sich die Wahrscheinlichkeit eines Ausfalls der CPU im Zeitraum von 20 Jahren auch von 1 auf 5 % vergrössern würde, hätte das auf die Nachfrage nach neuen PCs keinen spürbaren Einfluss. Wenn man sich Sorgen um eine sinkende nachfrage machen würde, wäre das also eine sinnlose Massnahme.

Nur weil jemand vielleicht die Möglichkeit hätte, geplante Obsoleszenz einzuplanen über Jahrzehnte einen Vorwurf daraus zu machen ist schon recht gewagt und auch respektlos gegenüber den Leuten die dort arbeiten. Wenn sich Vorwürfe über Jahrzehnte halten und sich nie etwas davon bestätigt, sollte man die Vorwürfe vielleicht auch mal überdenken oder einfach sein lassen. Nur dass etwas sein könnte, ist zu wenig Anlass eine Firma schlecht zu machen.
 
Es liegt nicht in meiner Absicht etwas respektloses gegenüber einem Hersteller zu äußern und ich habe aller größten Repekt vor Entwicklern von solch Komplexen Bauteilen.Mir ist eben nur zu Ohren gekommen daß es ein Problem geben kann nachdem ein Insider angerissen hat das der Entsprechende Hersteller 5 Jahre nutzung von Zen3 simuliert hätte und das es dort wohl zu starken Problemen gekommen sein soll... Ich sage bewußt soll weil ich nicht weiß wieviel Warheit da dran hängt ,wenn ich die Ergebisse nicht selbst gesehen habe.
Ich weiß aus erfahrung wie schwierig und komlex schon die entwicklung so einer einfachen Sache wie eine Kaffeemaschine ist.Da ist eine CPU mit dem entsprechenden drum rum schon wesentlich komplexer.
Ich weiß aber auch das bei immer kleinerer Produktion die Fertigung immer schwieriger wird und ich stelle deswegen auch nicht diese Frage auf einen Hersteller bezogen sondern allgemein,denn auch bei den GPUs wird das shrinking weiter fortschreiten und der Leistungshunger der Anwendungen bzw der Anwender wird oft durch Pushen ans Limit mit hilfe von Spannungserhöhung/Stromkonsum erkauft.
Ob und wieweit irgenein Hersteller geplante Obsoleszenz betreibt bekommen die Konsumenten sowieso erst mit wenn es soweit ist und ich werde mich hüten soetwas zu behaupten.Als die Hersteller der CPUs begonnen haben Wärmeleitpaste zu verwenden anstatt von Lot wurde auch schon über gewünschte Hardwareausfälle Spekuliert was sich bisher auch nicht bewahrheitet hat.
Fakt bleibt jedoch das es aufgrund der immer kleineren Fertigung zu Problemen mit der haltbarkeit kommen kann/könnte.
Und mich interessiert einfach wie groß aufgrund der immer kleineren und komplexeren Fertigung die "Gefahr" ist.Da die Hersteller sich nicht auf die Finger schauen lassen kann man als Konsument nur spekulieren und Gerüchte entstehen halt schnell.
Früher wurde auch behauptet das Übertakten die CPU lebensdauer halbiert, aber ich kenne Core 2 Duo E8400 die Locker 15 Jahre gelaufen sind mit Übertaktung.Gestorben sind dann eher die Boards oder Rams.Aber es ist halt was anderes ob man über 90µm spricht oder über 10/7/5 ,was momentan angestrebt bzw produziert wird.
Ob eine geplante Obsoleszenz vorliegt oder nicht lasse ich hierbei außen vor und habe es nur nach dem Motto "Ein Schelm wer dabei böses denkt" erwähnt.Denn wir Konsumenten erfahren mit sicherheit nicht was die hersteller einplanen oder nicht.

Heut zu Tage nutz kaum noch jemand einen PC 10 Jahre,da es irgendwann Treiberprobleme oder fehlende Leistung gibt.Und meist ist es so daß nicht nur mal die GPU getauscht wird sondern dann braucht man schnelleren Ram , die CPU kann die GPU nicht mehr bedienen ... Das ist natürlich auf häufige User bezogen.
Natürlich gibt es in großen Servern in Firmen usw noch genügend "alte" hardware die länger verwendet wird, es gibt ja schließlich auch noch maschinen und Fertigungen die mit Dos laufen ;)
Also lassen wir das Thema geplante Obsoleszenz einfach mal außen vor und bleiben bei der Lebensdauer durch die beeinflussung mit Spannung und wie @Igor Wallossek schon gesagt hat durch die Thermische belastung bei immer kleinerer Fertigung.
Mir stellt sich in Bezug auf die thermische Belastung auch die Frage inwieweit die Kühlung da eine Rolle spielt.Eine Wasserkühlung kühlt zB eine CPU "sanfter" ab da die Temperatur unterschiede zwischen Last und Idle bei schnellem wechsel nicht so groß sind wie bei Luftkühlung.
Ich habe da so gedanken aus dem Bereich der Autoindustrie wenn zB ein Krümmer durch schnelle thermische irgendwann reißt.
Wie groß ist die Gefahr bei so filigranem Material wie silizium.
 
Es war auch kein Vorwurf an dich. Es war mehr ein erhobener Zeigefinger für diejenigen, die ohne technische Kenntnisse ein paar bekannt gewordene Details in Vorwürfe umwandeln und damit ihre Theorien stützen die sie schon lange pflegen.
 
Oben Unten