andi_sco schrieb:
Warum sollten sie es nicht können? Wobei man hier allerdings zwischen dem "PC" und "Mobile"-Feld auch trennen muss.
In den aktuellen Kernmärkten für ARM-Prozessoren ist SMT nicht wirklich vorteilhaft, weil bestimmte Punkte in den Kernen doppelt ausgelegt werden müssen und ebenso eine entsprechende Trennung der Threads voneinander sichergestellt werden muss.
Im Mobilebereich ergibt das nicht so viel Sinn.
Francis B. schrieb:
Arm Kerne sind in der Regel deutlich besser ausgelastet als x86/64, daher lohnt sich's meist nicht und es wird drauf verzichtet.
Nein, das kann man so an der Stelle nicht schreiben und auch nicht stehen lassen. Die Aussage, dass Arm-Kerne in der Regel deutlich besser ausgelastet sind, ist zu pauschal und weitgehend damit auch nicht richtig.
Auch bei Arm-Kernen kommt es regelmäßig dazu - gerade auch bei den dicken Kernen - dass Ressourcen brach liegen und nicht genutzt werden. Das ist kein spezielles Problem von x86. PowerPC - auch ein RISC-Design, das teilweise auch ähnliche Eckdaten wie die ARM-ISA hat - hat von IBM sogar 8-faches SMT spendiert bekommen.
Arm hat sich nur sehr lange auf den Mobile-Markt "fokussiert" und in diesem bietet SMT in der Regel keinen wirklichen Vorteil, sorgt jedoch dafür, dass man das Register-File vergrößerten muss, dass Daten getrennt werden können und Co. Das Kostet alles Transistoren und wurde daher auch vermieden.
Jetzt, wo Arm deutlich "dickere" Kerne für Server, PCs und Notebooks entwickelt, kann es jedoch sinnvoll sein, dass man eine SMT-Implementierung umsetzt. Gerade bei Servern als auch Client-PCs kommt es nicht auf jeden Transistor und jedes "mW" an. Im Server geht es darum, die Ressourcen möglichst "effizient" zu nutzen und damit meine ich nicht die Energieeffizienz, sondern je nach Gebiet, wie viele VMs man auf den Server werfen kann. Es geht dabei also darum, die Kerne möglichst "effizient" auszulasten und mit SMT kann man relativ zuverlässig pro CPU-Kern deutlich mehr virtuelle Kerne aufziehen, als wenn die CPU kein SMT kann.
Und jetzt, wo Intel als auch AMD selbst in die Regionen von 128 und 192 Kernen vorstoßen/vorgestoßen sind - und 256 sind ja auch schon angekündigt - verliert Arm das "Kernduell". Entsprechend um hier mit Intel als auch AMD bei den Threads mitzuhalten, ist es durchaus sinnvoll nun SMT zu implementieren. Mit einem überschaubaren Aufwand an Transistoren, kann man einen zweiten Thread aufziehen und die Auslastung verbessern.