Arm Cortex-A77 - όλα όσα πρέπει να γνωρίζετε

Συγγραφέας: Randy Alexander
Ημερομηνία Δημιουργίας: 2 Απρίλιος 2021
Ημερομηνία Ενημέρωσης: 1 Ιούλιος 2024
Anonim
Arm Cortex-A77 - όλα όσα πρέπει να γνωρίζετε - Τεχνολογίες
Arm Cortex-A77 - όλα όσα πρέπει να γνωρίζετε - Τεχνολογίες

Περιεχόμενο


Μαζί με τον νέο επεξεργαστή γραφικών Mali-G77 και τον επεξεργαστή οθόνης Mali-D77, η Arm έχει αποκαλύψει τον τελευταίο σχεδιασμό CPU υψηλής απόδοσης - το Cortex-A77. Όπως και με το Cortex-A76 του περασμένου έτους, το Cortex-A77 έχει σχεδιαστεί για εφαρμογές υψηλής ποιότητας που απαιτούν την υπογραφή της Arm με χαμηλή κατανάλωση ενέργειας. Τα πάντα, από τα smartphones έως τους φορητούς υπολογιστές και αρκετά πιθανό πέραν αυτού.

Με το Cortex-A77, ο βραχίονας έχει στοχεύσει στις μέγιστες οδηγίες ανά αύξηση κύκλου / ρολογιού (IPC) που θα μπορούσε να διαχειριστεί πάνω από το Cortex-A76. Οι συχνότητες ρολογιού, η κατανάλωση ρεύματος και η περιοχή, έχουν σχεδιαστεί για να παραμένουν περίπου στο ίδιο πάρκο, αλλά ο νέος πυρήνας μπορεί να τραγουδήσει με περισσότερες οδηγίες ταυτόχρονα. Για να γίνει αυτό, η Arm έχει σχεδιάσει έναν ακόμα ευρύτερο πυρήνα από ό, τι πέρυσι και έχει κάνει κάποιες βελτιώσεις για να κρατήσει τον πυρήνα της CPU να τροφοδοτείται με πράγματα που πρέπει να κάνετε. Αλλά πριν φτάσουμε σε αυτό, ας βάψουμε τους αριθμούς επισκόπησης και επιδόσεων υψηλού επιπέδου.


Επίθεση στόχων απόδοσης

Τον Αύγουστο του 2018, ο Arm ενέκρινε έναν χάρτη πορείας της CPU μέχρι το 2020. Από το Cortex-A73 του 2016 έως το σχεδιασμό του "Hercules" του 2020, η εταιρεία υπόσχεται αύξηση κατά 2.5 φορές στις υπολογιστικές επιδόσεις. Ένα δίκαιο κομμάτι αυτής της τεράστιας προβολής ολοκληρώθηκε με τη μεγάλη μετατόπιση της μικροαρχιτεκτονικής με τις υψηλότερες σύγχρονες ταχύτητες ρολογιού Cortex-A76 και τη μετακίνηση από 16 σε 10 και τώρα κατασκευή 7nm με 5nm να ακολουθήσει. Περίπου 1,8 φορές από τα κέρδη του χάρτη πορείας έχουν ήδη επιτευχθεί από πέρυσι, ενώ το Cortex-A77 προσφέρει περίπου 20% περαιτέρω ώθηση IPC. Αυτό μας φέρνει καλά στο δρόμο για τον στόχο του Arm 2,5x, παρόλο που οι κινητές συσκευές με περιορισμένο προϋπολογισμό ισχύος και θερμικής ενέργειας δεν περιμένουν να δουν όλα αυτά τα κέρδη.

Για σύγκριση, το περυσινό Cortex-A76 παρείχε περίπου 30-35% αύξηση σε σχέση με το Cortex-A75. Φέτος εξετάζουμε ένα πιο αθόρυβο, αλλά ακόμα σημαντικό, κέρδος IPC 20% μεταξύ των A77 και A76. Αυτά είναι καλά νέα, διότι σημαίνει μεγαλύτερη απόδοση, ενώ ταυτόχρονα παραμένουν παρόμοιοι περιορισμοί θερμικής και ισχύος όπως και πριν. Το συμβιβασμό είναι ότι το A77 είναι περίπου 17 τοις εκατό μεγαλύτερο από το A76, έτσι θα κοστίσει λίγο περισσότερο από την άποψη της περιοχής πυριτίου. Εάν θέλετε μια σύγκριση με τους ηγέτες της επιφάνειας εργασίας, η AMD κατάφερε να ενισχύσει την IPC κατά 15% μεταξύ Zen2 και Zen +, ενώ η IPC της Intel παρέμεινε ουσιαστικά στατική για χρόνια.Φυσικά μιλάμε για διάφορα τμήματα της αγοράς εδώ, αλλά αυτό δείχνει πώς η ομάδα σχεδιασμού CPU της Arm έχει κάνει εντυπωσιακά κέρδη στις τελευταίες γενιές.


Μια προσφορά αύξησης της απόδοσης κατά 20% προσφέρεται για SoCs που βασίζονται στο Cortex-A77 επόμενης γενιάς

Το καράβι εδώ είναι ότι το A76 σηματοδότησε μια σημαντική μικροαρχιτεκτονική μετατόπιση με τεράστια κέρδη απόδοσης, ενώ βρισκόμαστε πίσω σε βελτιώσεις στο επίπεδο βελτιστοποίησης με το A77. Με το πέρασμα από το δρόμο, ας σκεφτούμε τι νέο υπάρχει στο Arm Cortex-A77.

Το Cortex-A77 βασίζεται στη μικροαρχιτεκτονική A76

Το κλειδί για την κατανόηση της διαφοράς μεταξύ των Cortex-A77 και A76 είναι να κατανοήσουμε τι εννοούμε με έναν "ευρύτερο" σχεδιασμό πυρήνα. Ουσιαστικά, μιλάμε για την ικανότητα εκτέλεσης περισσότερων οδηγιών για κάθε κύκλο ρολογιού, πράγμα που αυξάνει την απόδοση του πυρήνα. Υπάρχουν δύο σημαντικά μέρη για να επιτευχθεί αυτό το δικαίωμα - αύξηση του αριθμού των μονάδων εκτέλεσης για να γίνει η επεξεργασία και διασφάλιση ότι αυτές οι μονάδες διατηρούνται καλά τροφοδοτείται με τα δεδομένα. Ας ξεκινήσουμε με το δεύτερο μέρος και επικεντρωνόμαστε στα τμήματα αποστολής, κρυφής μάζας και κλάδου του SoC.

Το Cortex-A77 βλέπει μια αύξηση 50 τοις εκατό για την αποστολή πλάτος, μέχρι έξι οδηγίες ανά κύκλο από τέσσερις με το A76. Αυτό σημαίνει περισσότερες οδηγίες που κατευθύνονται στον πυρήνα εκτέλεσης για κάθε κύκλο ρολογιού για μεγαλύτερο δυναμικό απόδοσης. Το παράθυρο εκτέλεσης εκτός σειράς είναι επίσης μεγαλύτερο, αυξάνοντας σε 160 καταχωρήσεις για να εκθέσει περισσότερους παραλληλισμούς. Υπάρχει μια οικεία μνήμη cache 64K, ενώ το Buffer Target Buffer (BTB), το οποίο περιέχει διευθύνσεις για τον πρότυπο κλάδου, είναι 33% μεγαλύτερο από ό, τι προηγουμένως για να χειριστεί την ανάπτυξη παράλληλων οδηγιών. Τίποτα ασυνήθιστο εδώ, είναι ουσιαστικά μια ευρύτερη έκδοση του σχεδιασμού του περασμένου έτους.

Η πιο ενδιαφέρουσα προσθήκη στο μπροστινό μέρος είναι η ολοκαίνουργια μνήμη cache 1.5K MOP, η οποία αποθηκεύει μακροεντολές (MOP) που τροφοδοτούνται από τη μονάδα αποκωδικοποίησης. Η αρχιτεκτονική CPU του Arm αποκωδικοποιεί τις οδηγίες από την εφαρμογή του χρήστη σε μικρότερες μακρο-λειτουργίες και έπειτα προς τα κάτω σε μικροεπεξεργασίες που αντιλαμβάνεται ο πυρήνας εκτέλεσης. Μπορείτε να δείτε αυτό στο παραπάνω διάγραμμα στην ενότητα αποκωδικοποίησης. Η μνήμη cache του MOP χρησιμοποιείται για να μειώσει την ποινή του κόστους των χαμένων κλάδων και εκκενώσεων, καθώς κρατάτε τα μακροεντολές αντί να τα αποκωδικοποιείτε ξανά και αυξάνετε τη συνολική απόδοση του πυρήνα. Λήγει από το MOP παρά το i-cache παρακάμπτει το στάδιο αποκωδικοποίησης, αποθηκεύοντας έναν κύκλο. Ο βραχίονας δηλώνει ότι η μνήμη cache του MOP μπορεί να χτυπήσει ένα ποσοστό επιτυχίας 85% ή περισσότερο σε ένα φάσμα φόρτων εργασίας, καθιστώντας το μια πολύ χρήσιμη προσθήκη στην τυπική i-cache.

Προχωρώντας προς το τμήμα πυρήνα εκτέλεσης της CPU, σημειώστε την προσθήκη μιας τέταρτης μονάδας ALU και μιας δεύτερης μονάδας υποκαταστήματος. Αυτή η τέταρτη ALU ενισχύει τον γενικό αριθμό του επεξεργαστή που τσακίζει το εύρος ζώνης κατά 50%. Αυτή η επιπρόσθετη ALU είναι ικανή για βασικές οδηγίες ενός κύκλου (όπως ADD και SUB) συν δύο ακέραιες λειτουργίες όπως ένας πολλαπλασιασμός. Δύο από τις άλλες μονάδες ALU μπορούν να χειριστούν μόνο τις βασικές οδηγίες ενός κύκλου, ενώ η τελική μονάδα φορτώνεται με πιο προηγμένες μαθηματικές λειτουργίες όπως διαίρεση, πολλαπλάσια συσσώρευση κλπ. Η δεύτερη μονάδα διακλάδωσης μέσα στον πυρήνα εκτέλεσης διπλασιάζει τον αριθμό ταυτόχρονων αλμάτων ο πυρήνας μπορεί να χειριστεί, πράγμα που είναι χρήσιμο σε περιπτώσεις όπου δύο από τις έξι οδηγίες που αποστέλλονται είναι άλματα κλάδων. Αυτό ακούγεται λίγο περίεργο, αλλά οι εσωτερικές δοκιμές στο Arm έδειξαν οφέλη από την απόδοση αυτής της δεύτερης μονάδας.

Το Cortex-A77 προσφέρει βελτιωμένο παραλληλισμό και μια νέα λήψη σε προ-τροφοδοσίες

Άλλες τροποποιήσεις στον πυρήνα της CPU περιλαμβάνουν την προσθήκη ενός δεύτερου αγωγού κρυπτογράφησης AES. Οι αγωγοί αποθήκευσης δεδομένων διαθέτουν τώρα αποκλειστικές θύρες εκδόσεων για να διπλασιάσουν το εύρος ζώνης του προβλήματος μνήμης. Αυτές οι θύρες είχαν προηγουμένως μοιραστεί με τις μονάδες ALU, οι οποίες μερικές φορές θα μπορούσαν να γίνουν εμπόδια. Υπάρχει επίσης ένας επόμενος-γενιάς επεξεργαστής δεδομένων για τη βελτίωση της απόδοσης της ηλεκτρικής ενέργειας, ενώ ταυτόχρονα αυξάνει το εύρος ζώνης στο σύστημα DRAM.

Μέρος αυτού του συστήματος στο Cortex-A77 διαθέτει επίσης ένα ολοκαίνουριο σύστημα προφόρτωσης "ευαισθητοποίησης στο σύστημα". Αυτό βελτιώνει την απόδοση μνήμης που βασίζεται στο ευρύ φάσμα μετρήσεων πυρήνα CPU, χωρητικότητες προσωρινής αποθήκευσης και λανθάνουσες περιόδους λειτουργίας και διαμορφώσεις υποσυστημάτων μνήμης μέσα στις τελικές συσκευές. Το ειδικό υλικό για να μιλήσει στη Μονάδα Δυναμικού Προγραμματισμού (DSU) ως μέρος ενός συμπλέγματος επεξεργαστών DynamiQ, το οποίο παρακολουθεί τη χρήση της κοινόχρηστης μνήμης L3. Ο πυρήνας διαθέτει δυναμικά επίπεδα απόστασης και επιθετικότητας για τη μείωση της χρήσης της κρυφής μνήμης σε καταστάσεις όπου το εύρος ζώνης L3 περιορίζεται από άλλους πυρήνες CPU. Οι πυρήνες υψηλότερης απόδοσης, όπως το Cortex-A77, είναι πιο πιθανό να κορεσθούν από τη μνήμη της DSU, ενώ οι πυρήνες κατώτερης ισχύος όπως το A55 είναι απίθανο.

Συνδυάζοντας όλα μαζί

Υπάρχουν πολλές μικρές αλλαγές στο Cortex-A77 που προσθέτουν μέχρι κάποιες ουσιαστικές διαφορές με τον προκάτοχό του. Με λίγα λόγια, η νέα μνήμη cache του A77, σε συνδυασμό με ένα ευρύτερο και μακρύτερο παράθυρο διδασκαλίας, βοηθά να κρατηθούν οι πράκτορες ALU, Branch και μνήμης γεμάτοι με πράγματα που πρέπει να κάνουν. Ο σχεδιασμός Cortex-A76 της Powerhouse έχει επεκταθεί για να βελτιώσει ακόμα περισσότερο την απόδοση του με το A77, χωρίς να βασίζεται σε υψηλότερες ταχύτητες ρολογιού.

Η μεγαλύτερη αύξηση των επιδόσεων στο Cortex-A77 φτάνει με τη μορφή ενός ακέραιου αριθμού και ενός πτητικού μοτίβου. Αυτό επιβεβαιώνεται από τα εσωτερικά σημεία αναφοράς του Arm, τα οποία επιδεικνύουν αύξηση της απόδοσης κατά 20 έως 35 τοις εκατό σε δείκτες αναφοράς ακέραιων και κυμαινόμενων σημείων SPEC αντιστοίχως. Οι βελτιώσεις στο εύρος ζώνης μνήμης κάθονται κάπου μεταξύ 15 και 20 τοις εκατό, υπογραμμίζοντας και πάλι ότι τα μεγαλύτερα κέρδη προέρχονται από τη μορφή της τραγανιστικής αριθμού. Συνολικά, αυτές οι βελτιώσεις προσδίδουν στο A77 κατά μέσο όρο αύξηση κατά 20% σε σχέση με την προηγούμενη γενιά. Μπορούμε επίσης να δούμε κάποια περαιτέρω, πιο οριακά οφέλη ως αποτέλεσμα πιο προηγμένων διαδικασιών παραγωγής 7nm αργότερα αυτό το έτος ή στις αρχές του 2020.

Όσον αφορά τα smartphones, τα SoCs που κινούνται με Cortex-A77 προορίζονται για κορυφαία προϊόντα υψηλής απόδοσης. Ο βραχίονας αναμένει πλήρως να δούμε τον σχεδιασμό ισχύος να χρησιμοποιεί 4 + 4 bit.LITTLE βασικές ρυθμίσεις. Δεδομένης της αυξημένης δυναμικότητας και του ελαφρού χτυπήματος στο μέγεθος της περιοχής του A77, θα δούμε πιθανώς ότι οι σχεδιαστές της SoC θα συνεχίσουν να ακολουθούν την τάση 1 + 3 + 4 ή 2 + 2 + 4. Με έναν ή δύο ισχυρούς μεγάλους πυρήνες με μεγαλύτερες κρυφές μνήμες και υψηλότερα ρολόγια, που υποστηρίζονται από 2 ή 3 πυρήνες A77 με μικρότερα μεγέθη κρυφής μνήμης και χαμηλότερα ρολόγια για εξοικονόμηση ενέργειας και περιοχής. Τελικά το Cortex-A77 συλλαβίζει καλά πράγματα για τα τσιπ smartphone και την αυξανόμενη αγορά για φορητούς υπολογιστές που βασίζονται πάντα στο Arm. Παρακολουθήστε τις αναγγελίες πυριτίου αργότερα φέτος.

Αυτή την εβδομάδα μάθαμε σχεδόν όλα όσα υπάρχουν για να μάθουμε σχετικά με τα επερχόμενα mid-range της Pixel 3a και Pixel 3a XL της Google. Αυτό δεν σημαίνει ότι η είσοδος / έξοδος Google της επόμενης...

Αυτή η εβδομάδα είδε την απελευθέρωση της πρώτης εγκατάστασης της φωτογραφικής μηχανής 108MP στο Xiaomi Mi Note 10. Η φωτογραφική μηχανή είναι σίγουρα εντυπωσιακή σε χαρτί, αλλά η Google και η Apple ε...

Δημοφιλή Στην Περιοχή