Arm Mali-G77 GPU - οι πλήρεις είσοδοι και έξοδοι

Συγγραφέας: Randy Alexander
Ημερομηνία Δημιουργίας: 3 Απρίλιος 2021
Ημερομηνία Ενημέρωσης: 1 Ιούλιος 2024
Anonim
Arm Mali-G77 GPU - οι πλήρεις είσοδοι και έξοδοι - Τεχνολογίες
Arm Mali-G77 GPU - οι πλήρεις είσοδοι και έξοδοι - Τεχνολογίες

Περιεχόμενο


Παράλληλα με τον νέο πυρήνα της CPU Cortex-A77, η Arm έχει αποκαλύψει μια GPU επόμενης γενιάς που προορίζεται για SoCs νέας γενιάς smartphone. Το Mali-G77, που δεν πρέπει να συγχέεται με τον νέο επεξεργαστή οθόνης Mali-D77, σηματοδοτεί την αναχώρηση της αρχιτεκτονικής Bifrost του Arm και τη μετάβαση στο Valhall.

Θα φτάσουμε στις λεπτομέρειες της νέας αρχιτεκτονικής σε μια στιγμή. Πρώτον, θα πηδήξουμε σωστά σε αυτό που οι χρήστες πρέπει να περιμένουν όσον αφορά τα κέρδη απόδοσης.

Επισκόπηση επιδόσεων Mali-G77

Ο βραχίονας μπορεί να ενισχύσει την απόδοση των γραφικών κατά 40% με τις συσκευές Mali-G77 επόμενης γενιάς σε σύγκριση με τα μοντέλα Mali-G76 της εποχής. Αυτός ο αριθμός λαμβάνει υπόψη τόσο τις διαδικασίες όσο και τις αρχιτεκτονικές βελτιώσεις. Το Mali-G77 μπορεί να διαμορφωθεί από 7 έως 16 πυρήνες shader και κάθε πυρήνας έχει σχεδόν το ίδιο μέγεθος με τον πυρήνα G76. Αυτό σημαίνει ότι τα high-end smartphones πιθανότατα θα μεταφερθούν με παρόμοιους αριθμούς πυρήνα GPU όπως κάνουν σήμερα - κάπου στα χαμηλά εφηβικά. Χειροκίνητα, αυτό μας επιτρέπει να κάνουμε μερικές εκτιμήσεις κερδοσκοπικών επιδόσεων σε σχέση με υπάρχοντα chipsets.


Κοιτάζοντας το δημοφιλές σημείο αναφοράς του Μανχάταν GFXBench, μια αύξηση της απόδοσης κατά 40 τοις εκατό ανοίγει ένα σημαντικό προβάδισμα ενάντια στο σημερινό υλικό παραγωγής. Το επόμενης γενιάς Adreno της Qualcomm θα χρειαστεί τη δική του σημαντική αναβάθμιση επιδόσεων για να διατηρήσει το επίπεδο παιχνιδιού. Τα τραπέζια φαίνεται να στρέφονται υπέρ του Arm.

Αρχιτεκτονική σοφός, η απόδοση του παιχνιδιού αυξάνεται κατά 20 έως 40%, ενώ η εκμάθηση μηχανών κερδίζει αύξηση 60%

Βασισμένο σε αυτό το μάλλον ακατέργαστο πάρκινγκ, ένα 10-πυρήνα Mali-G77 (μια διαμόρφωση που συχνά βλέπουμε από την Huawei) μοιάζει με την κορυφή της γενιάς αυτής της γενιάς του κινητού γραφικού υλικού γραμμής. Μια διαμόρφωση 12 πυρήνων, που συνήθως παρατηρείται στην Exynos της Samsung, παρέχει ένα μεγάλο προβάδισμα για την τελευταία GPU του Arm. Φυσικά, τα πραγματικά σημεία αναφοράς θα εξαρτηθούν από άλλους παράγοντες, συμπεριλαμβανομένου του κόμβου διεργασίας, της μνήμης cache της GPU, της διαμόρφωσης μνήμης LPDDR και του τύπου της εφαρμογής που δοκιμάζετε. Πάρτε λοιπόν το παραπάνω γράφημα με μια μεγάλη δόση αλατιού.


Από την άποψη της νέας αρχιτεκτονικής, η Arm δηλώνει ότι το Mali-G77 προσφέρει κατά μέσο όρο βελτίωση κατά 30% στην ενεργειακή αποδοτικότητα και την πυκνότητα απόδοσης. Υπάρχει επίσης τεράστια ώθηση 60% για εφαρμογές μηχανικής μάθησης, χάρη στην υποστήριξη προϊόντων INT8 dot. Οι προσδοκίες απόδοσης παιχνιδιών ρυθμίζονται κάπου μεταξύ της αύξησης κατά 20 και 40 τοις εκατό, ανάλογα με τον τίτλο και τον τύπο των γραφικών φόρτων εργασίας που προσφέρονται.

Για να κατανοήσουμε με ακρίβεια πώς ο βραχίονας έχει επιτύχει αυτή την αύξηση της απόδοσης, ας κάνουμε μια βαθύτερη κατάδυση στην αρχιτεκτονική.

Συναντήστε τον Βάλχαλ, τον διάδοχο του Bifrost

Το Vahall είναι η δεύτερη γενιά κλιμακωτής αρχιτεκτονικής GPU της Arm. Πρόκειται για μια μηχανή εκτέλεσης 16 σε γενικές γραμμές, η οποία ουσιαστικά σημαίνει ότι η GPU εκτελεί παράλληλα 16 οδηγίες παράλληλα ανά κύκλο, ανά μονάδα επεξεργασίας, ανά πυρήνα. Αυτό είναι από 4 και 8 πλάτος στο Bifrost.

Άλλα νέα αρχιτεκτονικά χαρακτηριστικά περιλαμβάνουν το δυναμικό προγραμματισμό διδασκαλίας που διαχειρίζεται αποκλειστικά το υλικό και ένα ολοκαίνουργιο σύνολο οδηγιών που διατηρεί λειτουργική ισοδυναμία με το Bifrost. Άλλοι περιλαμβάνουν υποστήριξη για τη μορφή συμπίεσης AFBC1.3 του Arm, FP16 για την απόδοση στόχων, επιδόσεων με στρώσεις και για εξόδους shader κορυφών.

Το Mali-G77 κάνει 33% περισσότερα μαθηματικά παράλληλα με τα G76.

Τα κλειδιά για την κατανόηση των μεγάλων αρχιτεκτονικών αλλαγών εντοπίζονται εξετάζοντας τη μονάδα εκτέλεσης μέσα στον πυρήνα. Αυτό το τμήμα της GPU είναι υπεύθυνο για την τραγάνισμα των αριθμών.

Μέσα στον μηχανισμό εκτέλεσης

Στο Bifrost, κάθε πυρήνας GPU περιείχε τρεις μηχανές εκτέλεσης ή δύο στην περίπτωση μερικών σχεδίων Mali-G52 χαμηλότερων σημείων. Κάθε μηχανή περιέχει ένα αρχείο i-cache, αρχείου καταγραφής και μονάδα ελέγχου στημονιού. Στο Mali-G72, κάθε μηχανή χειρίζεται 4 οδηγίες ανά κύκλο, οι οποίες αυξήθηκαν σε 8 στο Mali-G76 του περασμένου έτους. Η διάδοση σε αυτούς τους τρεις πυρήνες επιτρέπει 12 και 24 εντολές πολλαπλής συσσώρευσης (FMA) επί πλωτού σημείου (FP32) 32-bit (FP32) ανά κύκλο.

Με το Valhall και το Mali-G77, υπάρχει ένας μόνο μηχανισμός εκτέλεσης μέσα σε κάθε πυρήνα GPU. Όπως και πριν, αυτός ο κινητήρας στεγάζει τη μονάδα ελέγχου στημονιού, το μητρώο και το icache, το οποίο τώρα μοιράζεται σε δύο μονάδες επεξεργασίας. Κάθε μονάδα επεξεργασίας χειρίζεται 16 οδηγίες στημονιού ανά κύκλο, για συνολική απόδοση των 32 FP32 FMA οδηγιών ανά πυρήνα. Αυτό είναι ένα 33 τοις εκατό ώθηση στην απόδοση διδασκαλίας πάνω από το Mali-G76.

Ο βραχίονας έχει μετατραπεί από τρία σε μία μονάδα εκτέλεσης ανά πυρήνα GPU, αλλά τώρα υπάρχουν δύο μονάδες επεξεργασίας εντός ενός πυρήνα G77.

Επιπλέον, κάθε μια από αυτές τις μονάδες επεξεργασίας περιέχει δύο νέες ομάδες μαθηματικών λειτουργιών. Η νέα μονάδα μετατροπής (CVT) χειρίζεται βασικές ακέραιες, λογικές, κλάδους και οδηγίες μετατροπής. Η ειδική μονάδα λειτουργίας (SFU) επιταχύνει πολλαπλασιασμό, διαιρέσεις, τετραγωνική ρίζα, λογαρίθμους και άλλες σύνθετες ακέραιες λειτουργίες.

Η τυπική μονάδα FMA έχει δει μερικές τροποποιήσεις, υποστηρίζοντας 16 οδηγίες FP32 ανά κύκλο, 32 FP16 ή 64 INT8 dot οδηγίες προϊόντος. Αυτές οι βελτιστοποιήσεις παράγουν την αύξηση της απόδοσης κατά 60% στις εφαρμογές μηχανικής μάθησης.

Ο χαρτογράφος τετραγώνων υφής

Η άλλη αλλαγή κλειδιού στο Mali-G77 είναι η εισαγωγή ενός χαρτογράφου quad υφής, από έναν διπλό χάρτη χαρτογράφησης της προηγούμενης γενιάς. Ο χαρτογράφος υφής είναι υπεύθυνος για τη χαρτογράφηση των 3D πολυγώνων σε μια σκηνή στην 2D αναπαράσταση που βλέπετε σε μια οθόνη. Είναι υπεύθυνη για τη δειγματοληψία, τη παρεμβολή και το φιλτράρισμα για την εξομάλυνση του περιεχομένου υπό γωνία και το κινούμενο περιεχόμενο για να αποφευχθούν σκληρές, χαμηλής ποιότητας ακμές.

Η χαμηλού κόστους αντισαλλαίωση παραμένει στη θέση της για να βοηθήσει στην ποιότητα της εικόνας, αλλά ο διπλασιασμός της απόδοσης υφής είναι το σημαντικότερο όφελος εδώ. Η μονάδα υφής επεξεργάζεται τώρα 4 μπλονοειδείς texels ανά ρολόι από 2 προηγούμενες, 2 τριλινικές texels ανά ρολόι και χειρίζεται ταχύτερη διήθηση FP16 και FP32.

Ο χαρτογράφος quad υφής χωρίζεται σε δύο διαδρομές, παρέχοντας ένα μικρότερο αγωγό για τα θέματα που χτύπησαν περιεχόμενο στην κρυφή μνήμη. Η διαδρομή miss, η οποία χειρίζεται τη μετατροπή μορφής και την αποσυμπίεση υφής, διαθέτει μια ευρύτερη διεπαφή με την cache L2. Αυτό είναι επίσης χρήσιμο για φόρμες εργασίας εκμάθησης μηχανών που μπορεί συχνά να χρειαστεί να τραβήξουν νέα δεδομένα από τη μνήμη.

Φέρνοντας τα πάντα μαζί στο Mali-G77

Arm έχει κάνει μια σειρά από άλλα τσιμπήματα στο Mali-G77 να συμπίπτουν με τις μεγάλες αλλαγές στην αρχιτεκτονική Valhall. Το μπλοκ ελέγχου απλοποιείται χάρη στο σχεδιασμό μονάδας εκτέλεσης, ενώ ο εσωτερικός δυναμικός χρονοπρογραμματιστής επιτρέπει στην πράξη να εκδοθεί πιο ευέλικτη εντολή σε κάθε πυρήνα. Με υψηλότερη απόδοση σε κάθε πυρήνα, το datapath είναι επίσης μικρότερο και χαμηλότερο σε καθυστέρηση, σε μόλις 4 κύκλους από 8 προηγουμένως.

Ο νέος σχεδιασμός ευθυγραμμίζεται επίσης καλύτερα με το Vulkan API, απλουστεύοντας τους περιγραφικούς δείκτες του οδηγού για να μειώσουν την επιβάρυνση του οδηγού για βελτιωμένη απόδοση "μετάλλων".

Συνοπτικά, τα Mali-G72 και Valhall κάνουν σημαντικές αλλαγές από το Bifrost, που υπόσχονται σημαντικές βελτιώσεις στην απόδοση για εφαρμογές παιχνιδιών και μηχανικής μάθησης. Σημαντικό είναι ότι ο σχεδιασμός ταιριάζει στους ίδιους προϋπολογισμούς ισχύος και περιοχής όπως και το Bifrost, διασφαλίζοντας ότι οι κινητές συσκευές θα είναι σε θέση να προσφέρουν υψηλότερες επιδόσεις χωρίς να ανησυχούν για το κόστος της θερμότητας, της ισχύος και του πυριτίου. Με βάση τις προβλέψεις απόδοσης, το Mali-G77 θα πρέπει να είναι σε θέση να δώσει την επόμενη γενιά της Qualcomm στην Adreno μια καλή πορεία για τα χρήματά της.

Τα αληθινά ασύρματα ακουστικά xFyro Aria έφτασαν με επιτυχία σχεδόν δύο εκατομμύρια δολάρια στο Indiegogo. Τώρα έχετε την ευκαιρία να πάρετε ένα ζευγάρι από αυτά τα εντυπωσιακά αδιάβροχα ακουστικά για...

Μόλις πριν από λίγες ημέρες, η Arlo, οι κατασκευαστές των δημοφιλείς κάμερες ασφαλείας χωρίς καλώδια, έγινε μια αυτόνομη εταιρεία, καθώς ολοκλήρωσε την απόσχιση της από την πρώην μητρική της Netgear. ...

Φρέσκες Δημοσιεύσεις