Я просмотрел руководство по программированию и руководство по передовой практике, и в нем упоминалось, что доступ к глобальной памяти занимает 400-600 циклов. Я не видел много других типов памяти, таких как кэш текстур, постоянный кеш, разделяемая память. Регистры имеют нулевую задержку памяти.
Я думаю, что постоянный кеш - это то же самое, что и регистры, если все потоки используют один и тот же адрес в постоянном кеше. В худшем случае я не уверен.
Общая память - это то же самое, что и регистры, если нет конфликтов банков? Если есть, то как возникает задержка?
А как насчет кеша текстур?