16 files changed, 320 insertions, 240 deletions
diff --git a/drivers/gpu/nvgpu/common/linux/nvgpu_mem.c b/drivers/gpu/nvgpu/common/linux/nvgpu_mem.c
index eb54f3fd..8d8909dd 100644
--- a/drivers/gpu/nvgpu/common/linux/nvgpu_mem.c
+++ b/drivers/gpu/nvgpu/common/linux/nvgpu_mem.c
@@ -397,42 +397,59 @@ int __nvgpu_mem_create_from_pages(struct gk20a *g, struct nvgpu_mem *dest,
        return 0;
 }
-static struct nvgpu_mem_sgl *__nvgpu_mem_sgl_dup(struct gk20a *g,
+static void *nvgpu_mem_linux_sgl_next(void *sgl)
-                                                 struct nvgpu_mem_sgl *sgl)
 {
-        struct nvgpu_mem_sgl *head, *next;
+        return sg_next((struct scatterlist *)sgl);
+}
-        head = nvgpu_kzalloc(g, sizeof(*sgl));
+static u64 nvgpu_mem_linux_sgl_phys(void *sgl)
-        if (!head)
+{
-                return NULL;
+        return (u64)sg_phys((struct scatterlist *)sgl);
+}
-        next = head;
+static u64 nvgpu_mem_linux_sgl_dma(void *sgl)
-        while (true) {
+{
-                nvgpu_log(g, gpu_dbg_sgl,
+        return (u64)sg_dma_address((struct scatterlist *)sgl);
-                          "  phys: 0x%-12llx dma: 0x%-12llx len: 0x%llx",
+}
-                          sgl->phys, sgl->dma, sgl->length);
-                next->dma    = sgl->dma;
-                next->phys   = sgl->phys;
-                next->length = sgl->length;
-                next->next   = NULL;
-                sgl = nvgpu_mem_sgl_next(sgl);
-                if (!sgl)
-                        break;
-                next->next = nvgpu_kzalloc(g, sizeof(*sgl));
-                if (!next->next) {
-                        nvgpu_mem_sgl_free(g, head);
-                        return NULL;
-                }
-                next = next->next;
-        }
-        return head;
+static u64 nvgpu_mem_linux_sgl_length(void *sgl)
+{
+        return (u64)((struct scatterlist *)sgl)->length;
 }
-static struct nvgpu_mem_sgl *__nvgpu_mem_sgl_create_from_vidmem(
+static u64 nvgpu_mem_linux_sgl_gpu_addr(struct gk20a *g, void *sgl,
+                                        struct nvgpu_gmmu_attrs *attrs)
+{
+        if (sg_dma_address((struct scatterlist *)sgl) == 0)
+                return g->ops.mm.gpu_phys_addr(g, attrs,
+                        sg_phys((struct scatterlist *)sgl));
+        if (sg_dma_address((struct scatterlist *)sgl) == DMA_ERROR_CODE)
+                return 0;
+        return gk20a_mm_smmu_vaddr_translate(g,
+                        sg_dma_address((struct scatterlist *)sgl));
+}
+static void nvgpu_mem_linux_sgl_free(struct gk20a *g, struct nvgpu_sgt *sgt)
+{
+        /*
+         * Free this SGT. All we do is free the passed SGT. The actual Linux
+         * SGT/SGL needs to be freed separately.
+         */
+        nvgpu_kfree(g, sgt);
+}
+static const struct nvgpu_sgt_ops nvgpu_linux_sgt_ops = {
+        .sgl_next     = nvgpu_mem_linux_sgl_next,
+        .sgl_phys     = nvgpu_mem_linux_sgl_phys,
+        .sgl_dma      = nvgpu_mem_linux_sgl_dma,
+        .sgl_length   = nvgpu_mem_linux_sgl_length,
+        .sgl_gpu_addr = nvgpu_mem_linux_sgl_gpu_addr,
+        .sgt_free     = nvgpu_mem_linux_sgl_free,
+};
+static struct nvgpu_sgt *__nvgpu_mem_get_sgl_from_vidmem(
        struct gk20a *g,
        struct scatterlist *linux_sgl)
 {
@@ -442,70 +459,31 @@ static struct nvgpu_mem_sgl *__nvgpu_mem_sgl_create_from_vidmem(
        if (!vidmem_alloc)
                return NULL;
-        nvgpu_log(g, gpu_dbg_sgl, "Vidmem sgl:");
+        return &vidmem_alloc->sgt;
-        return __nvgpu_mem_sgl_dup(g, vidmem_alloc->sgl);
 }
-struct nvgpu_mem_sgl *nvgpu_mem_sgl_create(struct gk20a *g,
+struct nvgpu_sgt *nvgpu_linux_sgt_create(struct gk20a *g, struct sg_table *sgt)
-                                           struct sg_table *sgt)
 {
-        struct nvgpu_mem_sgl *head, *sgl, *next;
+        struct nvgpu_sgt *nvgpu_sgt;
        struct scatterlist *linux_sgl = sgt->sgl;
        if (is_vidmem_page_alloc(sg_dma_address(linux_sgl)))
-                return __nvgpu_mem_sgl_create_from_vidmem(g, linux_sgl);
+                return __nvgpu_mem_get_sgl_from_vidmem(g, linux_sgl);
-        head = nvgpu_kzalloc(g, sizeof(*sgl));
+        nvgpu_sgt = nvgpu_kzalloc(g, sizeof(*nvgpu_sgt));
-        if (!head)
+        if (!nvgpu_sgt)
                return NULL;
-        nvgpu_log(g, gpu_dbg_sgl, "Making sgl:");
+        nvgpu_log(g, gpu_dbg_sgl, "Making Linux SGL!");
-        sgl = head;
+        nvgpu_sgt->sgl = sgt->sgl;
-        while (true) {
+        nvgpu_sgt->ops = &nvgpu_linux_sgt_ops;
-                sgl->dma    = sg_dma_address(linux_sgl);
-                sgl->phys   = sg_phys(linux_sgl);
-                sgl->length = linux_sgl->length;
-                /*
-                 * We don't like offsets in the pages here. This will cause
-                 * problems.
-                 */
-                if (WARN_ON(linux_sgl->offset)) {
-                        nvgpu_mem_sgl_free(g, head);
-                        return NULL;
-                }
-                nvgpu_log(g, gpu_dbg_sgl,
-                          "  phys: 0x%-12llx dma: 0x%-12llx len: 0x%llx",
-                          sgl->phys, sgl->dma, sgl->length);
-                /*
-                 * When there's no more SGL ents for the Linux SGL we are
-                 * done. Don't bother making any more SGL ents for the nvgpu
-                 * SGL.
-                 */
-                linux_sgl = sg_next(linux_sgl);
-                if (!linux_sgl)
-                        break;
-                next = nvgpu_kzalloc(g, sizeof(*sgl));
-                if (!next) {
-                        nvgpu_mem_sgl_free(g, head);
-                        return NULL;
-                }
-                sgl->next = next;
-                sgl = next;
-        }
-        nvgpu_log(g, gpu_dbg_sgl, "Done!");
+        return nvgpu_sgt;
-        return head;
 }
-struct nvgpu_mem_sgl *nvgpu_mem_sgl_create_from_mem(struct gk20a *g,
+struct nvgpu_sgt *nvgpu_sgt_create_from_mem(struct gk20a *g,
-                                                    struct nvgpu_mem *mem)
+                                            struct nvgpu_mem *mem)
 {
-        return nvgpu_mem_sgl_create(g, mem->priv.sgt);
+        return nvgpu_linux_sgt_create(g, mem->priv.sgt);
 }
diff --git a/drivers/gpu/nvgpu/common/linux/vm.c b/drivers/gpu/nvgpu/common/linux/vm.c
index 4a4429dc..2e29f0f7 100644
--- a/drivers/gpu/nvgpu/common/linux/vm.c
+++ b/drivers/gpu/nvgpu/common/linux/vm.c
@@ -69,19 +69,20 @@ static u64 nvgpu_get_buffer_alignment(struct gk20a *g, struct scatterlist *sgl,
        if (aperture == APERTURE_VIDMEM) {
                struct nvgpu_page_alloc *alloc = get_vidmem_page_alloc(sgl);
-                struct nvgpu_mem_sgl *sgl_vid = alloc->sgl;
+                struct nvgpu_sgt *sgt = &alloc->sgt;
+                void *sgl_vid = sgt->sgl;
                while (sgl_vid) {
                        chunk_align = 1ULL <<
-                                __ffs(nvgpu_mem_sgl_phys(sgl_vid) |
+                                __ffs(nvgpu_sgt_get_phys(sgt, sgl_vid)) |
-                                nvgpu_mem_sgl_length(sgl_vid));
+                                nvgpu_sgt_get_length(sgt, sgl_vid);
                        if (align)
                                align = min(align, chunk_align);
                        else
                                align = chunk_align;
-                        sgl_vid = nvgpu_mem_sgl_next(sgl_vid);
+                        sgl_vid = nvgpu_sgt_get_next(sgt, sgl_vid);
                }
                return align;
@@ -242,7 +243,7 @@ u64 nvgpu_vm_map(struct vm_gk20a *vm,
        struct nvgpu_vm_area *vm_area = NULL;
        u32 ctag_offset;
        enum nvgpu_aperture aperture;
-        struct nvgpu_mem_sgl *nvgpu_sgl;
+        struct nvgpu_sgt *nvgpu_sgt;
        /*
         * The kind used as part of the key for map caching. HW may
@@ -399,12 +400,12 @@ u64 nvgpu_vm_map(struct vm_gk20a *vm,
                ctag_offset += buffer_offset >>
                               ilog2(g->ops.fb.compression_page_size(g));
-        nvgpu_sgl = nvgpu_mem_sgl_create(g, bfr.sgt);
+        nvgpu_sgt = nvgpu_linux_sgt_create(g, bfr.sgt);
        /* update gmmu ptes */
        map_offset = g->ops.mm.gmmu_map(vm,
                                        map_offset,
-                                        nvgpu_sgl,
+                                        nvgpu_sgt,
                                        buffer_offset, /* sg offset */
                                        mapping_size,
                                        bfr.pgsz_idx,
@@ -419,7 +420,7 @@ u64 nvgpu_vm_map(struct vm_gk20a *vm,
        if (!map_offset)
                goto clean_up;
-        nvgpu_mem_sgl_free(g, nvgpu_sgl);
+        nvgpu_sgt_free(nvgpu_sgt, g);
        mapped_buffer = nvgpu_kzalloc(g, sizeof(*mapped_buffer));
        if (!mapped_buffer) {
diff --git a/drivers/gpu/nvgpu/common/mm/gmmu.c b/drivers/gpu/nvgpu/common/mm/gmmu.c
index 41f5acdd..66bce8f0 100644
--- a/drivers/gpu/nvgpu/common/mm/gmmu.c
+++ b/drivers/gpu/nvgpu/common/mm/gmmu.c
@@ -65,14 +65,14 @@ static u64 __nvgpu_gmmu_map(struct vm_gk20a *vm,
        struct gk20a *g = gk20a_from_vm(vm);
        u64 vaddr;
-        struct nvgpu_mem_sgl *sgl = nvgpu_mem_sgl_create_from_mem(g, mem);
+        struct nvgpu_sgt *sgt = nvgpu_sgt_create_from_mem(g, mem);
-        if (!sgl)
+        if (!sgt)
                return -ENOMEM;
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
        vaddr = g->ops.mm.gmmu_map(vm, addr,
-                                   sgl,    /* sg list */
+                                   sgt,    /* sg list */
                                   0,      /* sg offset */
                                   size,
                                   gmmu_page_size_kernel,
@@ -86,7 +86,7 @@ static u64 __nvgpu_gmmu_map(struct vm_gk20a *vm,
                                   aperture);
        nvgpu_mutex_release(&vm->update_gmmu_lock);
-        nvgpu_mem_sgl_free(g, sgl);
+        nvgpu_sgt_free(sgt, g);
        if (!vaddr) {
                nvgpu_err(g, "failed to map buffer!");
@@ -464,7 +464,7 @@ static int __set_pd_level(struct vm_gk20a *vm,
 * VIDMEM version of the update_ptes logic.
 */
 static int __nvgpu_gmmu_update_page_table_vidmem(struct vm_gk20a *vm,
-                                                 struct nvgpu_mem_sgl *sgl,
+                                                 struct nvgpu_sgt *sgt,
                                                 u64 space_to_skip,
                                                 u64 virt_addr,
                                                 u64 length,
@@ -472,8 +472,9 @@ static int __nvgpu_gmmu_update_page_table_vidmem(struct vm_gk20a *vm,
 {
        u64 phys_addr, chunk_length;
        int err = 0;
+        void *sgl;
-        if (!sgl) {
+        if (!sgt) {
                /*
                 * This is considered an unmap. Just pass in 0 as the physical
                 * address for the entire GPU range.
@@ -490,16 +491,17 @@ static int __nvgpu_gmmu_update_page_table_vidmem(struct vm_gk20a *vm,
         * Otherwise iterate across all the chunks in this allocation and
         * map them.
         */
+        sgl = sgt->sgl;
        while (sgl) {
                if (space_to_skip &&
-                    space_to_skip >= nvgpu_mem_sgl_length(sgl)) {
+                    space_to_skip >= nvgpu_sgt_get_length(sgt, sgl)) {
-                        space_to_skip -= nvgpu_mem_sgl_length(sgl);
+                        space_to_skip -= nvgpu_sgt_get_length(sgt, sgl);
-                        sgl = nvgpu_mem_sgl_next(sgl);
+                        sgl = nvgpu_sgt_get_next(sgt, sgl);
                        continue;
                }
-                phys_addr = nvgpu_mem_sgl_phys(sgl) + space_to_skip;
+                phys_addr = nvgpu_sgt_get_phys(sgt, sgl) + space_to_skip;
-                chunk_length = min(length, (nvgpu_mem_sgl_length(sgl) -
+                chunk_length = min(length, (nvgpu_sgt_get_length(sgt, sgl) -
                                            space_to_skip));
                err = __set_pd_level(vm, &vm->pdb,
@@ -518,27 +520,27 @@ static int __nvgpu_gmmu_update_page_table_vidmem(struct vm_gk20a *vm,
                 */
                virt_addr += chunk_length;
                length    -= chunk_length;
+                sgl = nvgpu_sgt_get_next(sgt, sgl);
                if (length == 0)
                        break;
-                sgl = nvgpu_mem_sgl_next(sgl);
        }
        return err;
 }
 static int __nvgpu_gmmu_update_page_table_sysmem(struct vm_gk20a *vm,
-                                                 struct nvgpu_mem_sgl *sgl,
+                                                 struct nvgpu_sgt *sgt,
                                                 u64 space_to_skip,
                                                 u64 virt_addr,
                                                 u64 length,
                                                 struct nvgpu_gmmu_attrs *attrs)
 {
-        int err;
        struct gk20a *g = gk20a_from_vm(vm);
+        void *sgl;
+        int err;
-        if (!sgl) {
+        if (!sgt) {
                /*
                 * This is considered an unmap. Just pass in 0 as the physical
                 * address for the entire GPU range.
@@ -559,8 +561,10 @@ static int __nvgpu_gmmu_update_page_table_sysmem(struct vm_gk20a *vm,
         * mapping is simple since the "physical" address is actually a virtual
         * IO address and will be contiguous.
         */
+        sgl = sgt->sgl;
        if (!g->mm.bypass_smmu) {
-                u64 io_addr = nvgpu_mem_sgl_gpu_addr(g, sgl, attrs);
+                u64 io_addr = nvgpu_sgt_get_gpu_addr(sgt, g, sgl, attrs);
                io_addr += space_to_skip;
@@ -586,15 +590,15 @@ static int __nvgpu_gmmu_update_page_table_sysmem(struct vm_gk20a *vm,
                 * Cut out sgl ents for space_to_skip.
                 */
                if (space_to_skip &&
-                    space_to_skip >= nvgpu_mem_sgl_length(sgl)) {
+                    space_to_skip >= nvgpu_sgt_get_length(sgt, sgl)) {
-                        space_to_skip -= nvgpu_mem_sgl_length(sgl);
+                        space_to_skip -= nvgpu_sgt_get_length(sgt, sgl);
-                        sgl = nvgpu_mem_sgl_next(sgl);
+                        sgl = nvgpu_sgt_get_next(sgt, sgl);
                        continue;
                }
-                phys_addr = nvgpu_mem_sgl_phys(sgl) + space_to_skip;
+                phys_addr = nvgpu_sgt_get_phys(sgt, sgl) + space_to_skip;
                chunk_length = min(length,
-                                   nvgpu_mem_sgl_length(sgl) - space_to_skip);
+                        nvgpu_sgt_get_length(sgt, sgl) - space_to_skip);
                err = __set_pd_level(vm, &vm->pdb,
                                     0,
@@ -606,7 +610,7 @@ static int __nvgpu_gmmu_update_page_table_sysmem(struct vm_gk20a *vm,
                space_to_skip = 0;
                virt_addr += chunk_length;
                length    -= chunk_length;
-                sgl        = nvgpu_mem_sgl_next(sgl);
+                sgl        = nvgpu_sgt_get_next(sgt, sgl);
                if (length == 0)
                        break;
@@ -631,7 +635,7 @@ static int __nvgpu_gmmu_update_page_table_sysmem(struct vm_gk20a *vm,
 *     case of SMMU usage.
 */
 static int __nvgpu_gmmu_update_page_table(struct vm_gk20a *vm,
-                                          struct nvgpu_mem_sgl *sgl,
+                                          struct nvgpu_sgt *sgt,
                                          u64 space_to_skip,
                                          u64 virt_addr,
                                          u64 length,
@@ -669,10 +673,10 @@ static int __nvgpu_gmmu_update_page_table(struct vm_gk20a *vm,
                   "phys offset: %#-4llx;  pgsz: %3dkb perm=%-2s | "
                   "kind=%#02x APT=%-6s %c%c%c%c%c",
                   vm->name,
-                   sgl ? "MAP" : "UNMAP",
+                   sgt ? "MAP" : "UNMAP",
                   virt_addr,
                   length,
-                   sgl ? nvgpu_mem_sgl_phys(sgl) : 0,
+                   sgt ? nvgpu_sgt_get_phys(sgt, sgt->sgl) : 0,
                   space_to_skip,
                   page_size >> 10,
                   nvgpu_gmmu_perm_str(attrs->rw_flag),
@@ -690,14 +694,14 @@ static int __nvgpu_gmmu_update_page_table(struct vm_gk20a *vm,
         */
        if (attrs->aperture == APERTURE_VIDMEM)
                err = __nvgpu_gmmu_update_page_table_vidmem(vm,
-                                                            sgl,
+                                                            sgt,
                                                            space_to_skip,
                                                            virt_addr,
                                                            length,
                                                            attrs);
        else
                err = __nvgpu_gmmu_update_page_table_sysmem(vm,
-                                                            sgl,
+                                                            sgt,
                                                            space_to_skip,
                                                            virt_addr,
                                                            length,
@@ -706,7 +710,7 @@ static int __nvgpu_gmmu_update_page_table(struct vm_gk20a *vm,
        unmap_gmmu_pages(g, &vm->pdb);
        nvgpu_smp_mb();
-        __gmmu_dbg(g, attrs, "%-5s Done!", sgl ? "MAP" : "UNMAP");
+        __gmmu_dbg(g, attrs, "%-5s Done!", sgt ? "MAP" : "UNMAP");
        return err;
 }
@@ -725,7 +729,7 @@ static int __nvgpu_gmmu_update_page_table(struct vm_gk20a *vm,
 */
 u64 gk20a_locked_gmmu_map(struct vm_gk20a *vm,
                          u64 vaddr,
-                          struct nvgpu_mem_sgl *sgl,
+                          struct nvgpu_sgt *sgt,
                          u64 buffer_offset,
                          u64 size,
                          int pgsz_idx,
@@ -774,7 +778,7 @@ u64 gk20a_locked_gmmu_map(struct vm_gk20a *vm,
                allocated = true;
        }
-        err = __nvgpu_gmmu_update_page_table(vm, sgl, buffer_offset,
+        err = __nvgpu_gmmu_update_page_table(vm, sgt, buffer_offset,
                                             vaddr, size, &attrs);
        if (err) {
                nvgpu_err(g, "failed to update ptes on map");
@@ -787,6 +791,7 @@ u64 gk20a_locked_gmmu_map(struct vm_gk20a *vm,
                batch->need_tlb_invalidate = true;
        return vaddr;
 fail_validate:
        if (allocated)
                __nvgpu_vm_free_va(vm, vaddr, pgsz_idx);
diff --git a/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c b/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
index 7296c673..6decec24 100644
--- a/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
+++ b/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
@@ -19,55 +19,34 @@
 #include "gk20a/gk20a.h"
-struct nvgpu_mem_sgl *nvgpu_mem_sgl_next(struct nvgpu_mem_sgl *sgl)
+void *nvgpu_sgt_get_next(struct nvgpu_sgt *sgt, void *sgl)
 {
-        return sgl->next;
+        return sgt->ops->sgl_next(sgl);
 }
-u64 nvgpu_mem_sgl_phys(struct nvgpu_mem_sgl *sgl)
+u64 nvgpu_sgt_get_phys(struct nvgpu_sgt *sgt, void *sgl)
 {
-        return sgl->phys;
+        return sgt->ops->sgl_phys(sgl);
 }
-u64 nvgpu_mem_sgl_dma(struct nvgpu_mem_sgl *sgl)
+u64 nvgpu_sgt_get_dma(struct nvgpu_sgt *sgt, void *sgl)
 {
-        return sgl->dma;
+        return sgt->ops->sgl_dma(sgl);
 }
-u64 nvgpu_mem_sgl_length(struct nvgpu_mem_sgl *sgl)
+u64 nvgpu_sgt_get_length(struct nvgpu_sgt *sgt, void *sgl)
 {
-        return sgl->length;
+        return sgt->ops->sgl_length(sgl);
 }
-/*
+u64 nvgpu_sgt_get_gpu_addr(struct nvgpu_sgt *sgt, struct gk20a *g, void *sgl,
- * This builds a GPU address for the %sgl based on whether an IOMMU is present
- * or not. It also handles turning the physical address into the true GPU
- * physical address that should be programmed into the page tables.
- */
-u64 nvgpu_mem_sgl_gpu_addr(struct gk20a *g, struct nvgpu_mem_sgl *sgl,
                           struct nvgpu_gmmu_attrs *attrs)
 {
-        if (nvgpu_mem_sgl_dma(sgl) == 0)
+        return sgt->ops->sgl_gpu_addr(g, sgl, attrs);
-                return g->ops.mm.gpu_phys_addr(g, attrs,
-                                               nvgpu_mem_sgl_phys(sgl));
-        if (nvgpu_mem_sgl_dma(sgl) == DMA_ERROR_CODE)
-                return 0;
-        return gk20a_mm_smmu_vaddr_translate(g, nvgpu_mem_sgl_dma(sgl));
 }
-void nvgpu_mem_sgl_free(struct gk20a *g, struct nvgpu_mem_sgl *sgl)
+void nvgpu_sgt_free(struct nvgpu_sgt *sgt, struct gk20a *g)
 {
-        struct nvgpu_mem_sgl *next;
+        if (sgt && sgt->ops->sgt_free)
+                sgt->ops->sgt_free(g, sgt);
-        /*
-         * Free each of the elements. We expect each element to have been
-         * nvgpu_k[mz]alloc()ed.
-         */
-        while (sgl) {
-                next = nvgpu_mem_sgl_next(sgl);
-                nvgpu_kfree(g, sgl);
-                sgl = next;
-        }
 }
diff --git a/drivers/gpu/nvgpu/common/mm/page_allocator.c b/drivers/gpu/nvgpu/common/mm/page_allocator.c
index 6d92b457..9c35f528 100644
--- a/drivers/gpu/nvgpu/common/mm/page_allocator.c
+++ b/drivers/gpu/nvgpu/common/mm/page_allocator.c
@@ -143,20 +143,93 @@ static void nvgpu_page_release_co(struct nvgpu_allocator *a,
        nvgpu_alloc_release_carveout(&va->source_allocator, co);
 }
+static void *nvgpu_page_alloc_sgl_next(void *sgl)
+{
+        struct nvgpu_mem_sgl *nvgpu_sgl = sgl;
+        return nvgpu_sgl->next;
+}
+static u64 nvgpu_page_alloc_sgl_phys(void *sgl)
+{
+        struct nvgpu_mem_sgl *nvgpu_sgl = sgl;
+        return nvgpu_sgl->phys;
+}
+static u64 nvgpu_page_alloc_sgl_dma(void *sgl)
+{
+        struct nvgpu_mem_sgl *nvgpu_sgl = sgl;
+        return nvgpu_sgl->dma;
+}
+static u64 nvgpu_page_alloc_sgl_length(void *sgl)
+{
+        struct nvgpu_mem_sgl *nvgpu_sgl = sgl;
+        return nvgpu_sgl->length;
+}
+static u64 nvgpu_page_alloc_sgl_gpu_addr(struct gk20a *g, void *sgl,
+                                         struct nvgpu_gmmu_attrs *attrs)
+{
+        struct nvgpu_mem_sgl *nvgpu_sgl = sgl;
+        return nvgpu_sgl->phys;
+}
+static void nvgpu_page_alloc_sgt_free(struct gk20a *g, struct nvgpu_sgt *sgt)
+{
+        /*
+         * No-op here. The free is handled by the page_alloc free() functions.
+         */
+}
+/*
+ * These implement the generic scatter gather ops for pages allocated
+ * by the page allocator. however, the primary aim for this, is of course,
+ * vidmem.
+ */
+static const struct nvgpu_sgt_ops page_alloc_sgl_ops = {
+        .sgl_next = nvgpu_page_alloc_sgl_next,
+        .sgl_phys = nvgpu_page_alloc_sgl_phys,
+        .sgl_dma = nvgpu_page_alloc_sgl_dma,
+        .sgl_length = nvgpu_page_alloc_sgl_length,
+        .sgl_gpu_addr = nvgpu_page_alloc_sgl_gpu_addr,
+        .sgt_free = nvgpu_page_alloc_sgt_free,
+};
+/*
+ * This actually frees the sgl memory. Used by the page_alloc free() functions.
+ */
+static void nvgpu_page_alloc_sgl_proper_free(struct gk20a *g,
+                                             struct nvgpu_mem_sgl *sgl)
+{
+        struct nvgpu_mem_sgl *next;
+        while (sgl) {
+                next = sgl->next;
+                nvgpu_kfree(g, sgl);
+                sgl = next;
+        }
+}
 static void __nvgpu_free_pages(struct nvgpu_page_allocator *a,
                               struct nvgpu_page_alloc *alloc,
                               bool free_buddy_alloc)
 {
-        struct nvgpu_mem_sgl *sgl = alloc->sgl;
+        struct nvgpu_mem_sgl *sgl = alloc->sgt.sgl;
        if (free_buddy_alloc) {
                while (sgl) {
-                        nvgpu_free(&a->source_allocator, sgl->phys);
+                        nvgpu_free(&a->source_allocator,
-                        sgl = nvgpu_mem_sgl_next(sgl);
+                                   nvgpu_sgt_get_phys(&alloc->sgt, sgl));
+                        sgl = nvgpu_sgt_get_next(&alloc->sgt, sgl);
                }
        }
-        nvgpu_mem_sgl_free(a->owner->g, alloc->sgl);
+        nvgpu_page_alloc_sgl_proper_free(a->owner->g, sgl);
        nvgpu_kmem_cache_free(a->alloc_cache, alloc);
 }
@@ -306,7 +379,7 @@ static int __do_slab_alloc(struct nvgpu_page_allocator *a,
        alloc->length = slab_page->slab_size;
        alloc->base = slab_page->page_addr + (offs * slab_page->slab_size);
-        sgl         = alloc->sgl;
+        sgl         = alloc->sgt.sgl;
        sgl->phys   = alloc->base;
        sgl->dma    = alloc->base;
        sgl->length = alloc->length;
@@ -338,13 +411,16 @@ static struct nvgpu_page_alloc *__nvgpu_alloc_slab(
                palloc_dbg(a, "OOM: could not alloc page_alloc struct!\n");
                goto fail;
        }
+        alloc->sgt.ops = &page_alloc_sgl_ops;
        sgl = nvgpu_kzalloc(a->owner->g, sizeof(*sgl));
        if (!sgl) {
                palloc_dbg(a, "OOM: could not alloc sgl struct!\n");
                goto fail;
        }
-        alloc->sgl = sgl;
+        alloc->sgt.sgl = sgl;
        err = __do_slab_alloc(a, slab, alloc);
        if (err)
                goto fail;
@@ -432,6 +508,7 @@ static struct nvgpu_page_alloc *__do_nvgpu_alloc_pages(
        memset(alloc, 0, sizeof(*alloc));
        alloc->length = pages << a->page_shift;
+        alloc->sgt.ops = &page_alloc_sgl_ops;
        while (pages) {
                u64 chunk_addr = 0;
@@ -495,7 +572,7 @@ static struct nvgpu_page_alloc *__do_nvgpu_alloc_pages(
                if (prev_sgl)
                        prev_sgl->next = sgl;
                else
-                        alloc->sgl = sgl;
+                        alloc->sgt.sgl = sgl;
                prev_sgl = sgl;
@@ -503,12 +580,12 @@ static struct nvgpu_page_alloc *__do_nvgpu_alloc_pages(
        }
        alloc->nr_chunks = i;
-        alloc->base = alloc->sgl->phys;
+        alloc->base = ((struct nvgpu_mem_sgl *)alloc->sgt.sgl)->phys;
        return alloc;
 fail_cleanup:
-        sgl = alloc->sgl;
+        sgl = alloc->sgt.sgl;
        while (sgl) {
                struct nvgpu_mem_sgl *next = sgl->next;
@@ -542,13 +619,13 @@ static struct nvgpu_page_alloc *__nvgpu_alloc_pages(
        palloc_dbg(a, "Alloc 0x%llx (%llu) id=0x%010llx\n",
                   pages << a->page_shift, pages, alloc->base);
-        sgl = alloc->sgl;
+        sgl = alloc->sgt.sgl;
        while (sgl) {
                palloc_dbg(a, "  Chunk %2d: 0x%010llx + 0x%llx\n",
                           i++,
-                           nvgpu_mem_sgl_phys(sgl),
+                           nvgpu_sgt_get_phys(&alloc->sgt, sgl),
-                           nvgpu_mem_sgl_length(sgl));
+                           nvgpu_sgt_get_length(&alloc->sgt, sgl));
-                sgl = sgl->next;
+                sgl = nvgpu_sgt_get_next(&alloc->sgt, sgl);
        }
        palloc_dbg(a, "Alloc done\n");
@@ -655,6 +732,7 @@ static struct nvgpu_page_alloc *__nvgpu_alloc_pages_fixed(
        if (!alloc || !sgl)
                goto fail;
+        alloc->sgt.ops = &page_alloc_sgl_ops;
        alloc->base = nvgpu_alloc_fixed(&a->source_allocator, base, length, 0);
        if (!alloc->base) {
                WARN(1, "nvgpu: failed to fixed alloc pages @ 0x%010llx", base);
@@ -663,7 +741,7 @@ static struct nvgpu_page_alloc *__nvgpu_alloc_pages_fixed(
        alloc->nr_chunks = 1;
        alloc->length = length;
-        alloc->sgl = sgl;
+        alloc->sgt.sgl = sgl;
        sgl->phys   = alloc->base;
        sgl->dma    = alloc->base;
@@ -708,13 +786,13 @@ static u64 nvgpu_page_alloc_fixed(struct nvgpu_allocator *__a,
        palloc_dbg(a, "Alloc [fixed] @ 0x%010llx + 0x%llx (%llu)\n",
                   alloc->base, aligned_len, pages);
-        sgl = alloc->sgl;
+        sgl = alloc->sgt.sgl;
        while (sgl) {
                palloc_dbg(a, "  Chunk %2d: 0x%010llx + 0x%llx\n",
                           i++,
-                           nvgpu_mem_sgl_phys(sgl),
+                           nvgpu_sgt_get_phys(&alloc->sgt, sgl),
-                           nvgpu_mem_sgl_length(sgl));
+                           nvgpu_sgt_get_length(&alloc->sgt, sgl));
-                sgl = sgl->next;
+                sgl = nvgpu_sgt_get_next(&alloc->sgt, sgl);
        }
        a->nr_fixed_allocs++;
diff --git a/drivers/gpu/nvgpu/common/pramin.c b/drivers/gpu/nvgpu/common/pramin.c
index bb7d930e..ae9c9b1f 100644
--- a/drivers/gpu/nvgpu/common/pramin.c
+++ b/drivers/gpu/nvgpu/common/pramin.c
@@ -84,24 +84,23 @@ void nvgpu_pramin_access_batched(struct gk20a *g, struct nvgpu_mem *mem,
                u32 offset, u32 size, pramin_access_batch_fn loop, u32 **arg)
 {
        struct nvgpu_page_alloc *alloc = NULL;
-        struct nvgpu_mem_sgl *sgl;
+        struct nvgpu_sgt *sgt;
+        void *sgl;
        u32 byteoff, start_reg, until_end, n;
        alloc = get_vidmem_page_alloc(mem->priv.sgt->sgl);
-        sgl = alloc->sgl;
+        sgt = &alloc->sgt;
-        while (sgl) {
+        for (sgl = sgt->sgl; sgl; sgl = nvgpu_sgt_get_next(sgt, sgl)) {
-                if (offset >= nvgpu_mem_sgl_length(sgl)) {
+                if (offset >= nvgpu_sgt_get_length(sgt, sgl))
-                        offset -= nvgpu_mem_sgl_length(sgl);
+                        offset -= nvgpu_sgt_get_length(sgt, sgl);
-                        sgl = sgl->next;
+                else
-                } else {
                        break;
-                }
        }
        while (size) {
-                u32 sgl_len = (u32)nvgpu_mem_sgl_length(sgl);
+                u32 sgl_len = (u32)nvgpu_sgt_get_length(sgt, sgl);
-                byteoff = g->ops.pramin.enter(g, mem, sgl,
+                byteoff = g->ops.pramin.enter(g, mem, sgt, sgl,
                                              offset / sizeof(u32));
                start_reg = g->ops.pramin.data032_r(byteoff / sizeof(u32));
                until_end = SZ_1M - (byteoff & (SZ_1M - 1));
@@ -117,7 +116,7 @@ void nvgpu_pramin_access_batched(struct gk20a *g, struct nvgpu_mem *mem,
                size -= n;
                if (n == (sgl_len - offset)) {
-                        sgl = nvgpu_mem_sgl_next(sgl);
+                        sgl = nvgpu_sgt_get_next(sgt, sgl);
                        offset = 0;
                } else {
                        offset += n;
diff --git a/drivers/gpu/nvgpu/gk20a/gk20a.h b/drivers/gpu/nvgpu/gk20a/gk20a.h
index 355228db..13c62691 100644
--- a/drivers/gpu/nvgpu/gk20a/gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/gk20a.h
@@ -34,7 +34,7 @@ struct gk20a_debug_output;
 struct nvgpu_clk_pll_debug_data;
 struct nvgpu_nvhost_dev;
 struct nvgpu_cpu_time_correlation_sample;
-struct nvgpu_mem_sgl;
+struct nvgpu_mem_sgt;
 #include <nvgpu/lock.h>
 #include <nvgpu/thread.h>
@@ -700,7 +700,7 @@ struct gpu_ops {
                bool (*support_sparse)(struct gk20a *g);
                u64 (*gmmu_map)(struct vm_gk20a *vm,
                                u64 map_offset,
-                                struct nvgpu_mem_sgl *sgl,
+                                struct nvgpu_sgt *sgt,
                                u64 buffer_offset,
                                u64 size,
                                int pgsz_idx,
@@ -760,9 +760,9 @@ struct gpu_ops {
                                size_t size);
        struct {
                u32 (*enter)(struct gk20a *g, struct nvgpu_mem *mem,
-                             struct nvgpu_mem_sgl *sgl, u32 w);
+                        struct nvgpu_sgt *sgt, void *sgl, u32 w);
                void (*exit)(struct gk20a *g, struct nvgpu_mem *mem,
-                             struct nvgpu_mem_sgl *sgl);
+                        void *sgl);
                u32 (*data032_r)(u32 i);
        } pramin;
        struct {
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index cd34e769..0e0326dd 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -1151,7 +1151,8 @@ static int gk20a_gmmu_clear_vidmem_mem(struct gk20a *g, struct nvgpu_mem *mem)
        struct gk20a_fence *gk20a_fence_out = NULL;
        struct gk20a_fence *gk20a_last_fence = NULL;
        struct nvgpu_page_alloc *alloc = NULL;
-        struct nvgpu_mem_sgl *sgl = NULL;
+        struct nvgpu_sgt *sgt = NULL;
+        void *sgl = NULL;
        int err = 0;
        if (g->mm.vidmem.ce_ctx_id == (u32)~0)
@@ -1159,7 +1160,8 @@ static int gk20a_gmmu_clear_vidmem_mem(struct gk20a *g, struct nvgpu_mem *mem)
        alloc = get_vidmem_page_alloc(mem->priv.sgt->sgl);
-        sgl = alloc->sgl;
+        sgt = &alloc->sgt;
+        sgl = sgt->sgl;
        while (sgl) {
                if (gk20a_last_fence)
                        gk20a_fence_put(gk20a_last_fence);
@@ -1167,8 +1169,8 @@ static int gk20a_gmmu_clear_vidmem_mem(struct gk20a *g, struct nvgpu_mem *mem)
                err = gk20a_ce_execute_ops(g,
                        g->mm.vidmem.ce_ctx_id,
                        0,
-                        nvgpu_mem_sgl_phys(sgl),
+                        nvgpu_sgt_get_phys(sgt, sgl),
-                        nvgpu_mem_sgl_length(sgl),
+                        nvgpu_sgt_get_length(sgt, sgl),
                        0x00000000,
                        NVGPU_CE_DST_LOCATION_LOCAL_FB,
                        NVGPU_CE_MEMSET,
@@ -1183,7 +1185,7 @@ static int gk20a_gmmu_clear_vidmem_mem(struct gk20a *g, struct nvgpu_mem *mem)
                }
                gk20a_last_fence = gk20a_fence_out;
-                sgl = nvgpu_mem_sgl_next(sgl);
+                sgl = nvgpu_sgt_get_next(sgt, sgl);
        }
        if (gk20a_last_fence) {
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index 2fdc1729..9c5e0fae 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -361,7 +361,7 @@ static inline phys_addr_t gk20a_mem_phys(struct nvgpu_mem *mem)
 u64 gk20a_locked_gmmu_map(struct vm_gk20a *vm,
                          u64 map_offset,
-                          struct nvgpu_mem_sgl *sgl,
+                          struct nvgpu_sgt *sgt,
                          u64 buffer_offset,
                          u64 size,
                          int pgsz_idx,
diff --git a/drivers/gpu/nvgpu/gk20a/pramin_gk20a.c b/drivers/gpu/nvgpu/gk20a/pramin_gk20a.c
index 8a34a63c..aaba4ffc 100644
--- a/drivers/gpu/nvgpu/gk20a/pramin_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/pramin_gk20a.c
@@ -26,9 +26,9 @@
 /* WARNING: returns pramin_window_lock taken, complement with pramin_exit() */
 u32 gk20a_pramin_enter(struct gk20a *g, struct nvgpu_mem *mem,
-                       struct nvgpu_mem_sgl *sgl, u32 w)
+                       struct nvgpu_sgt *sgt, void *sgl, u32 w)
 {
-        u64 bufbase = nvgpu_mem_sgl_phys(sgl);
+        u64 bufbase = nvgpu_sgt_get_phys(sgt, sgl);
        u64 addr = bufbase + w * sizeof(u32);
        u32 hi = (u32)((addr & ~(u64)0xfffff)
                >> bus_bar0_window_target_bar0_window_base_shift_v());
@@ -41,8 +41,8 @@ u32 gk20a_pramin_enter(struct gk20a *g, struct nvgpu_mem *mem,
        gk20a_dbg(gpu_dbg_mem,
                        "0x%08x:%08x begin for %p,%p at [%llx,%llx] (sz %llx)",
                        hi, lo, mem, sgl, bufbase,
-                        bufbase + nvgpu_mem_sgl_phys(sgl),
+                        bufbase + nvgpu_sgt_get_phys(sgt, sgl),
-                        nvgpu_mem_sgl_length(sgl));
+                        nvgpu_sgt_get_length(sgt, sgl));
        WARN_ON(!bufbase);
@@ -58,7 +58,7 @@ u32 gk20a_pramin_enter(struct gk20a *g, struct nvgpu_mem *mem,
 }
 void gk20a_pramin_exit(struct gk20a *g, struct nvgpu_mem *mem,
-                       struct nvgpu_mem_sgl *sgl)
+                       void *sgl)
 {
        gk20a_dbg(gpu_dbg_mem, "end for %p,%p", mem, sgl);
diff --git a/drivers/gpu/nvgpu/gk20a/pramin_gk20a.h b/drivers/gpu/nvgpu/gk20a/pramin_gk20a.h
index fc5ba919..29e76978 100644
--- a/drivers/gpu/nvgpu/gk20a/pramin_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/pramin_gk20a.h
@@ -22,7 +22,7 @@ struct nvgpu_mem;
 struct nvgpu_mem_sgl;
 u32 gk20a_pramin_enter(struct gk20a *g, struct nvgpu_mem *mem,
-                       struct nvgpu_mem_sgl *sgl, u32 w);
+                       struct nvgpu_sgt *sgt, void *sgl, u32 w);
 void gk20a_pramin_exit(struct gk20a *g, struct nvgpu_mem *mem,
-                       struct nvgpu_mem_sgl *sgl);
+                       void *sgl);
 #endif
diff --git a/drivers/gpu/nvgpu/include/nvgpu/linux/nvgpu_mem.h b/drivers/gpu/nvgpu/include/nvgpu/linux/nvgpu_mem.h
index f96c2801..517d834c 100644
--- a/drivers/gpu/nvgpu/include/nvgpu/linux/nvgpu_mem.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/linux/nvgpu_mem.h
@@ -20,6 +20,7 @@
 struct page;
 struct sg_table;
 struct scatterlist;
+struct nvgpu_sgt;
 struct gk20a;
 struct nvgpu_mem;
@@ -32,9 +33,11 @@ struct nvgpu_mem_priv {
 };
 u64 nvgpu_mem_get_addr_sgl(struct gk20a *g, struct scatterlist *sgl);
-struct nvgpu_mem_sgl *nvgpu_mem_sgl_create(struct gk20a *g,
+struct nvgpu_sgt *nvgpu_mem_linux_sgt_create(struct gk20a *g,
+                                           struct sg_table *sgt);
+void nvgpu_mem_linux_sgt_free(struct gk20a *g, struct nvgpu_sgt *sgt);
+struct nvgpu_sgt *nvgpu_linux_sgt_create(struct gk20a *g,
                                           struct sg_table *sgt);
 /**
 * __nvgpu_mem_create_from_pages - Create an nvgpu_mem from physical pages.
 *
diff --git a/drivers/gpu/nvgpu/include/nvgpu/nvgpu_mem.h b/drivers/gpu/nvgpu/include/nvgpu/nvgpu_mem.h
index 7d19cf81..beffbfe8 100644
--- a/drivers/gpu/nvgpu/include/nvgpu/nvgpu_mem.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/nvgpu_mem.h
@@ -46,12 +46,41 @@ enum nvgpu_aperture {
        APERTURE_VIDMEM
 };
+struct nvgpu_sgt_ops {
+        void *(*sgl_next)(void *sgl);
+        u64   (*sgl_phys)(void *sgl);
+        u64   (*sgl_dma)(void *sgl);
+        u64   (*sgl_length)(void *sgl);
+        u64   (*sgl_gpu_addr)(struct gk20a *g, void *sgl,
+                              struct nvgpu_gmmu_attrs *attrs);
+        /*
+         * Note: this operates on the whole SGT not a specific SGL entry.
+         */
+        void  (*sgt_free)(struct gk20a *g, struct nvgpu_sgt *sgt);
+};
+/*
+ * Scatter gather table: this is a list of scatter list entries and the ops for
+ * interacting with those entries.
+ */
+struct nvgpu_sgt {
+        /*
+         * Ops for interacting with the underlying scatter gather list entries.
+         */
+        const struct nvgpu_sgt_ops *ops;
+        /*
+         * The first node in the scatter gather list.
+         */
+        void *sgl;
+};
 /*
 * This struct holds the necessary information for describing a struct
 * nvgpu_mem's scatter gather list.
 *
- * These are created in a platform dependent way. As a result the function
+ * Not all nvgpu_sgt's use this particular implementation. Nor is a given OS
- * definition for allocating these lives in the <nvgpu/_OS_/nvgpu_mem.h> file.
+ * required to use this at all.
 */
 struct nvgpu_mem_sgl {
        /*
@@ -164,6 +193,32 @@ static inline bool nvgpu_mem_is_valid(struct nvgpu_mem *mem)
 }
+/*
+ * Create a nvgpu_sgt of the default implementation
+ */
+struct nvgpu_sgt *nvgpu_sgt_create(struct gk20a *g);
+/**
+ * nvgpu_mem_sgt_create_from_mem - Create a scatter list from an nvgpu_mem.
+ *
+ * @g   - The GPU.
+ * @mem - The source memory allocation to use.
+ *
+ * Create a scatter gather table from the passed @mem struct. This list lets the
+ * calling code iterate across each chunk of a DMA allocation for when that DMA
+ * allocation is not completely contiguous.
+ */
+struct nvgpu_sgt *nvgpu_sgt_create_from_mem(struct gk20a *g,
+                                            struct nvgpu_mem *mem);
+void *nvgpu_sgt_get_next(struct nvgpu_sgt *sgt, void *sgl);
+u64 nvgpu_sgt_get_phys(struct nvgpu_sgt *sgt, void *sgl);
+u64 nvgpu_sgt_get_dma(struct nvgpu_sgt *sgt, void *sgl);
+u64 nvgpu_sgt_get_length(struct nvgpu_sgt *sgt, void *sgl);
+u64 nvgpu_sgt_get_gpu_addr(struct nvgpu_sgt *sgt, struct gk20a *g, void *sgl,
+                           struct nvgpu_gmmu_attrs *attrs);
+void nvgpu_sgt_free(struct nvgpu_sgt *sgt, struct gk20a *g);
 /**
 * nvgpu_mem_create_from_mem - Create a new nvgpu_mem struct from an old one.
 *
@@ -200,27 +255,6 @@ int nvgpu_mem_create_from_mem(struct gk20a *g,
                              struct nvgpu_mem *dest, struct nvgpu_mem *src,
                              int start_page, int nr_pages);
-/**
- * nvgpu_mem_sgl_create_from_mem - Create a scatter list from an nvgpu_mem.
- *
- * @g   - The GPU.
- * @mem - The source memory allocation to use.
- *
- * Create a scatter gather list from the passed @mem struct. This list lets the
- * calling code iterate across each chunk of a DMA allocation for when that DMA
- * allocation is not completely contiguous.
- */
-struct nvgpu_mem_sgl *nvgpu_mem_sgl_create_from_mem(struct gk20a *g,
-                                                    struct nvgpu_mem *mem);
-void nvgpu_mem_sgl_free(struct gk20a *g, struct nvgpu_mem_sgl *sgl);
-struct nvgpu_mem_sgl *nvgpu_mem_sgl_next(struct nvgpu_mem_sgl *sgl);
-u64 nvgpu_mem_sgl_phys(struct nvgpu_mem_sgl *sgl);
-u64 nvgpu_mem_sgl_dma(struct nvgpu_mem_sgl *sgl);
-u64 nvgpu_mem_sgl_length(struct nvgpu_mem_sgl *sgl);
-u64 nvgpu_mem_sgl_gpu_addr(struct gk20a *g, struct nvgpu_mem_sgl *sgl,
-                           struct nvgpu_gmmu_attrs *attrs);
 /*
 * Buffer accessors - wrap between begin() and end() if there is no permanent
 * kernel mapping for this buffer.
diff --git a/drivers/gpu/nvgpu/include/nvgpu/page_allocator.h b/drivers/gpu/nvgpu/include/nvgpu/page_allocator.h
index de83ca7f..b22c55d0 100644
--- a/drivers/gpu/nvgpu/include/nvgpu/page_allocator.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/page_allocator.h
@@ -91,10 +91,10 @@ page_alloc_slab_page_from_list_entry(struct nvgpu_list_node *node)
 */
 struct nvgpu_page_alloc {
        /*
-         * nvgpu_mem_sgl for describing the actual allocation. Convenient for
+         * nvgpu_sgt for describing the actual allocation. Convenient for
         * GMMU mapping.
         */
-        struct nvgpu_mem_sgl *sgl;
+        struct nvgpu_sgt sgt;
        int nr_chunks;
        u64 length;
diff --git a/drivers/gpu/nvgpu/vgpu/gp10b/vgpu_mm_gp10b.c b/drivers/gpu/nvgpu/vgpu/gp10b/vgpu_mm_gp10b.c
index ee9b791a..d9324363 100644
--- a/drivers/gpu/nvgpu/vgpu/gp10b/vgpu_mm_gp10b.c
+++ b/drivers/gpu/nvgpu/vgpu/gp10b/vgpu_mm_gp10b.c
@@ -40,7 +40,7 @@ static inline int add_mem_desc(struct tegra_vgpu_mem_desc *mem_desc,
 static u64 vgpu_gp10b_locked_gmmu_map(struct vm_gk20a *vm,
                                u64 map_offset,
-                                struct nvgpu_mem_sgl *sgl,
+                                struct nvgpu_sgt *sgt,
                                u64 buffer_offset,
                                u64 size,
                                int pgsz_idx,
@@ -66,12 +66,13 @@ static u64 vgpu_gp10b_locked_gmmu_map(struct vm_gk20a *vm,
        void *handle = NULL;
        size_t oob_size;
        u8 prot;
+        void *sgl;
        gk20a_dbg_fn("");
        /* FIXME: add support for sparse mappings */
-        if (WARN_ON(!sgl) || WARN_ON(!g->mm.bypass_smmu))
+        if (WARN_ON(!sgt) || WARN_ON(!g->mm.bypass_smmu))
                return 0;
        if (space_to_skip & (page_size - 1))
@@ -97,7 +98,7 @@ static u64 vgpu_gp10b_locked_gmmu_map(struct vm_gk20a *vm,
                err = -EINVAL;
                goto fail;
        }
+        sgl = sgt->sgl;
        while (sgl) {
                u64 phys_addr;
                u64 chunk_length;
@@ -106,15 +107,15 @@ static u64 vgpu_gp10b_locked_gmmu_map(struct vm_gk20a *vm,
                 * Cut out sgl ents for space_to_skip.
                 */
                if (space_to_skip &&
-                    space_to_skip >= nvgpu_mem_sgl_length(sgl)) {
+                    space_to_skip >= nvgpu_sgt_get_length(sgt, sgl)) {
-                        space_to_skip -= nvgpu_mem_sgl_length(sgl);
+                        space_to_skip -= nvgpu_sgt_get_length(sgt, sgl);
-                        sgl = nvgpu_mem_sgl_next(sgl);
+                        sgl = nvgpu_sgt_get_next(sgt, sgl);
                        continue;
                }
-                phys_addr = nvgpu_mem_sgl_phys(sgl) + space_to_skip;
+                phys_addr = nvgpu_sgt_get_phys(sgt, sgl) + space_to_skip;
                chunk_length = min(size,
-                                   nvgpu_mem_sgl_length(sgl) - space_to_skip);
+                           nvgpu_sgt_get_length(sgt, sgl) - space_to_skip);
                if (add_mem_desc(&mem_desc[mem_desc_count++], phys_addr,
                                 chunk_length, &oob_size)) {
@@ -124,7 +125,7 @@ static u64 vgpu_gp10b_locked_gmmu_map(struct vm_gk20a *vm,
                space_to_skip = 0;
                size -= chunk_length;
-                sgl   = nvgpu_mem_sgl_next(sgl);
+                sgl   = nvgpu_sgt_get_next(sgt, sgl);
                if (size == 0)
                        break;
diff --git a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
index 5da6f158..adb01ae5 100644
--- a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
+++ b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
@@ -78,7 +78,7 @@ int vgpu_init_mm_support(struct gk20a *g)
 static u64 vgpu_locked_gmmu_map(struct vm_gk20a *vm,
                                u64 map_offset,
-                                struct nvgpu_mem_sgl *sgl,
+                                struct nvgpu_sgt *sgt,
                                u64 buffer_offset,
                                u64 size,
                                int pgsz_idx,
@@ -98,7 +98,7 @@ static u64 vgpu_locked_gmmu_map(struct vm_gk20a *vm,
        struct dma_iommu_mapping *mapping = to_dma_iommu_mapping(d);
        struct tegra_vgpu_cmd_msg msg;
        struct tegra_vgpu_as_map_params *p = &msg.params.as_map;
-        u64 addr = nvgpu_mem_sgl_gpu_addr(g, sgl, NULL);
+        u64 addr = nvgpu_sgt_get_gpu_addr(sgt, g, sgt->sgl, NULL);
        u8 prot;
        gk20a_dbg_fn("");