3 files changed, 5 insertions, 486 deletions
diff --git a/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c b/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c
index 54317195..82bf7b3e 100644
--- a/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c
@@ -1924,7 +1924,7 @@ static int gk20a_perfbuf_map(struct dbg_session_gk20a *dbg_s,
 err_unmap:
        nvgpu_vm_unmap_buffer(vm, args->offset, NULL);
 err_remove_vm:
-        nvgpu_remove_vm(vm, &mm->perfbuf.inst_block);
+        nvgpu_vm_remove(vm, &mm->perfbuf.inst_block);
        nvgpu_mutex_release(&g->dbg_sessions_lock);
        return err;
 }
@@ -1962,7 +1962,7 @@ static int gk20a_perfbuf_release_locked(struct gk20a *g, u64 offset)
        err = gk20a_perfbuf_disable_locked(g);
        nvgpu_vm_unmap_buffer(vm, offset, NULL);
-        nvgpu_remove_vm(vm, &mm->perfbuf.inst_block);
+        nvgpu_vm_remove(vm, &mm->perfbuf.inst_block);
        g->perfbuf.owner = NULL;
        g->perfbuf.offset = 0;
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index 2642a0b1..17f1622f 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -476,9 +476,9 @@ static void gk20a_remove_mm_support(struct mm_gk20a *mm)
                g->ops.mm.remove_bar2_vm(g);
        if (g->ops.mm.is_bar1_supported(g))
-                nvgpu_remove_vm(&mm->bar1.vm, &mm->bar1.inst_block);
+                nvgpu_vm_remove(&mm->bar1.vm, &mm->bar1.inst_block);
-        nvgpu_remove_vm(&mm->pmu.vm, &mm->pmu.inst_block);
+        nvgpu_vm_remove(&mm->pmu.vm, &mm->pmu.inst_block);
        gk20a_free_inst_block(gk20a_from_mm(mm), &mm->hwpm.inst_block);
        nvgpu_vm_remove_support_nofree(&mm->cde.vm);
@@ -779,52 +779,6 @@ void gk20a_init_mm_ce_context(struct gk20a *g)
 #endif
 }
-static int alloc_gmmu_phys_pages(struct vm_gk20a *vm, u32 order,
-                                 struct gk20a_mm_entry *entry)
-{
-        u32 num_pages = 1 << order;
-        u32 len = num_pages * PAGE_SIZE;
-        int err;
-        struct page *pages;
-        struct gk20a *g = vm->mm->g;
-        gk20a_dbg_fn("");
-        /* note: mem_desc slightly abused (wrt. alloc_gmmu_pages) */
-        pages = alloc_pages(GFP_KERNEL, order);
-        if (!pages) {
-                gk20a_dbg(gpu_dbg_pte, "alloc_pages failed");
-                goto err_out;
-        }
-        entry->mem.priv.sgt = nvgpu_kzalloc(g, sizeof(*entry->mem.priv.sgt));
-        if (!entry->mem.priv.sgt) {
-                gk20a_dbg(gpu_dbg_pte, "cannot allocate sg table");
-                goto err_alloced;
-        }
-        err = sg_alloc_table(entry->mem.priv.sgt, 1, GFP_KERNEL);
-        if (err) {
-                gk20a_dbg(gpu_dbg_pte, "sg_alloc_table failed");
-                goto err_sg_table;
-        }
-        sg_set_page(entry->mem.priv.sgt->sgl, pages, len, 0);
-        entry->mem.cpu_va = page_address(pages);
-        memset(entry->mem.cpu_va, 0, len);
-        entry->mem.size = len;
-        entry->mem.aperture = APERTURE_SYSMEM;
-        FLUSH_CPU_DCACHE(entry->mem.cpu_va,
-                         sg_phys(entry->mem.priv.sgt->sgl), len);
-        return 0;
-err_sg_table:
-        nvgpu_kfree(vm->mm->g, entry->mem.priv.sgt);
-err_alloced:
-        __free_pages(pages, order);
-err_out:
-        return -ENOMEM;
-}
 static void free_gmmu_phys_pages(struct vm_gk20a *vm,
                            struct gk20a_mm_entry *entry)
 {
@@ -857,38 +811,6 @@ static void unmap_gmmu_phys_pages(struct gk20a_mm_entry *entry)
                         entry->mem.priv.sgt->sgl->length);
 }
-static int alloc_gmmu_pages(struct vm_gk20a *vm, u32 order,
-                            struct gk20a_mm_entry *entry)
-{
-        struct gk20a *g = gk20a_from_vm(vm);
-        u32 num_pages = 1 << order;
-        u32 len = num_pages * PAGE_SIZE;
-        int err;
-        gk20a_dbg_fn("");
-        if (g->is_fmodel)
-                return alloc_gmmu_phys_pages(vm, order, entry);
-        /*
-         * On arm32 we're limited by vmalloc space, so we do not map pages by
-         * default.
-         */
-        if (IS_ENABLED(CONFIG_ARM64))
-                err = nvgpu_dma_alloc(g, len, &entry->mem);
-        else
-                err = nvgpu_dma_alloc_flags(g, NVGPU_DMA_NO_KERNEL_MAPPING,
-                                len, &entry->mem);
-        if (err) {
-                nvgpu_err(g, "memory allocation failed");
-                return -ENOMEM;
-        }
-        return 0;
-}
 void free_gmmu_pages(struct vm_gk20a *vm,
                     struct gk20a_mm_entry *entry)
 {
@@ -955,72 +877,6 @@ void unmap_gmmu_pages(struct gk20a *g, struct gk20a_mm_entry *entry)
        }
 }
-/*
- * Allocate a phys contig region big enough for a full
- * sized gmmu page table for the given gmmu_page_size.
- * the whole range is zeroed so it's "invalid"/will fault.
- *
- * If a previous entry is supplied, its memory will be used for
- * suballocation for this next entry too, if there is space.
- */
-static int gk20a_zalloc_gmmu_page_table(struct vm_gk20a *vm,
-                                 enum gmmu_pgsz_gk20a pgsz_idx,
-                                 const struct gk20a_mmu_level *l,
-                                 struct gk20a_mm_entry *entry,
-                                 struct gk20a_mm_entry *prev_entry)
-{
-        int err = -ENOMEM;
-        int order;
-        struct gk20a *g = gk20a_from_vm(vm);
-        u32 bytes;
-        gk20a_dbg_fn("");
-        /* allocate enough pages for the table */
-        order = l->hi_bit[pgsz_idx] - l->lo_bit[pgsz_idx] + 1;
-        order += ilog2(l->entry_size);
-        bytes = 1 << order;
-        order -= PAGE_SHIFT;
-        if (order < 0 && prev_entry) {
-                /* try to suballocate from previous chunk */
-                u32 capacity = prev_entry->mem.size / bytes;
-                u32 prev = prev_entry->woffset * sizeof(u32) / bytes;
-                u32 free = capacity - prev - 1;
-                gk20a_dbg(gpu_dbg_pte, "cap %d prev %d free %d bytes %d",
-                                capacity, prev, free, bytes);
-                if (free) {
-                        memcpy(&entry->mem, &prev_entry->mem,
-                                        sizeof(entry->mem));
-                        entry->woffset = prev_entry->woffset
-                                + bytes / sizeof(u32);
-                        err = 0;
-                }
-        }
-        if (err) {
-                /* no suballoc space */
-                order = max(0, order);
-                err = alloc_gmmu_pages(vm, order, entry);
-                entry->woffset = 0;
-        }
-        gk20a_dbg(gpu_dbg_pte, "entry = 0x%p, addr=%08llx, size %d, woff %x",
-                  entry,
-                  (entry->mem.priv.sgt &&
-                   entry->mem.aperture == APERTURE_SYSMEM) ?
-                  g->ops.mm.get_iova_addr(g, entry->mem.priv.sgt->sgl, 0) : 0,
-                  order, entry->woffset);
-        if (err)
-                return err;
-        entry->pgsz = pgsz_idx;
-        entry->mem.skip_wmb = true;
-        return err;
-}
 int gk20a_mm_pde_coverage_bit_count(struct vm_gk20a *vm)
 {
        return vm->mmu_levels[0].lo_bit[0];
@@ -2230,7 +2086,7 @@ static int update_gmmu_level_locked(struct vm_gk20a *vm,
                        next_pte = pte->entries + pde_i;
                        if (!next_pte->mem.size) {
-                                err = gk20a_zalloc_gmmu_page_table(vm,
+                                err = nvgpu_zalloc_gmmu_page_table(vm,
                                        pgsz_idx, next_l, next_pte, prev_pte);
                                if (err)
                                        return err;
@@ -2523,75 +2379,6 @@ const struct gk20a_mmu_level gk20a_mm_levels_128k[] = {
 };
 /*
- * Initialize a semaphore pool. Just return successfully if we do not need
- * semaphores (i.e when sync-pts are active).
- */
-static int gk20a_init_sema_pool(struct vm_gk20a *vm)
-{
-        struct nvgpu_semaphore_sea *sema_sea;
-        struct mm_gk20a *mm = vm->mm;
-        struct gk20a *g = mm->g;
-        int err;
-        /*
-         * Don't waste the memory on semaphores if we don't need them.
-         */
-        if (g->gpu_characteristics.flags & NVGPU_GPU_FLAGS_HAS_SYNCPOINTS)
-                return 0;
-        if (vm->sema_pool)
-                return 0;
-        sema_sea = nvgpu_semaphore_sea_create(g);
-        if (!sema_sea)
-                return -ENOMEM;
-        vm->sema_pool = nvgpu_semaphore_pool_alloc(sema_sea);
-        if (!vm->sema_pool)
-                return -ENOMEM;
-        /*
-         * Allocate a chunk of GPU VA space for mapping the semaphores. We will
-         * do a fixed alloc in the kernel VM so that all channels have the same
-         * RO address range for the semaphores.
-         *
-         * !!! TODO: cleanup.
-         */
-        sema_sea->gpu_va = nvgpu_alloc_fixed(&vm->kernel,
-                                             vm->va_limit -
-                                             mm->channel.kernel_size,
-                                             512 * PAGE_SIZE,
-                                             SZ_4K);
-        if (!sema_sea->gpu_va) {
-                nvgpu_free(&vm->kernel, sema_sea->gpu_va);
-                nvgpu_vm_put(vm);
-                return -ENOMEM;
-        }
-        err = nvgpu_semaphore_pool_map(vm->sema_pool, vm);
-        if (err) {
-                nvgpu_semaphore_pool_unmap(vm->sema_pool, vm);
-                nvgpu_free(vm->vma[gmmu_page_size_small],
-                           vm->sema_pool->gpu_va);
-                return err;
-        }
-        return 0;
-}
-/*
- * Determine if the passed address space can support big pages or not.
- */
-int gk20a_big_pages_possible(struct vm_gk20a *vm, u64 base, u64 size)
-{
-        u64 mask = ((u64)vm->big_page_size << 10) - 1;
-        if (base & mask || size & mask)
-                return 0;
-        return 1;
-}
-/*
 * Attempt to find a reserved memory area to determine PTE size for the passed
 * mapping. If no reserved area can be found use small pages.
 */
@@ -2661,272 +2448,6 @@ enum gmmu_pgsz_gk20a __get_pte_size(struct vm_gk20a *vm, u64 base, u64 size)
        return gmmu_page_size_small;
 }
-static int init_vm_page_tables(struct vm_gk20a *vm)
-{
-        u32 pde_lo, pde_hi;
-        int err;
-        pde_range_from_vaddr_range(vm,
-                                   0, vm->va_limit-1,
-                                   &pde_lo, &pde_hi);
-        vm->pdb.entries = nvgpu_vzalloc(vm->mm->g,
-                                        sizeof(struct gk20a_mm_entry) *
-                                        (pde_hi + 1));
-        vm->pdb.num_entries = pde_hi + 1;
-        if (!vm->pdb.entries)
-                return -ENOMEM;
-        err = gk20a_zalloc_gmmu_page_table(vm, 0, &vm->mmu_levels[0],
-                                           &vm->pdb, NULL);
-        if (err) {
-                nvgpu_vfree(vm->mm->g, vm->pdb.entries);
-                return err;
-        }
-        return 0;
-}
-/**
- * nvgpu_init_vm() - Initialize an address space.
- *
- * @mm - Parent MM.
- * @vm - The VM to init.
- * @big_page_size - Size of big pages associated with this VM.
- * @low_hole - The size of the low hole (unaddressable memory at the bottom of
- *             the address space.
- * @kernel_reserved - Space reserved for kernel only allocations.
- * @aperture_size - Total size of the aperture.
- * @big_pages - Ignored. Will be set based on other passed params.
- * @name - Name of the address space.
- *
- * This function initializes an address space according to the following map:
- *
- *     +--+ 0x0
- *     |  |
- *     +--+ @low_hole
- *     |  |
- *     ~  ~   This is the "user" section.
- *     |  |
- *     +--+ @aperture_size - @kernel_reserved
- *     |  |
- *     ~  ~   This is the "kernel" section.
- *     |  |
- *     +--+ @aperture_size
- *
- * The user section is therefor what ever is left over after the @low_hole and
- * @kernel_reserved memory have been portioned out. The @kernel_reserved is
- * always persent at the top of the memory space and the @low_hole is always at
- * the bottom.
- *
- * For certain address spaces a "user" section makes no sense (bar1, etc) so in
- * such cases the @kernel_reserved and @low_hole should sum to exactly
- * @aperture_size.
- */
-int nvgpu_init_vm(struct mm_gk20a *mm,
-                struct vm_gk20a *vm,
-                u32 big_page_size,
-                u64 low_hole,
-                u64 kernel_reserved,
-                u64 aperture_size,
-                bool big_pages,
-                bool userspace_managed,
-                char *name)
-{
-        int err;
-        char alloc_name[32];
-        u64 kernel_vma_flags;
-        u64 user_vma_start, user_vma_limit;
-        u64 user_lp_vma_start, user_lp_vma_limit;
-        u64 kernel_vma_start, kernel_vma_limit;
-        struct gk20a *g = mm->g;
-        struct gk20a_platform *p = gk20a_get_platform(g->dev);
-        if (WARN_ON(kernel_reserved + low_hole > aperture_size))
-                return -ENOMEM;
-        gk20a_dbg_info("Init space for %s: va_limit=0x%llx, "
-                       "big_page_size=0x%x low_hole=0x%llx",
-                       name, aperture_size,
-                       (unsigned int)big_page_size, low_hole);
-        vm->mm = mm;
-        vm->gmmu_page_sizes[gmmu_page_size_small]  = SZ_4K;
-        vm->gmmu_page_sizes[gmmu_page_size_big]    = big_page_size;
-        vm->gmmu_page_sizes[gmmu_page_size_kernel] = SZ_4K;
-        /* Set up vma pointers. */
-        vm->vma[gmmu_page_size_small]  = &vm->user;
-        vm->vma[gmmu_page_size_big]    = &vm->user;
-        vm->vma[gmmu_page_size_kernel] = &vm->kernel;
-        if (!p->unify_address_spaces)
-                vm->vma[gmmu_page_size_big] = &vm->user_lp;
-        vm->va_start  = low_hole;
-        vm->va_limit  = aperture_size;
-        vm->big_pages = big_pages;
-        vm->big_page_size     = vm->gmmu_page_sizes[gmmu_page_size_big];
-        vm->userspace_managed = userspace_managed;
-        vm->mmu_levels        = g->ops.mm.get_mmu_levels(g, vm->big_page_size);
-        /* Initialize the page table data structures. */
-        err = init_vm_page_tables(vm);
-        if (err)
-                return err;
-        /* Setup vma limits. */
-        if (kernel_reserved + low_hole < aperture_size) {
-                if (p->unify_address_spaces) {
-                        user_vma_start = low_hole;
-                        user_vma_limit = vm->va_limit - kernel_reserved;
-                        user_lp_vma_start = user_vma_limit;
-                        user_lp_vma_limit = user_vma_limit;
-                } else {
-                        user_vma_start = low_hole;
-                        user_vma_limit = __nv_gmmu_va_small_page_limit();
-                        user_lp_vma_start = __nv_gmmu_va_small_page_limit();
-                        user_lp_vma_limit = vm->va_limit - kernel_reserved;
-                }
-        } else {
-                user_vma_start = 0;
-                user_vma_limit = 0;
-                user_lp_vma_start = 0;
-                user_lp_vma_limit = 0;
-        }
-        kernel_vma_start = vm->va_limit - kernel_reserved;
-        kernel_vma_limit = vm->va_limit;
-        gk20a_dbg_info("user_vma     [0x%llx,0x%llx)",
-                       user_vma_start, user_vma_limit);
-        gk20a_dbg_info("user_lp_vma  [0x%llx,0x%llx)",
-                       user_lp_vma_start, user_lp_vma_limit);
-        gk20a_dbg_info("kernel_vma   [0x%llx,0x%llx)",
-                       kernel_vma_start, kernel_vma_limit);
-        if (WARN_ON(user_vma_start > user_vma_limit) ||
-            WARN_ON(user_lp_vma_start > user_lp_vma_limit) ||
-            WARN_ON(kernel_vma_start >= kernel_vma_limit)) {
-                err = -EINVAL;
-                goto clean_up_page_tables;
-        }
-        kernel_vma_flags = (kernel_reserved + low_hole) == aperture_size ?
-                0 : GPU_ALLOC_GVA_SPACE;
-        /*
-         * A "user" area only makes sense for the GVA spaces. For VMs where
-         * there is no "user" area user_vma_start will be equal to
-         * user_vma_limit (i.e a 0 sized space). In such a situation the kernel
-         * area must be non-zero in length.
-         */
-        if (user_vma_start >= user_vma_limit &&
-            kernel_vma_start >= kernel_vma_limit) {
-                err = -EINVAL;
-                goto clean_up_page_tables;
-        }
-        /*
-         * Determine if big pages are possible in this VM. If a split address
-         * space is used then check the user_lp vma instead of the user vma.
-         */
-        if (p->unify_address_spaces)
-                vm->big_pages = gk20a_big_pages_possible(vm, user_vma_start,
-                                         user_vma_limit - user_vma_start);
-        else
-                vm->big_pages = gk20a_big_pages_possible(vm, user_lp_vma_start,
-                                         user_lp_vma_limit - user_lp_vma_start);
-        /*
-         * User VMA.
-         */
-        if (user_vma_start < user_vma_limit) {
-                snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s", name);
-                err = __nvgpu_buddy_allocator_init(g, &vm->user,
-                                                   vm, alloc_name,
-                                                   user_vma_start,
-                                                   user_vma_limit -
-                                                   user_vma_start,
-                                                   SZ_4K,
-                                                   GPU_BALLOC_MAX_ORDER,
-                                                   GPU_ALLOC_GVA_SPACE);
-                if (err)
-                        goto clean_up_page_tables;
-        } else {
-                /*
-                 * Make these allocator pointers point to the kernel allocator
-                 * since we still use the legacy notion of page size to choose
-                 * the allocator.
-                 */
-                vm->vma[0] = &vm->kernel;
-                vm->vma[1] = &vm->kernel;
-        }
-        /*
-         * User VMA for large pages when a split address range is used.
-         */
-        if (user_lp_vma_start < user_lp_vma_limit) {
-                snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s_lp", name);
-                err = __nvgpu_buddy_allocator_init(g, &vm->user_lp,
-                                                   vm, alloc_name,
-                                                   user_lp_vma_start,
-                                                   user_lp_vma_limit -
-                                                   user_lp_vma_start,
-                                                   vm->big_page_size,
-                                                   GPU_BALLOC_MAX_ORDER,
-                                                   GPU_ALLOC_GVA_SPACE);
-                if (err)
-                        goto clean_up_allocators;
-        }
-        /*
-         * Kernel VMA. Must always exist for an address space.
-         */
-        snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s-sys", name);
-        err = __nvgpu_buddy_allocator_init(g, &vm->kernel,
-                                           vm, alloc_name,
-                                           kernel_vma_start,
-                                           kernel_vma_limit - kernel_vma_start,
-                                           SZ_4K,
-                                           GPU_BALLOC_MAX_ORDER,
-                                           kernel_vma_flags);
-        if (err)
-                goto clean_up_allocators;
-        vm->mapped_buffers = NULL;
-        nvgpu_mutex_init(&vm->update_gmmu_lock);
-        kref_init(&vm->ref);
-        nvgpu_init_list_node(&vm->vm_area_list);
-        /*
-         * This is only necessary for channel address spaces. The best way to
-         * distinguish channel address spaces from other address spaces is by
-         * size - if the address space is 4GB or less, it's not a channel.
-         */
-        if (vm->va_limit > SZ_4G) {
-                err = gk20a_init_sema_pool(vm);
-                if (err)
-                        goto clean_up_allocators;
-        }
-        return 0;
-clean_up_allocators:
-        if (nvgpu_alloc_initialized(&vm->kernel))
-                nvgpu_alloc_destroy(&vm->kernel);
-        if (nvgpu_alloc_initialized(&vm->user))
-                nvgpu_alloc_destroy(&vm->user);
-        if (nvgpu_alloc_initialized(&vm->user_lp))
-                nvgpu_alloc_destroy(&vm->user_lp);
-clean_up_page_tables:
-        /* Cleans up init_vm_page_tables() */
-        nvgpu_vfree(g, vm->pdb.entries);
-        free_gmmu_pages(vm, &vm->pdb);
-        return err;
-}
 /* address space interfaces for the gk20a module */
 int gk20a_vm_alloc_share(struct gk20a_as_share *as_share, u32 big_page_size,
                         u32 flags)
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index 27681199..90a72811 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -456,8 +456,6 @@ const struct gk20a_mmu_level *gk20a_mm_get_mmu_levels(struct gk20a *g,
 void gk20a_mm_init_pdb(struct gk20a *g, struct nvgpu_mem *mem,
                struct vm_gk20a *vm);
-int gk20a_big_pages_possible(struct vm_gk20a *vm, u64 base, u64 size);
 extern const struct gk20a_mmu_level gk20a_mm_levels_64k[];
 extern const struct gk20a_mmu_level gk20a_mm_levels_128k[];

diff --git a/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c b/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c index 54317195..82bf7b3e 100644 --- a/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/dbg_gpu_gk20a.c
@@ -1924,7 +1924,7 @@ static int gk20a_perfbuf_map(struct dbg_session_gk20a *dbg_s,
1924	err_unmap:	1924	err_unmap:
1925	nvgpu_vm_unmap_buffer(vm, args->offset, NULL);	1925	nvgpu_vm_unmap_buffer(vm, args->offset, NULL);
1926	err_remove_vm:	1926	err_remove_vm:
1927	nvgpu_remove_vm(vm, &mm->perfbuf.inst_block);	1927	nvgpu_vm_remove(vm, &mm->perfbuf.inst_block);
1928	nvgpu_mutex_release(&g->dbg_sessions_lock);	1928	nvgpu_mutex_release(&g->dbg_sessions_lock);
1929	return err;	1929	return err;
1930	}	1930	}
@@ -1962,7 +1962,7 @@ static int gk20a_perfbuf_release_locked(struct gk20a *g, u64 offset)
1962	err = gk20a_perfbuf_disable_locked(g);	1962	err = gk20a_perfbuf_disable_locked(g);
1963		1963
1964	nvgpu_vm_unmap_buffer(vm, offset, NULL);	1964	nvgpu_vm_unmap_buffer(vm, offset, NULL);
1965	nvgpu_remove_vm(vm, &mm->perfbuf.inst_block);	1965	nvgpu_vm_remove(vm, &mm->perfbuf.inst_block);
1966		1966
1967	g->perfbuf.owner = NULL;	1967	g->perfbuf.owner = NULL;
1968	g->perfbuf.offset = 0;	1968	g->perfbuf.offset = 0;


diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c index 2642a0b1..17f1622f 100644 --- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -476,9 +476,9 @@ static void gk20a_remove_mm_support(struct mm_gk20a *mm)
476	g->ops.mm.remove_bar2_vm(g);	476	g->ops.mm.remove_bar2_vm(g);
477		477
478	if (g->ops.mm.is_bar1_supported(g))	478	if (g->ops.mm.is_bar1_supported(g))
479	nvgpu_remove_vm(&mm->bar1.vm, &mm->bar1.inst_block);	479	nvgpu_vm_remove(&mm->bar1.vm, &mm->bar1.inst_block);
480		480
481	nvgpu_remove_vm(&mm->pmu.vm, &mm->pmu.inst_block);	481	nvgpu_vm_remove(&mm->pmu.vm, &mm->pmu.inst_block);
482	gk20a_free_inst_block(gk20a_from_mm(mm), &mm->hwpm.inst_block);	482	gk20a_free_inst_block(gk20a_from_mm(mm), &mm->hwpm.inst_block);
483	nvgpu_vm_remove_support_nofree(&mm->cde.vm);	483	nvgpu_vm_remove_support_nofree(&mm->cde.vm);
484		484
@@ -779,52 +779,6 @@ void gk20a_init_mm_ce_context(struct gk20a *g)
779	#endif	779	#endif
780	}	780	}
781		781
782	static int alloc_gmmu_phys_pages(struct vm_gk20a *vm, u32 order,
783	struct gk20a_mm_entry *entry)
784	{
785	u32 num_pages = 1 << order;
786	u32 len = num_pages * PAGE_SIZE;
787	int err;
788	struct page *pages;
789	struct gk20a *g = vm->mm->g;
790
791	gk20a_dbg_fn("");
792
793	/* note: mem_desc slightly abused (wrt. alloc_gmmu_pages) */
794
795	pages = alloc_pages(GFP_KERNEL, order);
796	if (!pages) {
797	gk20a_dbg(gpu_dbg_pte, "alloc_pages failed");
798	goto err_out;
799	}
800	entry->mem.priv.sgt = nvgpu_kzalloc(g, sizeof(*entry->mem.priv.sgt));
801	if (!entry->mem.priv.sgt) {
802	gk20a_dbg(gpu_dbg_pte, "cannot allocate sg table");
803	goto err_alloced;
804	}
805	err = sg_alloc_table(entry->mem.priv.sgt, 1, GFP_KERNEL);
806	if (err) {
807	gk20a_dbg(gpu_dbg_pte, "sg_alloc_table failed");
808	goto err_sg_table;
809	}
810	sg_set_page(entry->mem.priv.sgt->sgl, pages, len, 0);
811	entry->mem.cpu_va = page_address(pages);
812	memset(entry->mem.cpu_va, 0, len);
813	entry->mem.size = len;
814	entry->mem.aperture = APERTURE_SYSMEM;
815	FLUSH_CPU_DCACHE(entry->mem.cpu_va,
816	sg_phys(entry->mem.priv.sgt->sgl), len);
817
818	return 0;
819
820	err_sg_table:
821	nvgpu_kfree(vm->mm->g, entry->mem.priv.sgt);
822	err_alloced:
823	__free_pages(pages, order);
824	err_out:
825	return -ENOMEM;
826	}
827
828	static void free_gmmu_phys_pages(struct vm_gk20a *vm,	782	static void free_gmmu_phys_pages(struct vm_gk20a *vm,
829	struct gk20a_mm_entry *entry)	783	struct gk20a_mm_entry *entry)
830	{	784	{
@@ -857,38 +811,6 @@ static void unmap_gmmu_phys_pages(struct gk20a_mm_entry *entry)
857	entry->mem.priv.sgt->sgl->length);	811	entry->mem.priv.sgt->sgl->length);
858	}	812	}
859		813
860	static int alloc_gmmu_pages(struct vm_gk20a *vm, u32 order,
861	struct gk20a_mm_entry *entry)
862	{
863	struct gk20a *g = gk20a_from_vm(vm);
864	u32 num_pages = 1 << order;
865	u32 len = num_pages * PAGE_SIZE;
866	int err;
867
868	gk20a_dbg_fn("");
869
870	if (g->is_fmodel)
871	return alloc_gmmu_phys_pages(vm, order, entry);
872
873	/*
874	* On arm32 we're limited by vmalloc space, so we do not map pages by
875	* default.
876	*/
877	if (IS_ENABLED(CONFIG_ARM64))
878	err = nvgpu_dma_alloc(g, len, &entry->mem);
879	else
880	err = nvgpu_dma_alloc_flags(g, NVGPU_DMA_NO_KERNEL_MAPPING,
881	len, &entry->mem);
882
883
884	if (err) {
885	nvgpu_err(g, "memory allocation failed");
886	return -ENOMEM;
887	}
888
889	return 0;
890	}
891
892	void free_gmmu_pages(struct vm_gk20a *vm,	814	void free_gmmu_pages(struct vm_gk20a *vm,
893	struct gk20a_mm_entry *entry)	815	struct gk20a_mm_entry *entry)
894	{	816	{
@@ -955,72 +877,6 @@ void unmap_gmmu_pages(struct gk20a g, struct gk20a_mm_entry entry)
955	}	877	}
956	}	878	}
957		879
958	/*
959	* Allocate a phys contig region big enough for a full
960	* sized gmmu page table for the given gmmu_page_size.
961	* the whole range is zeroed so it's "invalid"/will fault.
962	*
963	* If a previous entry is supplied, its memory will be used for
964	* suballocation for this next entry too, if there is space.
965	*/
966
967	static int gk20a_zalloc_gmmu_page_table(struct vm_gk20a *vm,
968	enum gmmu_pgsz_gk20a pgsz_idx,
969	const struct gk20a_mmu_level *l,
970	struct gk20a_mm_entry *entry,
971	struct gk20a_mm_entry *prev_entry)
972	{
973	int err = -ENOMEM;
974	int order;
975	struct gk20a *g = gk20a_from_vm(vm);
976	u32 bytes;
977
978	gk20a_dbg_fn("");
979
980	/* allocate enough pages for the table */
981	order = l->hi_bit[pgsz_idx] - l->lo_bit[pgsz_idx] + 1;
982	order += ilog2(l->entry_size);
983	bytes = 1 << order;
984	order -= PAGE_SHIFT;
985	if (order < 0 && prev_entry) {
986	/* try to suballocate from previous chunk */
987	u32 capacity = prev_entry->mem.size / bytes;
988	u32 prev = prev_entry->woffset * sizeof(u32) / bytes;
989	u32 free = capacity - prev - 1;
990
991	gk20a_dbg(gpu_dbg_pte, "cap %d prev %d free %d bytes %d",
992	capacity, prev, free, bytes);
993
994	if (free) {
995	memcpy(&entry->mem, &prev_entry->mem,
996	sizeof(entry->mem));
997	entry->woffset = prev_entry->woffset
998	+ bytes / sizeof(u32);
999	err = 0;
1000	}
1001	}
1002
1003	if (err) {
1004	/* no suballoc space */
1005	order = max(0, order);
1006	err = alloc_gmmu_pages(vm, order, entry);
1007	entry->woffset = 0;
1008	}
1009
1010	gk20a_dbg(gpu_dbg_pte, "entry = 0x%p, addr=%08llx, size %d, woff %x",
1011	entry,
1012	(entry->mem.priv.sgt &&
1013	entry->mem.aperture == APERTURE_SYSMEM) ?
1014	g->ops.mm.get_iova_addr(g, entry->mem.priv.sgt->sgl, 0) : 0,
1015	order, entry->woffset);
1016	if (err)
1017	return err;
1018	entry->pgsz = pgsz_idx;
1019	entry->mem.skip_wmb = true;
1020
1021	return err;
1022	}
1023
1024	int gk20a_mm_pde_coverage_bit_count(struct vm_gk20a *vm)	880	int gk20a_mm_pde_coverage_bit_count(struct vm_gk20a *vm)
1025	{	881	{
1026	return vm->mmu_levels[0].lo_bit[0];	882	return vm->mmu_levels[0].lo_bit[0];
@@ -2230,7 +2086,7 @@ static int update_gmmu_level_locked(struct vm_gk20a *vm,
2230	next_pte = pte->entries + pde_i;	2086	next_pte = pte->entries + pde_i;
2231		2087
2232	if (!next_pte->mem.size) {	2088	if (!next_pte->mem.size) {
2233	err = gk20a_zalloc_gmmu_page_table(vm,	2089	err = nvgpu_zalloc_gmmu_page_table(vm,
2234	pgsz_idx, next_l, next_pte, prev_pte);	2090	pgsz_idx, next_l, next_pte, prev_pte);
2235	if (err)	2091	if (err)
2236	return err;	2092	return err;
@@ -2523,75 +2379,6 @@ const struct gk20a_mmu_level gk20a_mm_levels_128k[] = {
2523	};	2379	};
2524		2380
2525	/*	2381	/*
2526	* Initialize a semaphore pool. Just return successfully if we do not need
2527	* semaphores (i.e when sync-pts are active).
2528	*/
2529	static int gk20a_init_sema_pool(struct vm_gk20a *vm)
2530	{
2531	struct nvgpu_semaphore_sea *sema_sea;
2532	struct mm_gk20a *mm = vm->mm;
2533	struct gk20a *g = mm->g;
2534	int err;
2535
2536	/*
2537	* Don't waste the memory on semaphores if we don't need them.
2538	*/
2539	if (g->gpu_characteristics.flags & NVGPU_GPU_FLAGS_HAS_SYNCPOINTS)
2540	return 0;
2541
2542	if (vm->sema_pool)
2543	return 0;
2544
2545	sema_sea = nvgpu_semaphore_sea_create(g);
2546	if (!sema_sea)
2547	return -ENOMEM;
2548
2549	vm->sema_pool = nvgpu_semaphore_pool_alloc(sema_sea);
2550	if (!vm->sema_pool)
2551	return -ENOMEM;
2552
2553	/*
2554	* Allocate a chunk of GPU VA space for mapping the semaphores. We will
2555	* do a fixed alloc in the kernel VM so that all channels have the same
2556	* RO address range for the semaphores.
2557	*
2558	* !!! TODO: cleanup.
2559	*/
2560	sema_sea->gpu_va = nvgpu_alloc_fixed(&vm->kernel,
2561	vm->va_limit -
2562	mm->channel.kernel_size,
2563	512 * PAGE_SIZE,
2564	SZ_4K);
2565	if (!sema_sea->gpu_va) {
2566	nvgpu_free(&vm->kernel, sema_sea->gpu_va);
2567	nvgpu_vm_put(vm);
2568	return -ENOMEM;
2569	}
2570
2571	err = nvgpu_semaphore_pool_map(vm->sema_pool, vm);
2572	if (err) {
2573	nvgpu_semaphore_pool_unmap(vm->sema_pool, vm);
2574	nvgpu_free(vm->vma[gmmu_page_size_small],
2575	vm->sema_pool->gpu_va);
2576	return err;
2577	}
2578
2579	return 0;
2580	}
2581
2582	/*
2583	* Determine if the passed address space can support big pages or not.
2584	*/
2585	int gk20a_big_pages_possible(struct vm_gk20a *vm, u64 base, u64 size)
2586	{
2587	u64 mask = ((u64)vm->big_page_size << 10) - 1;
2588
2589	if (base & mask \|\| size & mask)
2590	return 0;
2591	return 1;
2592	}
2593
2594	/*
2595	* Attempt to find a reserved memory area to determine PTE size for the passed	2382	* Attempt to find a reserved memory area to determine PTE size for the passed
2596	* mapping. If no reserved area can be found use small pages.	2383	* mapping. If no reserved area can be found use small pages.
2597	*/	2384	*/
@@ -2661,272 +2448,6 @@ enum gmmu_pgsz_gk20a __get_pte_size(struct vm_gk20a *vm, u64 base, u64 size)
2661	return gmmu_page_size_small;	2448	return gmmu_page_size_small;
2662	}	2449	}
2663		2450
2664	static int init_vm_page_tables(struct vm_gk20a *vm)
2665	{
2666	u32 pde_lo, pde_hi;
2667	int err;
2668
2669	pde_range_from_vaddr_range(vm,
2670	0, vm->va_limit-1,
2671	&pde_lo, &pde_hi);
2672	vm->pdb.entries = nvgpu_vzalloc(vm->mm->g,
2673	sizeof(struct gk20a_mm_entry) *
2674	(pde_hi + 1));
2675	vm->pdb.num_entries = pde_hi + 1;
2676
2677	if (!vm->pdb.entries)
2678	return -ENOMEM;
2679
2680	err = gk20a_zalloc_gmmu_page_table(vm, 0, &vm->mmu_levels[0],
2681	&vm->pdb, NULL);
2682	if (err) {
2683	nvgpu_vfree(vm->mm->g, vm->pdb.entries);
2684	return err;
2685	}
2686
2687	return 0;
2688	}
2689
2690	/**
2691	* nvgpu_init_vm() - Initialize an address space.
2692	*
2693	* @mm - Parent MM.
2694	* @vm - The VM to init.
2695	* @big_page_size - Size of big pages associated with this VM.
2696	* @low_hole - The size of the low hole (unaddressable memory at the bottom of
2697	* the address space.
2698	* @kernel_reserved - Space reserved for kernel only allocations.
2699	* @aperture_size - Total size of the aperture.
2700	* @big_pages - Ignored. Will be set based on other passed params.
2701	* @name - Name of the address space.
2702	*
2703	* This function initializes an address space according to the following map:
2704	*
2705	* +--+ 0x0
2706	* \| \|
2707	* +--+ @low_hole
2708	* \| \|
2709	* ~ ~ This is the "user" section.
2710	* \| \|
2711	* +--+ @aperture_size - @kernel_reserved
2712	* \| \|
2713	* ~ ~ This is the "kernel" section.
2714	* \| \|
2715	* +--+ @aperture_size
2716	*
2717	* The user section is therefor what ever is left over after the @low_hole and
2718	* @kernel_reserved memory have been portioned out. The @kernel_reserved is
2719	* always persent at the top of the memory space and the @low_hole is always at
2720	* the bottom.
2721	*
2722	* For certain address spaces a "user" section makes no sense (bar1, etc) so in
2723	* such cases the @kernel_reserved and @low_hole should sum to exactly
2724	* @aperture_size.
2725	*/
2726	int nvgpu_init_vm(struct mm_gk20a *mm,
2727	struct vm_gk20a *vm,
2728	u32 big_page_size,
2729	u64 low_hole,
2730	u64 kernel_reserved,
2731	u64 aperture_size,
2732	bool big_pages,
2733	bool userspace_managed,
2734	char *name)
2735	{
2736	int err;
2737	char alloc_name[32];
2738	u64 kernel_vma_flags;
2739	u64 user_vma_start, user_vma_limit;
2740	u64 user_lp_vma_start, user_lp_vma_limit;
2741	u64 kernel_vma_start, kernel_vma_limit;
2742	struct gk20a *g = mm->g;
2743	struct gk20a_platform *p = gk20a_get_platform(g->dev);
2744
2745	if (WARN_ON(kernel_reserved + low_hole > aperture_size))
2746	return -ENOMEM;
2747
2748	gk20a_dbg_info("Init space for %s: va_limit=0x%llx, "
2749	"big_page_size=0x%x low_hole=0x%llx",
2750	name, aperture_size,
2751	(unsigned int)big_page_size, low_hole);
2752
2753	vm->mm = mm;
2754
2755	vm->gmmu_page_sizes[gmmu_page_size_small] = SZ_4K;
2756	vm->gmmu_page_sizes[gmmu_page_size_big] = big_page_size;
2757	vm->gmmu_page_sizes[gmmu_page_size_kernel] = SZ_4K;
2758
2759	/* Set up vma pointers. */
2760	vm->vma[gmmu_page_size_small] = &vm->user;
2761	vm->vma[gmmu_page_size_big] = &vm->user;
2762	vm->vma[gmmu_page_size_kernel] = &vm->kernel;
2763	if (!p->unify_address_spaces)
2764	vm->vma[gmmu_page_size_big] = &vm->user_lp;
2765
2766	vm->va_start = low_hole;
2767	vm->va_limit = aperture_size;
2768	vm->big_pages = big_pages;
2769
2770	vm->big_page_size = vm->gmmu_page_sizes[gmmu_page_size_big];
2771	vm->userspace_managed = userspace_managed;
2772	vm->mmu_levels = g->ops.mm.get_mmu_levels(g, vm->big_page_size);
2773
2774	/* Initialize the page table data structures. */
2775	err = init_vm_page_tables(vm);
2776	if (err)
2777	return err;
2778
2779	/* Setup vma limits. */
2780	if (kernel_reserved + low_hole < aperture_size) {
2781	if (p->unify_address_spaces) {
2782	user_vma_start = low_hole;
2783	user_vma_limit = vm->va_limit - kernel_reserved;
2784	user_lp_vma_start = user_vma_limit;
2785	user_lp_vma_limit = user_vma_limit;
2786	} else {
2787	user_vma_start = low_hole;
2788	user_vma_limit = __nv_gmmu_va_small_page_limit();
2789	user_lp_vma_start = __nv_gmmu_va_small_page_limit();
2790	user_lp_vma_limit = vm->va_limit - kernel_reserved;
2791	}
2792	} else {
2793	user_vma_start = 0;
2794	user_vma_limit = 0;
2795	user_lp_vma_start = 0;
2796	user_lp_vma_limit = 0;
2797	}
2798	kernel_vma_start = vm->va_limit - kernel_reserved;
2799	kernel_vma_limit = vm->va_limit;
2800
2801	gk20a_dbg_info("user_vma [0x%llx,0x%llx)",
2802	user_vma_start, user_vma_limit);
2803	gk20a_dbg_info("user_lp_vma [0x%llx,0x%llx)",
2804	user_lp_vma_start, user_lp_vma_limit);
2805	gk20a_dbg_info("kernel_vma [0x%llx,0x%llx)",
2806	kernel_vma_start, kernel_vma_limit);
2807
2808	if (WARN_ON(user_vma_start > user_vma_limit) \|\|
2809	WARN_ON(user_lp_vma_start > user_lp_vma_limit) \|\|
2810	WARN_ON(kernel_vma_start >= kernel_vma_limit)) {
2811	err = -EINVAL;
2812	goto clean_up_page_tables;
2813	}
2814
2815	kernel_vma_flags = (kernel_reserved + low_hole) == aperture_size ?
2816	0 : GPU_ALLOC_GVA_SPACE;
2817
2818	/*
2819	* A "user" area only makes sense for the GVA spaces. For VMs where
2820	* there is no "user" area user_vma_start will be equal to
2821	* user_vma_limit (i.e a 0 sized space). In such a situation the kernel
2822	* area must be non-zero in length.
2823	*/
2824	if (user_vma_start >= user_vma_limit &&
2825	kernel_vma_start >= kernel_vma_limit) {
2826	err = -EINVAL;
2827	goto clean_up_page_tables;
2828	}
2829
2830	/*
2831	* Determine if big pages are possible in this VM. If a split address
2832	* space is used then check the user_lp vma instead of the user vma.
2833	*/
2834	if (p->unify_address_spaces)
2835	vm->big_pages = gk20a_big_pages_possible(vm, user_vma_start,
2836	user_vma_limit - user_vma_start);
2837	else
2838	vm->big_pages = gk20a_big_pages_possible(vm, user_lp_vma_start,
2839	user_lp_vma_limit - user_lp_vma_start);
2840
2841	/*
2842	* User VMA.
2843	*/
2844	if (user_vma_start < user_vma_limit) {
2845	snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s", name);
2846	err = __nvgpu_buddy_allocator_init(g, &vm->user,
2847	vm, alloc_name,
2848	user_vma_start,
2849	user_vma_limit -
2850	user_vma_start,
2851	SZ_4K,
2852	GPU_BALLOC_MAX_ORDER,
2853	GPU_ALLOC_GVA_SPACE);
2854	if (err)
2855	goto clean_up_page_tables;
2856	} else {
2857	/*
2858	* Make these allocator pointers point to the kernel allocator
2859	* since we still use the legacy notion of page size to choose
2860	* the allocator.
2861	*/
2862	vm->vma[0] = &vm->kernel;
2863	vm->vma[1] = &vm->kernel;
2864	}
2865
2866	/*
2867	* User VMA for large pages when a split address range is used.
2868	*/
2869	if (user_lp_vma_start < user_lp_vma_limit) {
2870	snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s_lp", name);
2871	err = __nvgpu_buddy_allocator_init(g, &vm->user_lp,
2872	vm, alloc_name,
2873	user_lp_vma_start,
2874	user_lp_vma_limit -
2875	user_lp_vma_start,
2876	vm->big_page_size,
2877	GPU_BALLOC_MAX_ORDER,
2878	GPU_ALLOC_GVA_SPACE);
2879	if (err)
2880	goto clean_up_allocators;
2881	}
2882
2883	/*
2884	* Kernel VMA. Must always exist for an address space.
2885	*/
2886	snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s-sys", name);
2887	err = __nvgpu_buddy_allocator_init(g, &vm->kernel,
2888	vm, alloc_name,
2889	kernel_vma_start,
2890	kernel_vma_limit - kernel_vma_start,
2891	SZ_4K,
2892	GPU_BALLOC_MAX_ORDER,
2893	kernel_vma_flags);
2894	if (err)
2895	goto clean_up_allocators;
2896
2897	vm->mapped_buffers = NULL;
2898
2899	nvgpu_mutex_init(&vm->update_gmmu_lock);
2900	kref_init(&vm->ref);
2901	nvgpu_init_list_node(&vm->vm_area_list);
2902
2903	/*
2904	* This is only necessary for channel address spaces. The best way to
2905	* distinguish channel address spaces from other address spaces is by
2906	* size - if the address space is 4GB or less, it's not a channel.
2907	*/
2908	if (vm->va_limit > SZ_4G) {
2909	err = gk20a_init_sema_pool(vm);
2910	if (err)
2911	goto clean_up_allocators;
2912	}
2913
2914	return 0;
2915
2916	clean_up_allocators:
2917	if (nvgpu_alloc_initialized(&vm->kernel))
2918	nvgpu_alloc_destroy(&vm->kernel);
2919	if (nvgpu_alloc_initialized(&vm->user))
2920	nvgpu_alloc_destroy(&vm->user);
2921	if (nvgpu_alloc_initialized(&vm->user_lp))
2922	nvgpu_alloc_destroy(&vm->user_lp);
2923	clean_up_page_tables:
2924	/* Cleans up init_vm_page_tables() */
2925	nvgpu_vfree(g, vm->pdb.entries);
2926	free_gmmu_pages(vm, &vm->pdb);
2927	return err;
2928	}
2929
2930	/* address space interfaces for the gk20a module */	2451	/* address space interfaces for the gk20a module */
2931	int gk20a_vm_alloc_share(struct gk20a_as_share *as_share, u32 big_page_size,	2452	int gk20a_vm_alloc_share(struct gk20a_as_share *as_share, u32 big_page_size,
2932	u32 flags)	2453	u32 flags)


diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h index 27681199..90a72811 100644 --- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h +++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -456,8 +456,6 @@ const struct gk20a_mmu_level gk20a_mm_get_mmu_levels(struct gk20a g,
456	void gk20a_mm_init_pdb(struct gk20a g, struct nvgpu_mem mem,	456	void gk20a_mm_init_pdb(struct gk20a g, struct nvgpu_mem mem,
457	struct vm_gk20a *vm);	457	struct vm_gk20a *vm);
458		458
459	int gk20a_big_pages_possible(struct vm_gk20a *vm, u64 base, u64 size);
460
461	extern const struct gk20a_mmu_level gk20a_mm_levels_64k[];	459	extern const struct gk20a_mmu_level gk20a_mm_levels_64k[];
462	extern const struct gk20a_mmu_level gk20a_mm_levels_128k[];	460	extern const struct gk20a_mmu_level gk20a_mm_levels_128k[];
463		461