From eade809c265ada214c6c47e1ad9db1706c868da0 Mon Sep 17 00:00:00 2001
From: Sami Kiminki <skiminki@nvidia.com>
Date: Fri, 22 May 2015 20:48:22 +0300
Subject: gpu: nvgpu: Separate kernel and user GPU VA regions

Separate the kernel and userspace regions in the GPU virtual address
space. Do this by reserving the last part of the GPU VA aperture for
the kernel, and extend GPU VA aperture accordingly for regular address
spaces. This prevents the kernel polluting the userspace-visible GPU
VA regions, and thus, makes the success of fixed-address mapping more
predictable.

Bug 200077571

Change-Id: I63f0e73d4c815a4a9fa4a9ce568709974690ef0f
Signed-off-by: Sami Kiminki <skiminki@nvidia.com>
Reviewed-on: http://git-master/r/747191
Reviewed-by: Terje Bergstrom <tbergstrom@nvidia.com>
Tested-by: Terje Bergstrom <tbergstrom@nvidia.com>
---
 drivers/gpu/nvgpu/gk20a/as_gk20a.c |   2 +-
 drivers/gpu/nvgpu/gk20a/mm_gk20a.c | 151 +++++++++++++++++++++++++++----------
 drivers/gpu/nvgpu/gk20a/mm_gk20a.h |  47 ++++++------
 drivers/gpu/nvgpu/vgpu/mm_vgpu.c   |  11 ++-
 4 files changed, 141 insertions(+), 70 deletions(-)

diff --git a/drivers/gpu/nvgpu/gk20a/as_gk20a.c b/drivers/gpu/nvgpu/gk20a/as_gk20a.c
index feb22ea8..87b32add 100644
--- a/drivers/gpu/nvgpu/gk20a/as_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/as_gk20a.c
@@ -262,7 +262,7 @@ static int gk20a_as_ioctl_get_va_regions(
 	unsigned int write_entries;
 	struct nvgpu_as_va_region __user *user_region_ptr;
 	struct vm_gk20a *vm = as_share->vm;
-	int page_sizes = gmmu_nr_page_sizes;
+	int page_sizes = gmmu_page_size_kernel;
 
 	gk20a_dbg_fn("");
 
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index b12091bf..3021cb02 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -358,9 +358,12 @@ int gk20a_init_mm_setup_sw(struct gk20a *g)
 	mutex_init(&mm->l2_op_lock);
 
 	/*TBD: make channel vm size configurable */
-	mm->channel.size = 1ULL << NV_GMMU_VA_RANGE;
+	mm->channel.user_size = NV_MM_DEFAULT_USER_SIZE;
+	mm->channel.kernel_size = NV_MM_DEFAULT_KERNEL_SIZE;
 
-	gk20a_dbg_info("channel vm size: %dMB", (int)(mm->channel.size >> 20));
+	gk20a_dbg_info("channel vm size: user %dMB  kernel %dMB",
+		       (int)(mm->channel.user_size >> 20),
+		       (int)(mm->channel.kernel_size >> 20));
 
 	err = gk20a_init_bar1_vm(mm);
 	if (err)
@@ -1052,7 +1055,7 @@ static void gmmu_select_page_size(struct vm_gk20a *vm,
 {
 	int i;
 	/*  choose the biggest first (top->bottom) */
-	for (i = gmmu_nr_page_sizes-1; i >= 0; i--)
+	for (i = gmmu_page_size_kernel - 1; i >= 0; i--)
 		if (!((vm->gmmu_page_sizes[i] - 1) & bfr->align)) {
 			bfr->pgsz_idx = i;
 			break;
@@ -1438,8 +1441,9 @@ u64 gk20a_vm_map(struct vm_gk20a *vm,
 	 * the alignment determined by gmmu_select_page_size().
 	 */
 	if (flags & NVGPU_AS_MAP_BUFFER_FLAGS_FIXED_OFFSET) {
-		int pgsz_idx = __nv_gmmu_va_is_upper(vm, offset_align) ?
-				gmmu_page_size_big : gmmu_page_size_small;
+		int pgsz_idx =
+			__nv_gmmu_va_is_big_page_region(vm, offset_align) ?
+			gmmu_page_size_big : gmmu_page_size_small;
 		if (pgsz_idx > bfr.pgsz_idx) {
 			gk20a_err(d, "%llx buffer pgsz %d, VA pgsz %d",
 				  offset_align, bfr.pgsz_idx, pgsz_idx);
@@ -1816,7 +1820,7 @@ u64 gk20a_gmmu_map(struct vm_gk20a *vm,
 				*sgt, /* sg table */
 				0, /* sg offset */
 				size,
-				0, /* page size index = 0 i.e. SZ_4K */
+				gmmu_page_size_kernel,
 				0, /* kind */
 				0, /* ctag_offset */
 				flags, rw_flag,
@@ -1991,7 +1995,7 @@ void gk20a_gmmu_unmap(struct vm_gk20a *vm,
 	g->ops.mm.gmmu_unmap(vm,
 			vaddr,
 			size,
-			0, /* page size 4K */
+			gmmu_page_size_kernel,
 			true, /*va_allocated */
 			rw_flag,
 			false,
@@ -2395,6 +2399,11 @@ static int update_gmmu_ptes_locked(struct vm_gk20a *vm,
 		   buffer_offset,
 		   sgt ? sgt->nents : 0);
 
+	/* note: here we need to map kernel to small, since the
+	 * low-level mmu code assumes 0 is small and 1 is big pages */
+	if (pgsz_idx == gmmu_page_size_kernel)
+		pgsz_idx = gmmu_page_size_small;
+
 	if (space_to_skip & (page_size - 1))
 		return -EINVAL;
 
@@ -2618,17 +2627,23 @@ int gk20a_init_vm(struct mm_gk20a *mm,
 		struct vm_gk20a *vm,
 		u32 big_page_size,
 		u64 low_hole,
+		u64 kernel_reserved,
 		u64 aperture_size,
 		bool big_pages,
 		char *name)
 {
 	int err, i;
 	char alloc_name[32];
-	u64 small_vma_size, large_vma_size;
+	u64 small_vma_start, small_vma_limit, large_vma_start, large_vma_limit,
+		kernel_vma_start, kernel_vma_limit;
 	u32 pde_lo, pde_hi;
 
-	/* note: keep the page sizes sorted lowest to highest here */
-	u32 gmmu_page_sizes[gmmu_nr_page_sizes] = { SZ_4K, big_page_size };
+	/* note: this must match gmmu_pgsz_gk20a enum */
+	u32 gmmu_page_sizes[gmmu_nr_page_sizes] = { SZ_4K, big_page_size, SZ_4K };
+
+	WARN_ON(kernel_reserved + low_hole > aperture_size);
+	if (kernel_reserved > aperture_size)
+		return -ENOMEM;
 
 	vm->mm = mm;
 
@@ -2650,6 +2665,9 @@ int gk20a_init_vm(struct mm_gk20a *mm,
 	gk20a_dbg_info("big page-size (%dKB)",
 			vm->gmmu_page_sizes[gmmu_page_size_big] >> 10);
 
+	gk20a_dbg_info("kernel page-size (%dKB)",
+			vm->gmmu_page_sizes[gmmu_page_size_kernel] >> 10);
+
 	pde_range_from_vaddr_range(vm,
 				   0, vm->va_limit-1,
 				   &pde_lo, &pde_hi);
@@ -2668,36 +2686,65 @@ int gk20a_init_vm(struct mm_gk20a *mm,
 	if (err)
 		goto clean_up_pdes;
 
-	/* First 16GB of the address space goes towards small pages. What ever
-	 * remains is allocated to large pages. */
-	small_vma_size = vm->va_limit;
+	/* setup vma limits */
+	small_vma_start = low_hole;
+
 	if (big_pages) {
-		small_vma_size = __nv_gmmu_va_small_page_limit();
-		large_vma_size = vm->va_limit - small_vma_size;
+		/* First 16GB of the address space goes towards small
+		 * pages. What ever remains is allocated to large
+		 * pages. */
+		small_vma_limit = __nv_gmmu_va_small_page_limit();
+		large_vma_start = small_vma_limit;
+		large_vma_limit = vm->va_limit - kernel_reserved;
+	} else {
+		small_vma_limit = vm->va_limit - kernel_reserved;
+		large_vma_start = 0;
+		large_vma_limit = 0;
 	}
 
-	snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s-%dKB", name,
-		 vm->gmmu_page_sizes[gmmu_page_size_small]>>10);
-	err = __gk20a_allocator_init(&vm->vma[gmmu_page_size_small],
-				     vm, alloc_name,
-				     vm->va_start,
-				     small_vma_size - vm->va_start,
-				     SZ_4K,
-				     GPU_BALLOC_MAX_ORDER,
-				     GPU_BALLOC_GVA_SPACE);
-	if (err)
-		goto clean_up_ptes;
+	kernel_vma_start = vm->va_limit - kernel_reserved;
+	kernel_vma_limit = vm->va_limit;
 
-	if (big_pages) {
+	gk20a_dbg_info(
+		"small_vma=[0x%llx,0x%llx) large_vma=[0x%llx,0x%llx) kernel_vma=[0x%llx,0x%llx)\n",
+		small_vma_start, small_vma_limit,
+		large_vma_start, large_vma_limit,
+		kernel_vma_start, kernel_vma_limit);
+
+	/* check that starts do not exceed limits */
+	WARN_ON(small_vma_start > small_vma_limit);
+	WARN_ON(large_vma_start > large_vma_limit);
+	/* kernel_vma must also be non-zero */
+	WARN_ON(kernel_vma_start >= kernel_vma_limit);
+
+	if (small_vma_start > small_vma_limit ||
+	    large_vma_start > large_vma_limit ||
+	    kernel_vma_start >= kernel_vma_limit) {
+		err = -EINVAL;
+		goto clean_up_pdes;
+	}
+
+	if (small_vma_start < small_vma_limit) {
+		snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s-%dKB", name,
+			 vm->gmmu_page_sizes[gmmu_page_size_small] >> 10);
+		err = __gk20a_allocator_init(&vm->vma[gmmu_page_size_small],
+					     vm, alloc_name,
+					     small_vma_start,
+					     small_vma_limit - small_vma_start,
+					     SZ_4K,
+					     GPU_BALLOC_MAX_ORDER,
+					     GPU_BALLOC_GVA_SPACE);
+		if (err)
+			goto clean_up_ptes;
+	}
+
+	if (large_vma_start < large_vma_limit) {
 		snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s-%dKB",
-			 name, vm->gmmu_page_sizes[gmmu_page_size_big]>>10);
-		/*
-		 * Big page VMA starts at the end of the small page VMA.
-		 */
+			 name, vm->gmmu_page_sizes[gmmu_page_size_big] >> 10);
 		err = __gk20a_allocator_init(&vm->vma[gmmu_page_size_big],
 					     vm, alloc_name,
-					     small_vma_size,
-					     large_vma_size,
+					     large_vma_start,
+					     large_vma_limit - large_vma_start,
 					     big_page_size,
 					     GPU_BALLOC_MAX_ORDER,
 					     GPU_BALLOC_GVA_SPACE);
@@ -2705,6 +2752,21 @@ int gk20a_init_vm(struct mm_gk20a *mm,
 			goto clean_up_small_allocator;
 	}
 
+	snprintf(alloc_name, sizeof(alloc_name), "gk20a_%s-%dKB-sys",
+		 name, vm->gmmu_page_sizes[gmmu_page_size_kernel] >> 10);
+	/*
+	 * kernel reserved VMA is at the end of the aperture
+	 */
+	err = __gk20a_allocator_init(&vm->vma[gmmu_page_size_kernel],
+				     vm, alloc_name,
+				     kernel_vma_start,
+				     kernel_vma_limit - kernel_vma_start,
+				     SZ_4K,
+				     GPU_BALLOC_MAX_ORDER,
+				     GPU_BALLOC_GVA_SPACE);
+	if (err)
+		goto clean_up_big_allocator;
+
 	vm->mapped_buffers = RB_ROOT;
 
 	mutex_init(&vm->update_gmmu_lock);
@@ -2713,8 +2775,12 @@ int gk20a_init_vm(struct mm_gk20a *mm,
 
 	return 0;
 
+clean_up_big_allocator:
+	if (large_vma_start < large_vma_limit)
+		gk20a_allocator_destroy(&vm->vma[gmmu_page_size_big]);
 clean_up_small_allocator:
-	gk20a_allocator_destroy(&vm->vma[gmmu_page_size_small]);
+	if (small_vma_start < small_vma_limit)
+		gk20a_allocator_destroy(&vm->vma[gmmu_page_size_small]);
 clean_up_ptes:
 	free_gmmu_pages(vm, &vm->pdb);
 clean_up_pdes:
@@ -2756,7 +2822,9 @@ int gk20a_vm_alloc_share(struct gk20a_as_share *as_share, u32 big_page_size)
 	snprintf(name, sizeof(name), "gk20a_as_%d", as_share->id);
 
 	err = gk20a_init_vm(mm, vm, big_page_size, big_page_size << 10,
-			    mm->channel.size, !mm->disable_bigpage, name);
+			    mm->channel.kernel_size,
+			    mm->channel.user_size + mm->channel.kernel_size,
+			    !mm->disable_bigpage, name);
 
 	return err;
 }
@@ -2886,7 +2954,7 @@ int gk20a_vm_free_space(struct gk20a_as_share *as_share,
 			args->pages, args->offset);
 
 	/* determine pagesz idx */
-	pgsz_idx = __nv_gmmu_va_is_upper(vm, args->offset) ?
+	pgsz_idx = __nv_gmmu_va_is_big_page_region(vm, args->offset) ?
 			gmmu_page_size_big : gmmu_page_size_small;
 
 	vma = &vm->vma[pgsz_idx];
@@ -3086,9 +3154,11 @@ int gk20a_vm_unmap_buffer(struct vm_gk20a *vm, u64 offset,
 
 void gk20a_deinit_vm(struct vm_gk20a *vm)
 {
-	if (vm->big_pages)
+	gk20a_allocator_destroy(&vm->vma[gmmu_page_size_kernel]);
+	if (vm->vma[gmmu_page_size_big].init)
 		gk20a_allocator_destroy(&vm->vma[gmmu_page_size_big]);
-	gk20a_allocator_destroy(&vm->vma[gmmu_page_size_small]);
+	if (vm->vma[gmmu_page_size_small].init)
+		gk20a_allocator_destroy(&vm->vma[gmmu_page_size_small]);
 
 	gk20a_vm_free_entries(vm, &vm->pdb, 0);
 }
@@ -3127,6 +3197,7 @@ static int gk20a_init_bar1_vm(struct mm_gk20a *mm)
 	mm->bar1.aperture_size = bar1_aperture_size_mb_gk20a() << 20;
 	gk20a_dbg_info("bar1 vm size = 0x%x", mm->bar1.aperture_size);
 	gk20a_init_vm(mm, vm, big_page_size, SZ_4K,
+		      mm->bar1.aperture_size - SZ_4K,
 		      mm->bar1.aperture_size, false, "bar1");
 
 	err = gk20a_alloc_inst_block(g, inst_block);
@@ -3154,7 +3225,9 @@ static int gk20a_init_system_vm(struct mm_gk20a *mm)
 	gk20a_dbg_info("pmu vm size = 0x%x", mm->pmu.aperture_size);
 
 	gk20a_init_vm(mm, vm, big_page_size,
-		      SZ_4K * 16, GK20A_PMU_VA_SIZE, false, "system");
+		      SZ_4K * 16, GK20A_PMU_VA_SIZE,
+		      GK20A_PMU_VA_SIZE * 2, false,
+		      "system");
 
 	err = gk20a_alloc_inst_block(g, inst_block);
 	if (err)
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index 5c6c285a..6786e3c2 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -127,9 +127,10 @@ struct gk20a_buffer_state {
 };
 
 enum gmmu_pgsz_gk20a {
-	gmmu_page_size_small = 0,
-	gmmu_page_size_big   = 1,
-	gmmu_nr_page_sizes   = 2
+	gmmu_page_size_small  = 0,
+	gmmu_page_size_big    = 1,
+	gmmu_page_size_kernel = 2,
+	gmmu_nr_page_sizes    = 3,
 };
 
 struct gk20a_comptags {
@@ -284,8 +285,10 @@ void gk20a_mm_l2_invalidate(struct gk20a *g);
 struct mm_gk20a {
 	struct gk20a *g;
 
+	/* GPU VA default sizes address spaces for channels */
 	struct {
-		u64 size;
+		u64 user_size;   /* userspace-visible GPU VA region */
+		u64 kernel_size; /* kernel-only GPU VA region */
 	} channel;
 
 	struct {
@@ -340,26 +343,15 @@ static inline int bar1_aperture_size_mb_gk20a(void)
 {
 	return 16; /* 16MB is more than enough atm. */
 }
-/* max address bits */
-static inline int max_physaddr_bits_gk20a(void)
-{
-	return 40;/*"old" sys physaddr, meaningful? */
-}
-static inline int max_vid_physaddr_bits_gk20a(void)
-{
-	/* "vid phys" is asid/smmu phys?,
-	 * i.e. is this the real sys physaddr? */
-	return 37;
-}
-static inline int max_vaddr_bits_gk20a(void)
-{
-	return 40; /* chopped for area? */
-}
 
-/*
- * Amount of the GVA space we actually use is smaller than the available space.
- */
-#define NV_GMMU_VA_RANGE	40
+/*The maximum GPU VA range supported */
+#define NV_GMMU_VA_RANGE          38
+
+/* The default userspace-visible GPU VA size */
+#define NV_MM_DEFAULT_USER_SIZE   (1ULL << 37)
+
+/* The default kernel-reserved GPU VA size */
+#define NV_MM_DEFAULT_KERNEL_SIZE (1ULL << 32)
 
 /*
  * The bottom 16GB of the space are used for small pages, the remaining high
@@ -370,12 +362,14 @@ static inline u64 __nv_gmmu_va_small_page_limit(void)
 	return ((u64)SZ_1G * 16);
 }
 
-static inline int __nv_gmmu_va_is_upper(struct vm_gk20a *vm, u64 addr)
+static inline int __nv_gmmu_va_is_big_page_region(struct vm_gk20a *vm, u64 addr)
 {
 	if (!vm->big_pages)
 		return 0;
 
-	return addr >= __nv_gmmu_va_small_page_limit();
+	return addr >= vm->vma[gmmu_page_size_big].base &&
+		addr < vm->vma[gmmu_page_size_big].base +
+		vm->vma[gmmu_page_size_big].length;
 }
 
 /*
@@ -391,7 +385,7 @@ static inline enum gmmu_pgsz_gk20a __get_pte_size(struct vm_gk20a *vm,
 	 * As a result, even though the allocator supports mixed address spaces
 	 * the address spaces must be treated as separate for now.
 	 */
-	if (__nv_gmmu_va_is_upper(vm, base))
+	if (__nv_gmmu_va_is_big_page_region(vm, base))
 		return gmmu_page_size_big;
 	else
 		return gmmu_page_size_small;
@@ -617,6 +611,7 @@ int gk20a_init_vm(struct mm_gk20a *mm,
 		struct vm_gk20a *vm,
 		u32 big_page_size,
 		u64 low_hole,
+		u64 kernel_reserved,
 		u64 aperture_size,
 		bool big_pages,
 		char *name);
diff --git a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
index c73037b6..2b23c4e6 100644
--- a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
+++ b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
@@ -34,9 +34,12 @@ static int vgpu_init_mm_setup_sw(struct gk20a *g)
 	mm->g = g;
 
 	/*TBD: make channel vm size configurable */
-	mm->channel.size = 1ULL << NV_GMMU_VA_RANGE;
+	mm->channel.user_size = NV_MM_DEFAULT_USER_SIZE;
+	mm->channel.kernel_size = NV_MM_DEFAULT_KERNEL_SIZE;
 
-	gk20a_dbg_info("channel vm size: %dMB", (int)(mm->channel.size >> 20));
+	gk20a_dbg_info("channel vm size: user %dMB  kernel %dMB",
+		       (int)(mm->channel.user_size >> 20),
+		       (int)(mm->channel.kernel_size >> 20));
 
 	/* gk20a_init_gpu_characteristics expects this to be populated */
 	vm->big_page_size = big_page_size;
@@ -276,8 +279,8 @@ static int vgpu_vm_alloc_share(struct gk20a_as_share *as_share,
 	vm->big_page_size = big_page_size;
 
 	vm->va_start  = big_page_size << 10;   /* create a one pde hole */
-	vm->va_limit  = mm->channel.size; /* note this means channel.size is
-					     really just the max */
+	vm->va_limit  = mm->channel.user_size; /* note this means channel.size
+						  is really just the max */
 
 	msg.cmd = TEGRA_VGPU_CMD_AS_ALLOC_SHARE;
 	msg.handle = platform->virt_handle;
-- 
cgit v1.2.2