From 42d17018b442850f246696364d79a2ae11350a12 Mon Sep 17 00:00:00 2001
From: Terje Bergstrom <tbergstrom@nvidia.com>
Date: Fri, 20 Mar 2015 09:43:26 -0700
Subject: gpu: nvgpu: Use common allocator for compbit store

Reduce amount of duplicate code around memory allocation by using
common helpers, and common data structure for storing results of
allocations.

Bug 1605769

Change-Id: I7c1662b669ed8c86465254f6001e536141051ee5
Signed-off-by: Terje Bergstrom <tbergstrom@nvidia.com>
Reviewed-on: http://git-master/r/720435
---
 drivers/gpu/nvgpu/gk20a/cde_gk20a.c  | 12 ++---
 drivers/gpu/nvgpu/gk20a/gr_gk20a.c   |  7 +--
 drivers/gpu/nvgpu/gk20a/ltc_common.c | 95 ++++++------------------------------
 drivers/gpu/nvgpu/gk20a/ltc_gk20a.c  |  6 +--
 drivers/gpu/nvgpu/gk20a/mm_gk20a.c   |  1 -
 drivers/gpu/nvgpu/gk20a/mm_gk20a.h   |  5 +-
 drivers/gpu/nvgpu/gm20b/ltc_gm20b.c  |  6 +--
 7 files changed, 27 insertions(+), 105 deletions(-)

diff --git a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
index fb368fda..4a3076b5 100644
--- a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
@@ -79,7 +79,7 @@ __must_hold(&cde_app->mutex)
 	/* ..then release mapped memory */
 	gk20a_deinit_cde_img(cde_ctx);
 	gk20a_gmmu_unmap(vm, cde_ctx->backing_store_vaddr,
-			 g->gr.compbit_store.size, 1);
+			 g->gr.compbit_store.mem.size, 1);
 
 	/* housekeeping on app */
 	list_del(&cde_ctx->list);
@@ -392,7 +392,7 @@ static int gk20a_cde_patch_params(struct gk20a_cde_ctx *cde_ctx)
 			new_data = cde_ctx->compbit_size;
 			break;
 		case TYPE_PARAM_BACKINGSTORE_SIZE:
-			new_data = g->gr.compbit_store.size;
+			new_data = g->gr.compbit_store.mem.size;
 			break;
 		case TYPE_PARAM_SOURCE_SMMU_ADDR:
 			new_data = gk20a_mm_gpuva_to_iova_base(cde_ctx->vm,
@@ -998,7 +998,7 @@ __releases(&cde_app->mutex)
 	}
 
 	gk20a_dbg(gpu_dbg_cde, "cde: buffer=cbc, size=%zu, gpuva=%llx\n",
-		 g->gr.compbit_store.size, cde_ctx->backing_store_vaddr);
+		 g->gr.compbit_store.mem.size, cde_ctx->backing_store_vaddr);
 	gk20a_dbg(gpu_dbg_cde, "cde: buffer=compbits, size=%llu, gpuva=%llx\n",
 		 cde_ctx->compbit_size, cde_ctx->compbit_vaddr);
 
@@ -1122,8 +1122,8 @@ static int gk20a_cde_load(struct gk20a_cde_ctx *cde_ctx)
 	}
 
 	/* map backing store to gpu virtual space */
-	vaddr = gk20a_gmmu_map(ch->vm, &gr->compbit_store.sgt,
-			       g->gr.compbit_store.size,
+	vaddr = gk20a_gmmu_map(ch->vm, &gr->compbit_store.mem.sgt,
+			       g->gr.compbit_store.mem.size,
 			       NVGPU_MAP_BUFFER_FLAGS_CACHEABLE_TRUE,
 			       gk20a_mem_flag_read_only);
 
@@ -1151,7 +1151,7 @@ static int gk20a_cde_load(struct gk20a_cde_ctx *cde_ctx)
 	return 0;
 
 err_init_cde_img:
-	gk20a_gmmu_unmap(ch->vm, vaddr, g->gr.compbit_store.size, 1);
+	gk20a_gmmu_unmap(ch->vm, vaddr, g->gr.compbit_store.mem.size, 1);
 err_map_backingstore:
 err_alloc_gpfifo:
 	gk20a_vm_put(ch->vm);
diff --git a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
index e8340216..1e6cca6d 100644
--- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -2944,8 +2944,6 @@ int gk20a_free_obj_ctx(struct channel_gk20a  *c,
 static void gk20a_remove_gr_support(struct gr_gk20a *gr)
 {
 	struct gk20a *g = gr->g;
-	struct device *d = dev_from_gk20a(g);
-	DEFINE_DMA_ATTRS(attrs);
 
 	gk20a_dbg_fn("");
 
@@ -2954,9 +2952,8 @@ static void gk20a_remove_gr_support(struct gr_gk20a *gr)
 	gk20a_gmmu_free(g, &gr->mmu_wr_mem);
 	gk20a_gmmu_free(g, &gr->mmu_rd_mem);
 
-	dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, &attrs);
-	dma_free_attrs(d, gr->compbit_store.size, gr->compbit_store.pages,
-			gr->compbit_store.base_iova, &attrs);
+	gk20a_gmmu_free_attr(g, DMA_ATTR_NO_KERNEL_MAPPING,
+			     &gr->compbit_store.mem);
 
 	memset(&gr->compbit_store, 0, sizeof(struct compbit_store_desc));
 
diff --git a/drivers/gpu/nvgpu/gk20a/ltc_common.c b/drivers/gpu/nvgpu/gk20a/ltc_common.c
index e230c4cd..f48f8298 100644
--- a/drivers/gpu/nvgpu/gk20a/ltc_common.c
+++ b/drivers/gpu/nvgpu/gk20a/ltc_common.c
@@ -77,87 +77,20 @@ static int gk20a_ltc_alloc_phys_cbc(struct gk20a *g,
 				    size_t compbit_backing_size)
 {
 	struct gr_gk20a *gr = &g->gr;
-	int order = order_base_2(compbit_backing_size >> PAGE_SHIFT);
-	struct page *pages;
-	struct sg_table *sgt;
-	int err = 0;
-
-	/* allocate pages */
-	pages = alloc_pages(GFP_KERNEL, order);
-	if (!pages) {
-		gk20a_dbg(gpu_dbg_pte, "alloc_pages failed\n");
-		err = -ENOMEM;
-		goto err_alloc_pages;
-	}
-
-	/* clean up the pages */
-	memset(page_address(pages), 0, compbit_backing_size);
 
-	/* allocate room for placing the pages pointer.. */
-	gr->compbit_store.pages =
-		kzalloc(sizeof(*gr->compbit_store.pages), GFP_KERNEL);
-	if (!gr->compbit_store.pages) {
-		gk20a_dbg(gpu_dbg_pte, "failed to allocate pages struct");
-		err = -ENOMEM;
-		goto err_alloc_compbit_store;
-	}
-
-	err = gk20a_get_sgtable_from_pages(&g->dev->dev, &sgt, &pages, 0,
-					   compbit_backing_size);
-	if (err) {
-		gk20a_dbg(gpu_dbg_pte, "could not get sg table for pages\n");
-		goto err_alloc_sg_table;
-	}
-
-	/* store the parameters to gr structure */
-	*gr->compbit_store.pages = pages;
-	gr->compbit_store.base_iova = sg_phys(sgt->sgl);
-	gr->compbit_store.size = compbit_backing_size;
-	gr->compbit_store.sgt = sgt;
-
-	return 0;
-
-err_alloc_sg_table:
-	kfree(gr->compbit_store.pages);
-	gr->compbit_store.pages = NULL;
-err_alloc_compbit_store:
-	__free_pages(pages, order);
-err_alloc_pages:
-	return err;
+	return gk20a_gmmu_alloc_attr(g, DMA_ATTR_FORCE_CONTIGUOUS,
+				    compbit_backing_size,
+				    &gr->compbit_store.mem);
 }
 
 static int gk20a_ltc_alloc_virt_cbc(struct gk20a *g,
 				    size_t compbit_backing_size)
 {
-	struct device *d = dev_from_gk20a(g);
 	struct gr_gk20a *gr = &g->gr;
-	DEFINE_DMA_ATTRS(attrs);
-	dma_addr_t iova;
-	int err;
-
-	dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, &attrs);
-
-	gr->compbit_store.pages =
-		dma_alloc_attrs(d, compbit_backing_size, &iova,
-				GFP_KERNEL, &attrs);
-	if (!gr->compbit_store.pages) {
-		gk20a_err(dev_from_gk20a(g), "failed to allocate backing store for compbit : size %zu",
-				  compbit_backing_size);
-		return -ENOMEM;
-	}
-
-	gr->compbit_store.base_iova = iova;
-	gr->compbit_store.size = compbit_backing_size;
-	err = gk20a_get_sgtable_from_pages(d,
-				   &gr->compbit_store.sgt,
-				   gr->compbit_store.pages, iova,
-				   compbit_backing_size);
-	if (err) {
-		gk20a_err(dev_from_gk20a(g), "failed to allocate sgt for backing store");
-		return err;
-	}
 
-	return 0;
+	return gk20a_gmmu_alloc_attr(g, DMA_ATTR_NO_KERNEL_MAPPING,
+				    compbit_backing_size,
+				    &gr->compbit_store.mem);
 }
 
 static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
@@ -167,16 +100,16 @@ static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
 
 	u32 compbit_base_post_divide;
 	u64 compbit_base_post_multiply64;
-	u64 compbit_store_base_iova;
+	u64 compbit_store_iova;
 	u64 compbit_base_post_divide64;
 
 	if (tegra_platform_is_linsim())
-		compbit_store_base_iova = gr->compbit_store.base_iova;
+		compbit_store_iova = gk20a_mem_phys(&gr->compbit_store.mem);
 	else
-		compbit_store_base_iova = gk20a_mm_smmu_vaddr_translate(g,
-			gr->compbit_store.base_iova);
+		compbit_store_iova = gk20a_mm_iova_addr(g,
+				gr->compbit_store.mem.sgt->sgl);
 
-	compbit_base_post_divide64 = compbit_store_base_iova >>
+	compbit_base_post_divide64 = compbit_store_iova >>
 		ltc_ltcs_ltss_cbc_base_alignment_shift_v();
 
 	do_div(compbit_base_post_divide64, g->ltc_count);
@@ -185,7 +118,7 @@ static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
 	compbit_base_post_multiply64 = ((u64)compbit_base_post_divide *
 		g->ltc_count) << ltc_ltcs_ltss_cbc_base_alignment_shift_v();
 
-	if (compbit_base_post_multiply64 < compbit_store_base_iova)
+	if (compbit_base_post_multiply64 < compbit_store_iova)
 		compbit_base_post_divide++;
 
 	/* Bug 1477079 indicates sw adjustment on the posted divided base. */
@@ -198,8 +131,8 @@ static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
 
 	gk20a_dbg(gpu_dbg_info | gpu_dbg_map | gpu_dbg_pte,
 		   "compbit base.pa: 0x%x,%08x cbc_base:0x%08x\n",
-		   (u32)(compbit_store_base_iova >> 32),
-		   (u32)(compbit_store_base_iova & 0xffffffff),
+		   (u32)(compbit_store_iova >> 32),
+		   (u32)(compbit_store_iova & 0xffffffff),
 		   compbit_base_post_divide);
 
 	gr->compbit_store.base_hw = compbit_base_post_divide;
diff --git a/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c b/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c
index 1a780212..c5d0f0c4 100644
--- a/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c
@@ -51,10 +51,8 @@ static int gk20a_ltc_init_comptags(struct gk20a *g, struct gr_gk20a *gr)
 
 	gk20a_dbg_fn("");
 
-	if (max_comptag_lines == 0) {
-		gr->compbit_store.size = 0;
+	if (max_comptag_lines == 0)
 		return 0;
-	}
 
 	if (max_comptag_lines > hw_max_comptag_lines)
 		max_comptag_lines = hw_max_comptag_lines;
@@ -117,7 +115,7 @@ static int gk20a_ltc_cbc_ctrl(struct gk20a *g, enum gk20a_cbc_op op,
 
 	trace_gk20a_ltc_cbc_ctrl_start(g->dev->name, op, min, max);
 
-	if (gr->compbit_store.size == 0)
+	if (gr->compbit_store.mem.size == 0)
 		return 0;
 
 	mutex_lock(&g->mm.l2_op_lock);
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index 036f1472..a01836eb 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -1560,7 +1560,6 @@ int gk20a_gmmu_alloc_attr(struct gk20a *g, enum dma_attr attr, size_t size, stru
 		goto fail_free;
 
 	mem->size = size;
-	memset(mem->cpu_va, 0, size);
 
 	gk20a_dbg_fn("done");
 
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index 56e3a356..ea3a2052 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -113,10 +113,7 @@ struct gr_ctx_desc {
 #define NVGPU_GR_PREEMPTION_MODE_CTA		2
 
 struct compbit_store_desc {
-	struct page **pages;
-	struct sg_table *sgt;
-	size_t size;
-	u64 base_iova;
+	struct mem_desc mem;
 
 	/* The value that is written to the hardware. This depends on
 	 * on the number of ltcs and is not an address. */
diff --git a/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c b/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c
index 522cd1dc..9090be23 100644
--- a/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c
+++ b/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c
@@ -53,10 +53,8 @@ static int gm20b_ltc_init_comptags(struct gk20a *g, struct gr_gk20a *gr)
 
 	gk20a_dbg_fn("");
 
-	if (max_comptag_lines == 0) {
-		gr->compbit_store.size = 0;
+	if (max_comptag_lines == 0)
 		return 0;
-	}
 
 	if (max_comptag_lines > hw_max_comptag_lines)
 		max_comptag_lines = hw_max_comptag_lines;
@@ -117,7 +115,7 @@ int gm20b_ltc_cbc_ctrl(struct gk20a *g, enum gk20a_cbc_op op,
 
 	trace_gk20a_ltc_cbc_ctrl_start(g->dev->name, op, min, max);
 
-	if (gr->compbit_store.size == 0)
+	if (gr->compbit_store.mem.size == 0)
 		return 0;
 
 	mutex_lock(&g->mm.l2_op_lock);
-- 
cgit v1.2.2