gpu: nvgpu: Use common allocator for compbit store

Reduce amount of duplicate code around memory allocation by using common helpers, and common data structure for storing results of allocations. Bug 1605769 Change-Id: I7c1662b669ed8c86465254f6001e536141051ee5 Signed-off-by: Terje Bergstrom <tbergstrom@nvidia.com> Reviewed-on: http://git-master/r/720435
author: Terje Bergstrom <tbergstrom@nvidia.com> 2015-03-20 12:43:26 -0400
committer: Dan Willemsen <dwillemsen@nvidia.com> 2015-04-04 22:01:53 -0400
commit: 42d17018b442850f246696364d79a2ae11350a12 (patch)
tree: 0ba6ca38145df8cab758cfa2b7bf50b5f825884a
parent: 90e42e424aba21aed9aa380795cd564cfe97da28 (diff)
7 files changed, 27 insertions, 105 deletions
diff --git a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
index fb368fda..4a3076b5 100644
--- a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
@@ -79,7 +79,7 @@ __must_hold(&cde_app->mutex)
        /* ..then release mapped memory */
        gk20a_deinit_cde_img(cde_ctx);
        gk20a_gmmu_unmap(vm, cde_ctx->backing_store_vaddr,
-                         g->gr.compbit_store.size, 1);
+                         g->gr.compbit_store.mem.size, 1);
        /* housekeeping on app */
        list_del(&cde_ctx->list);
@@ -392,7 +392,7 @@ static int gk20a_cde_patch_params(struct gk20a_cde_ctx *cde_ctx)
                        new_data = cde_ctx->compbit_size;
                        break;
                case TYPE_PARAM_BACKINGSTORE_SIZE:
-                        new_data = g->gr.compbit_store.size;
+                        new_data = g->gr.compbit_store.mem.size;
                        break;
                case TYPE_PARAM_SOURCE_SMMU_ADDR:
                        new_data = gk20a_mm_gpuva_to_iova_base(cde_ctx->vm,
@@ -998,7 +998,7 @@ __releases(&cde_app->mutex)
        }
        gk20a_dbg(gpu_dbg_cde, "cde: buffer=cbc, size=%zu, gpuva=%llx\n",
-                 g->gr.compbit_store.size, cde_ctx->backing_store_vaddr);
+                 g->gr.compbit_store.mem.size, cde_ctx->backing_store_vaddr);
        gk20a_dbg(gpu_dbg_cde, "cde: buffer=compbits, size=%llu, gpuva=%llx\n",
                 cde_ctx->compbit_size, cde_ctx->compbit_vaddr);
@@ -1122,8 +1122,8 @@ static int gk20a_cde_load(struct gk20a_cde_ctx *cde_ctx)
        }
        /* map backing store to gpu virtual space */
-        vaddr = gk20a_gmmu_map(ch->vm, &gr->compbit_store.sgt,
+        vaddr = gk20a_gmmu_map(ch->vm, &gr->compbit_store.mem.sgt,
-                               g->gr.compbit_store.size,
+                               g->gr.compbit_store.mem.size,
                               NVGPU_MAP_BUFFER_FLAGS_CACHEABLE_TRUE,
                               gk20a_mem_flag_read_only);
@@ -1151,7 +1151,7 @@ static int gk20a_cde_load(struct gk20a_cde_ctx *cde_ctx)
        return 0;
 err_init_cde_img:
-        gk20a_gmmu_unmap(ch->vm, vaddr, g->gr.compbit_store.size, 1);
+        gk20a_gmmu_unmap(ch->vm, vaddr, g->gr.compbit_store.mem.size, 1);
 err_map_backingstore:
 err_alloc_gpfifo:
        gk20a_vm_put(ch->vm);
diff --git a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
index e8340216..1e6cca6d 100644
--- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -2944,8 +2944,6 @@ int gk20a_free_obj_ctx(struct channel_gk20a  *c,
 static void gk20a_remove_gr_support(struct gr_gk20a *gr)
 {
        struct gk20a *g = gr->g;
-        struct device *d = dev_from_gk20a(g);
-        DEFINE_DMA_ATTRS(attrs);
        gk20a_dbg_fn("");
@@ -2954,9 +2952,8 @@ static void gk20a_remove_gr_support(struct gr_gk20a *gr)
        gk20a_gmmu_free(g, &gr->mmu_wr_mem);
        gk20a_gmmu_free(g, &gr->mmu_rd_mem);
-        dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, &attrs);
+        gk20a_gmmu_free_attr(g, DMA_ATTR_NO_KERNEL_MAPPING,
-        dma_free_attrs(d, gr->compbit_store.size, gr->compbit_store.pages,
+                             &gr->compbit_store.mem);
-                        gr->compbit_store.base_iova, &attrs);
        memset(&gr->compbit_store, 0, sizeof(struct compbit_store_desc));
diff --git a/drivers/gpu/nvgpu/gk20a/ltc_common.c b/drivers/gpu/nvgpu/gk20a/ltc_common.c
index e230c4cd..f48f8298 100644
--- a/drivers/gpu/nvgpu/gk20a/ltc_common.c
+++ b/drivers/gpu/nvgpu/gk20a/ltc_common.c
@@ -77,87 +77,20 @@ static int gk20a_ltc_alloc_phys_cbc(struct gk20a *g,
                                    size_t compbit_backing_size)
 {
        struct gr_gk20a *gr = &g->gr;
-        int order = order_base_2(compbit_backing_size >> PAGE_SHIFT);
-        struct page *pages;
-        struct sg_table *sgt;
-        int err = 0;
-        /* allocate pages */
-        pages = alloc_pages(GFP_KERNEL, order);
-        if (!pages) {
-                gk20a_dbg(gpu_dbg_pte, "alloc_pages failed\n");
-                err = -ENOMEM;
-                goto err_alloc_pages;
-        }
-        /* clean up the pages */
-        memset(page_address(pages), 0, compbit_backing_size);
-        /* allocate room for placing the pages pointer.. */
+        return gk20a_gmmu_alloc_attr(g, DMA_ATTR_FORCE_CONTIGUOUS,
-        gr->compbit_store.pages =
+                                    compbit_backing_size,
-                kzalloc(sizeof(*gr->compbit_store.pages), GFP_KERNEL);
+                                    &gr->compbit_store.mem);
-        if (!gr->compbit_store.pages) {
-                gk20a_dbg(gpu_dbg_pte, "failed to allocate pages struct");
-                err = -ENOMEM;
-                goto err_alloc_compbit_store;
-        }
-        err = gk20a_get_sgtable_from_pages(&g->dev->dev, &sgt, &pages, 0,
-                                           compbit_backing_size);
-        if (err) {
-                gk20a_dbg(gpu_dbg_pte, "could not get sg table for pages\n");
-                goto err_alloc_sg_table;
-        }
-        /* store the parameters to gr structure */
-        *gr->compbit_store.pages = pages;
-        gr->compbit_store.base_iova = sg_phys(sgt->sgl);
-        gr->compbit_store.size = compbit_backing_size;
-        gr->compbit_store.sgt = sgt;
-        return 0;
-err_alloc_sg_table:
-        kfree(gr->compbit_store.pages);
-        gr->compbit_store.pages = NULL;
-err_alloc_compbit_store:
-        __free_pages(pages, order);
-err_alloc_pages:
-        return err;
 }
 static int gk20a_ltc_alloc_virt_cbc(struct gk20a *g,
                                    size_t compbit_backing_size)
 {
-        struct device *d = dev_from_gk20a(g);
        struct gr_gk20a *gr = &g->gr;
-        DEFINE_DMA_ATTRS(attrs);
-        dma_addr_t iova;
-        int err;
-        dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, &attrs);
-        gr->compbit_store.pages =
-                dma_alloc_attrs(d, compbit_backing_size, &iova,
-                                GFP_KERNEL, &attrs);
-        if (!gr->compbit_store.pages) {
-                gk20a_err(dev_from_gk20a(g), "failed to allocate backing store for compbit : size %zu",
-                                  compbit_backing_size);
-                return -ENOMEM;
-        }
-        gr->compbit_store.base_iova = iova;
-        gr->compbit_store.size = compbit_backing_size;
-        err = gk20a_get_sgtable_from_pages(d,
-                                   &gr->compbit_store.sgt,
-                                   gr->compbit_store.pages, iova,
-                                   compbit_backing_size);
-        if (err) {
-                gk20a_err(dev_from_gk20a(g), "failed to allocate sgt for backing store");
-                return err;
-        }
-        return 0;
+        return gk20a_gmmu_alloc_attr(g, DMA_ATTR_NO_KERNEL_MAPPING,
+                                    compbit_backing_size,
+                                    &gr->compbit_store.mem);
 }
 static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
@@ -167,16 +100,16 @@ static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
        u32 compbit_base_post_divide;
        u64 compbit_base_post_multiply64;
-        u64 compbit_store_base_iova;
+        u64 compbit_store_iova;
        u64 compbit_base_post_divide64;
        if (tegra_platform_is_linsim())
-                compbit_store_base_iova = gr->compbit_store.base_iova;
+                compbit_store_iova = gk20a_mem_phys(&gr->compbit_store.mem);
        else
-                compbit_store_base_iova = gk20a_mm_smmu_vaddr_translate(g,
+                compbit_store_iova = gk20a_mm_iova_addr(g,
-                        gr->compbit_store.base_iova);
+                                gr->compbit_store.mem.sgt->sgl);
-        compbit_base_post_divide64 = compbit_store_base_iova >>
+        compbit_base_post_divide64 = compbit_store_iova >>
                ltc_ltcs_ltss_cbc_base_alignment_shift_v();
        do_div(compbit_base_post_divide64, g->ltc_count);
@@ -185,7 +118,7 @@ static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
        compbit_base_post_multiply64 = ((u64)compbit_base_post_divide *
                g->ltc_count) << ltc_ltcs_ltss_cbc_base_alignment_shift_v();
-        if (compbit_base_post_multiply64 < compbit_store_base_iova)
+        if (compbit_base_post_multiply64 < compbit_store_iova)
                compbit_base_post_divide++;
        /* Bug 1477079 indicates sw adjustment on the posted divided base. */
@@ -198,8 +131,8 @@ static void gk20a_ltc_init_cbc(struct gk20a *g, struct gr_gk20a *gr)
        gk20a_dbg(gpu_dbg_info | gpu_dbg_map | gpu_dbg_pte,
                   "compbit base.pa: 0x%x,%08x cbc_base:0x%08x\n",
-                   (u32)(compbit_store_base_iova >> 32),
+                   (u32)(compbit_store_iova >> 32),
-                   (u32)(compbit_store_base_iova & 0xffffffff),
+                   (u32)(compbit_store_iova & 0xffffffff),
                   compbit_base_post_divide);
        gr->compbit_store.base_hw = compbit_base_post_divide;
diff --git a/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c b/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c
index 1a780212..c5d0f0c4 100644
--- a/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/ltc_gk20a.c
@@ -51,10 +51,8 @@ static int gk20a_ltc_init_comptags(struct gk20a *g, struct gr_gk20a *gr)
        gk20a_dbg_fn("");
-        if (max_comptag_lines == 0) {
+        if (max_comptag_lines == 0)
-                gr->compbit_store.size = 0;
                return 0;
-        }
        if (max_comptag_lines > hw_max_comptag_lines)
                max_comptag_lines = hw_max_comptag_lines;
@@ -117,7 +115,7 @@ static int gk20a_ltc_cbc_ctrl(struct gk20a *g, enum gk20a_cbc_op op,
        trace_gk20a_ltc_cbc_ctrl_start(g->dev->name, op, min, max);
-        if (gr->compbit_store.size == 0)
+        if (gr->compbit_store.mem.size == 0)
                return 0;
        mutex_lock(&g->mm.l2_op_lock);
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index 036f1472..a01836eb 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -1560,7 +1560,6 @@ int gk20a_gmmu_alloc_attr(struct gk20a *g, enum dma_attr attr, size_t size, stru
                goto fail_free;
        mem->size = size;
-        memset(mem->cpu_va, 0, size);
        gk20a_dbg_fn("done");
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index 56e3a356..ea3a2052 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -113,10 +113,7 @@ struct gr_ctx_desc {
 #define NVGPU_GR_PREEMPTION_MODE_CTA            2
 struct compbit_store_desc {
-        struct page **pages;
+        struct mem_desc mem;
-        struct sg_table *sgt;
-        size_t size;
-        u64 base_iova;
        /* The value that is written to the hardware. This depends on
         * on the number of ltcs and is not an address. */
diff --git a/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c b/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c
index 522cd1dc..9090be23 100644
--- a/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c
+++ b/drivers/gpu/nvgpu/gm20b/ltc_gm20b.c
@@ -53,10 +53,8 @@ static int gm20b_ltc_init_comptags(struct gk20a *g, struct gr_gk20a *gr)
        gk20a_dbg_fn("");
-        if (max_comptag_lines == 0) {
+        if (max_comptag_lines == 0)
-                gr->compbit_store.size = 0;
                return 0;
-        }
        if (max_comptag_lines > hw_max_comptag_lines)
                max_comptag_lines = hw_max_comptag_lines;
@@ -117,7 +115,7 @@ int gm20b_ltc_cbc_ctrl(struct gk20a *g, enum gk20a_cbc_op op,
        trace_gk20a_ltc_cbc_ctrl_start(g->dev->name, op, min, max);
-        if (gr->compbit_store.size == 0)
+        if (gr->compbit_store.mem.size == 0)
                return 0;
        mutex_lock(&g->mm.l2_op_lock);
author	Terje Bergstrom <tbergstrom@nvidia.com>	2015-03-20 12:43:26 -0400
committer	Dan Willemsen <dwillemsen@nvidia.com>	2015-04-04 22:01:53 -0400
commit	42d17018b442850f246696364d79a2ae11350a12 (patch)
tree	0ba6ca38145df8cab758cfa2b7bf50b5f825884a
parent	90e42e424aba21aed9aa380795cd564cfe97da28 (diff)