gpu: nvgpu: add vidmem manager

Use the nvgpu-internal buddy allocator for video memory allocations, instead of nvmap. This allows better integration for copyengine, BAR1 mapping to userspace, etc. Jira DNVGPU-38 Change-Id: I9fd67b76cd39721e4cd8e525ad0ed76f497e8b99 Signed-off-by: Konsta Holtta <kholtta@nvidia.com> Reviewed-on: http://git-master/r/1181151 Reviewed-by: Automatic_Commit_Validation_User GVS: Gerrit_Virtual_Submit Reviewed-by: Vijayakumar Subbu <vsubbu@nvidia.com>
author: Konsta Holtta <kholtta@nvidia.com> 2016-07-11 09:02:57 -0400
committer: Vijayakumar Subbu <vsubbu@nvidia.com> 2016-07-21 08:54:26 -0400
commit: 83071083d779b67ad73172675a6dfa34ed19b414 (patch)
tree: 19040ddfa5bd3a959a99647a2a2f0c1a08ae3d8f /drivers/gpu/nvgpu
parent: 306dee6cbb29599b301d68c449e76b5249f143d6 (diff)
3 files changed, 58 insertions, 60 deletions
diff --git a/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c b/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
index e2f2d9e9..a69cce0c 100644
--- a/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
@@ -224,7 +224,7 @@ static inline int gk20a_get_valid_launch_flags(struct gk20a *g, int launch_flags
 {
        /* there is no local memory available,
        don't allow local memory related CE flags */
-        if (!g->mm.vidmem_size) {
+        if (!g->mm.vidmem.size) {
                launch_flags &= ~(NVGPU_CE_SRC_LOCATION_LOCAL_FB |
                        NVGPU_CE_DST_LOCATION_LOCAL_FB);
        }
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index 7b2174bc..bf3d990c 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -699,6 +699,14 @@ void gk20a_remove_vm(struct vm_gk20a *vm, struct mem_desc *inst_block)
        gk20a_vm_remove_support_nofree(vm);
 }
+static void gk20a_vidmem_destroy(struct gk20a *g)
+{
+#if defined(CONFIG_GK20A_VIDMEM)
+        if (gk20a_alloc_initialized(&g->mm.vidmem.allocator))
+                gk20a_alloc_destroy(&g->mm.vidmem.allocator);
+#endif
+}
 static void gk20a_remove_mm_support(struct mm_gk20a *mm)
 {
        struct gk20a *g = gk20a_from_mm(mm);
@@ -711,13 +719,15 @@ static void gk20a_remove_mm_support(struct mm_gk20a *mm)
        gk20a_free_inst_block(gk20a_from_mm(mm), &mm->hwpm.inst_block);
        gk20a_vm_remove_support_nofree(&mm->cde.vm);
-        if (mm->ce_vidmem_ctx_id != ~0)
+        if (mm->vidmem.ce_ctx_id != ~0)
-                gk20a_ce_delete_context(g->dev, mm->ce_vidmem_ctx_id );
+                gk20a_ce_delete_context(g->dev, mm->vidmem.ce_ctx_id);
-        mm->ce_vidmem_ctx_id =  ~0;
+        mm->vidmem.ce_ctx_id = ~0;
        if (platform->has_ce)
                gk20a_vm_remove_support_nofree(&mm->ce.vm);
+        gk20a_vidmem_destroy(g);
 }
 static int gk20a_alloc_sysmem_flush(struct gk20a *g)
@@ -744,14 +754,15 @@ static int gk20a_init_vidmem(struct mm_gk20a *mm)
        if (!size)
                return 0;
-        err = nvmap_register_vidmem_carveout(&mm->vidmem_dev, SZ_4K, size);
+        err = gk20a_buddy_allocator_init(&g->mm.vidmem.allocator, "vidmem",
+                        SZ_4K, size, SZ_4K, 0);
        if (err) {
                gk20a_err(d, "Failed to register vidmem for size %zu: %d",
                                size, err);
                return err;
        }
-        mm->vidmem_size = size;
+        mm->vidmem.size = size;
        gk20a_dbg_info("registered vidmem: %zu MB", size / SZ_1M);
@@ -785,7 +796,7 @@ int gk20a_init_mm_setup_sw(struct gk20a *g)
        gk20a_init_pramin(mm);
-        mm->ce_vidmem_ctx_id =  ~0;
+        mm->vidmem.ce_ctx_id = ~0;
        err = gk20a_init_vidmem(mm);
        if (err)
@@ -902,8 +913,8 @@ int gk20a_init_mm_support(struct gk20a *g)
 void gk20a_init_mm_ce_context(struct gk20a *g)
 {
 #if defined(CONFIG_GK20A_VIDMEM)
-        if (g->mm.vidmem_size && (g->mm.ce_vidmem_ctx_id ==  ~0)) {
+        if (g->mm.vidmem.size && (g->mm.vidmem.ce_ctx_id == ~0)) {
-                g->mm.ce_vidmem_ctx_id =
+                g->mm.vidmem.ce_ctx_id =
                        gk20a_ce_create_context_with_cb(g->dev,
                                gk20a_fifo_get_fast_ce_runlist_id(g),
                                -1,
@@ -911,7 +922,7 @@ void gk20a_init_mm_ce_context(struct gk20a *g)
                                -1,
                                NULL);
-                if (g->mm.ce_vidmem_ctx_id == ~0)
+                if (g->mm.vidmem.ce_ctx_id == ~0)
                        gk20a_err(g->dev,
                                "Failed to allocate CE context for vidmem page clearing support");
        }
@@ -2518,51 +2529,55 @@ int gk20a_gmmu_alloc_attr_vid_at(struct gk20a *g, enum dma_attr attr,
                size_t size, struct mem_desc *mem, dma_addr_t at)
 {
 #if defined(CONFIG_GK20A_VIDMEM)
-        struct device *d = &g->mm.vidmem_dev;
+        u64 addr;
        int err;
-        dma_addr_t iova;
        bool need_pramin_access = true;
-        DEFINE_DMA_ATTRS(attrs);
        gk20a_dbg_fn("");
-        if (at) {
+        if (!gk20a_alloc_initialized(&g->mm.vidmem.allocator))
-                void *va;
+                return -ENOSYS;
-                dma_set_attr(DMA_ATTR_ALLOC_EXACT_SIZE, &attrs);
+        /* we don't support dma attributes here, except that kernel mappings
-                va = dma_mark_declared_memory_occupied(d, at, size,
+         * are not done anyway */
-                                &attrs);
+        WARN_ON(attr != 0 && attr != DMA_ATTR_NO_KERNEL_MAPPING);
-                if (IS_ERR(va))
+        if (at) {
-                        return PTR_ERR(va);
+                addr = gk20a_alloc_fixed(&g->mm.vidmem.allocator, at, size);
+                if (!addr)
+                        return -ENOMEM;
-                iova = at;
                mem->fixed = true;
        } else {
-                dma_set_attr(attr, &attrs);
+                addr = gk20a_alloc(&g->mm.vidmem.allocator, size);
-                dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, &attrs);
+                if (!addr)
-                /* cpuva has no meaning here, the following returns null */
-                dma_alloc_attrs(d, size, &iova, GFP_KERNEL, &attrs);
-                if (iova == DMA_ERROR_CODE)
                        return -ENOMEM;
                mem->fixed = false;
        }
-        err = gk20a_get_sgtable(d, &mem->sgt, NULL, iova, size);
+        mem->sgt = kzalloc(sizeof(struct sg_table), GFP_KERNEL);
+        if (!mem->sgt) {
+                err = -ENOMEM;
+                goto fail_physfree;
+        }
+        err = sg_alloc_table(mem->sgt, 1, GFP_KERNEL);
        if (err)
-                goto fail_free;
+                goto fail_kfree;
+        sg_dma_address(mem->sgt->sgl) = addr;
+        sg_set_page(mem->sgt->sgl, NULL, size, 0);
        mem->size = size;
        mem->aperture = APERTURE_VIDMEM;
-        if (g->mm.ce_vidmem_ctx_id != ~0) {
+        if (g->mm.vidmem.ce_ctx_id != ~0) {
                struct gk20a_fence *gk20a_fence_out = NULL;
                u64 dst_bufbase = g->ops.mm.get_iova_addr(g, mem->sgt->sgl, 0);
                err = gk20a_ce_execute_ops(g->dev,
-                                g->mm.ce_vidmem_ctx_id,
+                                g->mm.vidmem.ce_ctx_id,
                                0,
                                dst_bufbase,
                                (u64)size,
@@ -2590,18 +2605,14 @@ int gk20a_gmmu_alloc_attr_vid_at(struct gk20a *g, enum dma_attr attr,
        if (need_pramin_access)
                gk20a_memset(g, mem, 0, 0, size);
-        gk20a_dbg_fn("done");
+        gk20a_dbg_fn("done at 0x%llx size %zu", addr, size);
        return 0;
-fail_free:
+fail_kfree:
-        if (at) {
+        kfree(mem->sgt);
-                dma_mark_declared_memory_unoccupied(d, iova, mem->size,
+fail_physfree:
-                                &attrs);
+        gk20a_free(&g->mm.vidmem.allocator, addr);
-        } else {
-                dma_free_attrs(d, size, NULL, iova, &attrs);
-        }
        return err;
 #else
        return -ENOSYS;
@@ -2612,23 +2623,8 @@ static void gk20a_gmmu_free_attr_vid(struct gk20a *g, enum dma_attr attr,
                          struct mem_desc *mem)
 {
 #if defined(CONFIG_GK20A_VIDMEM)
-        struct device *d = &g->mm.vidmem_dev;
+        gk20a_free(&g->mm.vidmem.allocator, sg_dma_address(mem->sgt->sgl));
-        DEFINE_DMA_ATTRS(attrs);
+        gk20a_free_sgtable(&mem->sgt);
-        if (mem->fixed) {
-                dma_set_attr(DMA_ATTR_ALLOC_EXACT_SIZE, &attrs);
-                dma_mark_declared_memory_unoccupied(d,
-                                sg_dma_address(mem->sgt->sgl), mem->size,
-                                &attrs);
-        } else {
-                dma_set_attr(attr, &attrs);
-                dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, &attrs);
-                dma_free_attrs(d, mem->size, NULL,
-                                sg_dma_address(mem->sgt->sgl),
-                                &attrs);
-                gk20a_free_sgtable(&mem->sgt);
-        }
        mem->size = 0;
        mem->aperture = APERTURE_INVALID;
 #endif
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index 184c1f71..d7503948 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -391,9 +391,11 @@ struct mm_gk20a {
        bool force_pramin; /* via debugfs */
 #endif
-        size_t vidmem_size;
+        struct {
-        struct device vidmem_dev;
+                size_t size;
-        u32 ce_vidmem_ctx_id;
+                struct gk20a_allocator allocator;
+                u32 ce_ctx_id;
+        } vidmem;
 };
 int gk20a_mm_init(struct mm_gk20a *mm);
author	Konsta Holtta <kholtta@nvidia.com>	2016-07-11 09:02:57 -0400
committer	Vijayakumar Subbu <vsubbu@nvidia.com>	2016-07-21 08:54:26 -0400
commit	83071083d779b67ad73172675a6dfa34ed19b414 (patch)
tree	19040ddfa5bd3a959a99647a2a2f0c1a08ae3d8f /drivers/gpu/nvgpu
parent	306dee6cbb29599b301d68c449e76b5249f143d6 (diff)