gpu: nvgpu: Move DMA API to dma.h

Make an nvgpu DMA API include file so that the intricacies of the Linux DMA API can be hidden from the calling code. Also document the nvgpu DMA API. JIRA NVGPU-12 Change-Id: I7578e4c726ad46344b7921179d95861858e9a27e Signed-off-by: Alex Waterman <alexw@nvidia.com> Reviewed-on: http://git-master/r/1323326 Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com> Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
author: Alex Waterman <alexw@nvidia.com> 2017-03-21 17:32:13 -0400
committer: mobile promotions <svcmobile_promotions@nvidia.com> 2017-04-06 21:14:58 -0400
commit: 8f2d4a3f4a0acc81bae6725d30506e92651a42b5 (patch)
tree: 5cfe8a72fc824d167d3ce0f207621e1e4eb88391 /drivers/gpu/nvgpu/gk20a
parent: c9665079d7b12f22a847c62587724b4ee120ca6e (diff)
11 files changed, 11 insertions, 442 deletions
diff --git a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
index 0db6c21a..e70ee4a6 100644
--- a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
@@ -24,6 +24,7 @@
 #include <trace/events/gk20a.h>
+#include <nvgpu/dma.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/nvgpu_common.h>
 #include <nvgpu/kmem.h>
diff --git a/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c b/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
index ce76bfc3..9cc4b678 100644
--- a/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
@@ -26,6 +26,7 @@
 #include <linux/debugfs.h>
 #include <nvgpu/kmem.h>
+#include <nvgpu/dma.h>
 #include "gk20a.h"
 #include "debug_gk20a.h"
diff --git a/drivers/gpu/nvgpu/gk20a/channel_gk20a.c b/drivers/gpu/nvgpu/gk20a/channel_gk20a.c
index d0e2be79..6be616b3 100644
--- a/drivers/gpu/nvgpu/gk20a/channel_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/channel_gk20a.c
@@ -26,6 +26,7 @@
 #include <nvgpu/semaphore.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/kmem.h>
+#include <nvgpu/dma.h>
 #include "gk20a.h"
 #include "debug_gk20a.h"
diff --git a/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c
index 98fa53ab..738e8c1c 100644
--- a/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c
@@ -22,6 +22,7 @@
 #include <nvgpu/kmem.h>
 #include <nvgpu/lock.h>
+#include <nvgpu/dma.h>
 #include "gk20a.h"
 #include "css_gr_gk20a.h"
diff --git a/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c b/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c
index 3ed28718..d8fa7505 100644
--- a/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c
@@ -24,6 +24,7 @@
 #include <uapi/linux/nvgpu.h>
 #include <nvgpu/kmem.h>
+#include <nvgpu/dma.h>
 #include "ctxsw_trace_gk20a.h"
 #include "fecs_trace_gk20a.h"
diff --git a/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c b/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c
index 1e9a8e15..c1f94eb3 100644
--- a/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c
@@ -26,6 +26,7 @@
 #endif
 #include <linux/sort.h>
+#include <nvgpu/dma.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/semaphore.h>
 #include <nvgpu/kmem.h>
diff --git a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
index 971e2320..a9b6a546 100644
--- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -29,6 +29,7 @@
 #include <linux/bsearch.h>
 #include <trace/events/gk20a.h>
+#include <nvgpu/dma.h>
 #include <nvgpu/kmem.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/nvgpu_common.h>
diff --git a/drivers/gpu/nvgpu/gk20a/ltc_common.c b/drivers/gpu/nvgpu/gk20a/ltc_common.c
index 7c4db84e..7c73be77 100644
--- a/drivers/gpu/nvgpu/gk20a/ltc_common.c
+++ b/drivers/gpu/nvgpu/gk20a/ltc_common.c
@@ -21,6 +21,8 @@
 #include <linux/dma-mapping.h>
 #include <linux/delay.h>
+#include <nvgpu/dma.h>
 #include "gk20a.h"
 #include "gr_gk20a.h"
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index cdd0e541..79654af3 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -30,6 +30,7 @@
 #include <uapi/linux/nvgpu.h>
 #include <trace/events/gk20a.h>
+#include <nvgpu/dma.h>
 #include <nvgpu/kmem.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/pramin.h>
@@ -2519,152 +2520,6 @@ u64 gk20a_gmmu_fixed_map(struct vm_gk20a *vm,
                        aperture);
 }
-int gk20a_gmmu_alloc(struct gk20a *g, size_t size, struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_flags(g, 0, size, mem);
-}
-int gk20a_gmmu_alloc_flags(struct gk20a *g, unsigned long flags, size_t size,
-                struct nvgpu_mem *mem)
-{
-        if (g->mm.vidmem_is_vidmem) {
-                /*
-                 * Force the no-kernel-mapping flag on because we don't support
-                 * the lack of it for vidmem - the user should not care when
-                 * using gk20a_gmmu_alloc_map and it's vidmem, or if there's a
-                 * difference, the user should use the flag explicitly anyway.
-                 */
-                int err = gk20a_gmmu_alloc_flags_vid(g,
-                                flags | NVGPU_DMA_NO_KERNEL_MAPPING,
-                                size, mem);
-                if (!err)
-                        return 0;
-                /*
-                 * Fall back to sysmem (which may then also fail) in case
-                 * vidmem is exhausted.
-                 */
-        }
-        return gk20a_gmmu_alloc_flags_sys(g, flags, size, mem);
-}
-int gk20a_gmmu_alloc_sys(struct gk20a *g, size_t size, struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_flags_sys(g, 0, size, mem);
-}
-#if LINUX_VERSION_CODE >= KERNEL_VERSION(4, 9, 0)
-static void gk20a_dma_flags_to_attrs(unsigned long *attrs,
-                unsigned long flags)
-#define ATTR_ARG(x) *x
-#else
-static void gk20a_dma_flags_to_attrs(struct dma_attrs *attrs,
-                unsigned long flags)
-#define ATTR_ARG(x) x
-#endif
-{
-        if (flags & NVGPU_DMA_NO_KERNEL_MAPPING)
-                dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, ATTR_ARG(attrs));
-        if (flags & NVGPU_DMA_FORCE_CONTIGUOUS)
-                dma_set_attr(DMA_ATTR_FORCE_CONTIGUOUS, ATTR_ARG(attrs));
-        if (flags & NVGPU_DMA_READ_ONLY)
-                dma_set_attr(DMA_ATTR_READ_ONLY, ATTR_ARG(attrs));
-#undef ATTR_ARG
-}
-int gk20a_gmmu_alloc_flags_sys(struct gk20a *g, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem)
-{
-        struct device *d = dev_from_gk20a(g);
-        int err;
-        dma_addr_t iova;
-        gk20a_dbg_fn("");
-        if (flags) {
-                DEFINE_DMA_ATTRS(dma_attrs);
-                gk20a_dma_flags_to_attrs(&dma_attrs, flags);
-                if (flags & NVGPU_DMA_NO_KERNEL_MAPPING) {
-                        mem->pages = dma_alloc_attrs(d,
-                                        size, &iova, GFP_KERNEL,
-                                        __DMA_ATTR(dma_attrs));
-                        if (!mem->pages)
-                                return -ENOMEM;
-                } else {
-                        mem->cpu_va = dma_alloc_attrs(d,
-                                        size, &iova, GFP_KERNEL,
-                                        __DMA_ATTR(dma_attrs));
-                        if (!mem->cpu_va)
-                                return -ENOMEM;
-                }
-        } else {
-                mem->cpu_va = dma_alloc_coherent(d, size, &iova, GFP_KERNEL);
-                if (!mem->cpu_va)
-                        return -ENOMEM;
-        }
-        if (flags & NVGPU_DMA_NO_KERNEL_MAPPING)
-                err = gk20a_get_sgtable_from_pages(d, &mem->sgt, mem->pages,
-                                                   iova, size);
-        else {
-                err = gk20a_get_sgtable(d, &mem->sgt, mem->cpu_va, iova, size);
-                memset(mem->cpu_va, 0, size);
-        }
-        if (err)
-                goto fail_free;
-        mem->size = size;
-        mem->aperture = APERTURE_SYSMEM;
-        mem->flags = flags;
-        gk20a_dbg_fn("done");
-        return 0;
-fail_free:
-        dma_free_coherent(d, size, mem->cpu_va, iova);
-        mem->cpu_va = NULL;
-        mem->sgt = NULL;
-        return err;
-}
-static void gk20a_gmmu_free_sys(struct gk20a *g, struct nvgpu_mem *mem)
-{
-        struct device *d = dev_from_gk20a(g);
-        if (mem->cpu_va || mem->pages) {
-                if (mem->flags) {
-                        DEFINE_DMA_ATTRS(dma_attrs);
-                        gk20a_dma_flags_to_attrs(&dma_attrs, mem->flags);
-                        if (mem->flags & NVGPU_DMA_NO_KERNEL_MAPPING) {
-                                dma_free_attrs(d, mem->size, mem->pages,
-                                        sg_dma_address(mem->sgt->sgl),
-                                        __DMA_ATTR(dma_attrs));
-                        } else {
-                                dma_free_attrs(d, mem->size, mem->cpu_va,
-                                        sg_dma_address(mem->sgt->sgl),
-                                        __DMA_ATTR(dma_attrs));
-                        }
-                } else {
-                        dma_free_coherent(d, mem->size, mem->cpu_va,
-                                        sg_dma_address(mem->sgt->sgl));
-                }
-                mem->cpu_va = NULL;
-                mem->pages = NULL;
-        }
-        if (mem->sgt)
-                gk20a_free_sgtable(g, &mem->sgt);
-        mem->size = 0;
-        mem->aperture = APERTURE_INVALID;
-}
 #if defined(CONFIG_GK20A_VIDMEM)
 static int gk20a_gmmu_clear_vidmem_mem(struct gk20a *g, struct nvgpu_mem *mem)
 {
@@ -2728,153 +2583,6 @@ static int gk20a_gmmu_clear_vidmem_mem(struct gk20a *g, struct nvgpu_mem *mem)
 }
 #endif
-int gk20a_gmmu_alloc_vid(struct gk20a *g, size_t size, struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_flags_vid(g,
-                        NVGPU_DMA_NO_KERNEL_MAPPING, size, mem);
-}
-int gk20a_gmmu_alloc_flags_vid(struct gk20a *g, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_flags_vid_at(g, flags, size, mem, 0);
-}
-#if defined(CONFIG_GK20A_VIDMEM)
-static u64 __gk20a_gmmu_alloc(struct nvgpu_allocator *allocator, dma_addr_t at,
-                                size_t size)
-{
-        u64 addr = 0;
-        if (at)
-                addr = nvgpu_alloc_fixed(allocator, at, size, 0);
-        else
-                addr = nvgpu_alloc(allocator, size);
-        return addr;
-}
-#endif
-int gk20a_gmmu_alloc_flags_vid_at(struct gk20a *g, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem, dma_addr_t at)
-{
-#if defined(CONFIG_GK20A_VIDMEM)
-        u64 addr;
-        int err;
-        struct nvgpu_allocator *vidmem_alloc = g->mm.vidmem.cleared ?
-                &g->mm.vidmem.allocator :
-                &g->mm.vidmem.bootstrap_allocator;
-        int before_pending;
-        gk20a_dbg_fn("");
-        if (!nvgpu_alloc_initialized(&g->mm.vidmem.allocator))
-                return -ENOSYS;
-        /*
-         * Our own allocator doesn't have any flags yet, and we can't
-         * kernel-map these, so require explicit flags.
-         */
-        WARN_ON(flags != NVGPU_DMA_NO_KERNEL_MAPPING);
-        nvgpu_mutex_acquire(&g->mm.vidmem.clear_list_mutex);
-        before_pending = atomic64_read(&g->mm.vidmem.bytes_pending);
-        addr = __gk20a_gmmu_alloc(vidmem_alloc, at, size);
-        nvgpu_mutex_release(&g->mm.vidmem.clear_list_mutex);
-        if (!addr) {
-                /*
-                 * If memory is known to be freed soon, let the user know that
-                 * it may be available after a while.
-                 */
-                if (before_pending)
-                        return -EAGAIN;
-                else
-                        return -ENOMEM;
-        }
-        if (at)
-                mem->fixed = true;
-        else
-                mem->fixed = false;
-        mem->sgt = nvgpu_kzalloc(g, sizeof(struct sg_table));
-        if (!mem->sgt) {
-                err = -ENOMEM;
-                goto fail_physfree;
-        }
-        err = sg_alloc_table(mem->sgt, 1, GFP_KERNEL);
-        if (err)
-                goto fail_kfree;
-        set_vidmem_page_alloc(mem->sgt->sgl, addr);
-        sg_set_page(mem->sgt->sgl, NULL, size, 0);
-        mem->size = size;
-        mem->aperture = APERTURE_VIDMEM;
-        mem->allocator = vidmem_alloc;
-        mem->flags = flags;
-        nvgpu_init_list_node(&mem->clear_list_entry);
-        gk20a_dbg_fn("done at 0x%llx size %zu", addr, size);
-        return 0;
-fail_kfree:
-        nvgpu_kfree(g, mem->sgt);
-fail_physfree:
-        nvgpu_free(&g->mm.vidmem.allocator, addr);
-        return err;
-#else
-        return -ENOSYS;
-#endif
-}
-static void gk20a_gmmu_free_vid(struct gk20a *g, struct nvgpu_mem *mem)
-{
-#if defined(CONFIG_GK20A_VIDMEM)
-        bool was_empty;
-        /* Sanity check - only this supported when allocating. */
-        WARN_ON(mem->flags != NVGPU_DMA_NO_KERNEL_MAPPING);
-        if (mem->user_mem) {
-                nvgpu_mutex_acquire(&g->mm.vidmem.clear_list_mutex);
-                was_empty = nvgpu_list_empty(&g->mm.vidmem.clear_list_head);
-                nvgpu_list_add_tail(&mem->clear_list_entry,
-                              &g->mm.vidmem.clear_list_head);
-                atomic64_add(mem->size, &g->mm.vidmem.bytes_pending);
-                nvgpu_mutex_release(&g->mm.vidmem.clear_list_mutex);
-                if (was_empty) {
-                        cancel_work_sync(&g->mm.vidmem.clear_mem_worker);
-                        schedule_work(&g->mm.vidmem.clear_mem_worker);
-                }
-        } else {
-                nvgpu_memset(g, mem, 0, 0, mem->size);
-                nvgpu_free(mem->allocator,
-                           (u64)get_vidmem_page_alloc(mem->sgt->sgl));
-                gk20a_free_sgtable(g, &mem->sgt);
-                mem->size = 0;
-                mem->aperture = APERTURE_INVALID;
-        }
-#endif
-}
-void gk20a_gmmu_free(struct gk20a *g, struct nvgpu_mem *mem)
-{
-        switch (mem->aperture) {
-        case APERTURE_SYSMEM:
-                return gk20a_gmmu_free_sys(g, mem);
-        case APERTURE_VIDMEM:
-                return gk20a_gmmu_free_vid(g, mem);
-        default:
-                break; /* like free() on "null" memory */
-        }
-}
 /*
 * If mem is in VIDMEM, return base address in vidmem
 * else return IOVA address for SYSMEM
@@ -2938,105 +2646,6 @@ static void gk20a_vidmem_clear_mem_worker(struct work_struct *work)
 }
 #endif
-int gk20a_gmmu_alloc_map(struct vm_gk20a *vm, size_t size,
-                struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_map_flags(vm, 0, size, mem);
-}
-int gk20a_gmmu_alloc_map_flags(struct vm_gk20a *vm, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem)
-{
-        if (vm->mm->vidmem_is_vidmem) {
-                /*
-                 * Force the no-kernel-mapping flag on because we don't support
-                 * the lack of it for vidmem - the user should not care when
-                 * using gk20a_gmmu_alloc_map and it's vidmem, or if there's a
-                 * difference, the user should use the flag explicitly anyway.
-                 */
-                int err = gk20a_gmmu_alloc_map_flags_vid(vm,
-                                flags | NVGPU_DMA_NO_KERNEL_MAPPING,
-                                size, mem);
-                if (!err)
-                        return 0;
-                /*
-                 * Fall back to sysmem (which may then also fail) in case
-                 * vidmem is exhausted.
-                 */
-        }
-        return gk20a_gmmu_alloc_map_flags_sys(vm, flags, size, mem);
-}
-int gk20a_gmmu_alloc_map_sys(struct vm_gk20a *vm, size_t size,
-                struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_map_flags_sys(vm, 0, size, mem);
-}
-int gk20a_gmmu_alloc_map_flags_sys(struct vm_gk20a *vm, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem)
-{
-        int err = gk20a_gmmu_alloc_flags_sys(vm->mm->g, flags, size, mem);
-        if (err)
-                return err;
-        mem->gpu_va = gk20a_gmmu_map(vm, &mem->sgt, size, 0,
-                                     gk20a_mem_flag_none, false,
-                                     mem->aperture);
-        if (!mem->gpu_va) {
-                err = -ENOMEM;
-                goto fail_free;
-        }
-        return 0;
-fail_free:
-        gk20a_gmmu_free(vm->mm->g, mem);
-        return err;
-}
-int gk20a_gmmu_alloc_map_vid(struct vm_gk20a *vm, size_t size,
-                struct nvgpu_mem *mem)
-{
-        return gk20a_gmmu_alloc_map_flags_vid(vm,
-                        NVGPU_DMA_NO_KERNEL_MAPPING, size, mem);
-}
-int gk20a_gmmu_alloc_map_flags_vid(struct vm_gk20a *vm, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem)
-{
-        int err = gk20a_gmmu_alloc_flags_vid(vm->mm->g, flags, size, mem);
-        if (err)
-                return err;
-        mem->gpu_va = gk20a_gmmu_map(vm, &mem->sgt, size, 0,
-                                     gk20a_mem_flag_none, false,
-                                     mem->aperture);
-        if (!mem->gpu_va) {
-                err = -ENOMEM;
-                goto fail_free;
-        }
-        return 0;
-fail_free:
-        gk20a_gmmu_free(vm->mm->g, mem);
-        return err;
-}
-void gk20a_gmmu_unmap_free(struct vm_gk20a *vm, struct nvgpu_mem *mem)
-{
-        if (mem->gpu_va)
-                gk20a_gmmu_unmap(vm, mem->gpu_va, mem->size, gk20a_mem_flag_none);
-        mem->gpu_va = 0;
-        gk20a_gmmu_free(vm->mm->g, mem);
-}
 dma_addr_t gk20a_mm_gpuva_to_iova_base(struct vm_gk20a *vm, u64 gpu_vaddr)
 {
        struct mapped_buffer_node *buffer;
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index db72ca79..53366caf 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -524,56 +524,6 @@ u64 gk20a_gmmu_fixed_map(struct vm_gk20a *vm,
                bool priv,
                enum nvgpu_aperture aperture);
-/* Flags for the below gk20a_gmmu_{alloc,alloc_map}_flags* */
-/*
- * Don't create a virtual kernel mapping for the buffer but only allocate it;
- * this may save some resources. The buffer can be mapped later explicitly.
- */
-#define NVGPU_DMA_NO_KERNEL_MAPPING     (1 << 0)
-/*
- * Don't allow building the buffer from individual pages but require a
- * physically contiguous block.
- */
-#define NVGPU_DMA_FORCE_CONTIGUOUS      (1 << 1)
-/*
- * Make the mapping read-only.
- */
-#define NVGPU_DMA_READ_ONLY             (1 << 2)
-int gk20a_gmmu_alloc_map(struct vm_gk20a *vm, size_t size,
-                struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_map_flags(struct vm_gk20a *vm, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_map_sys(struct vm_gk20a *vm, size_t size,
-                struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_map_flags_sys(struct vm_gk20a *vm, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_map_vid(struct vm_gk20a *vm, size_t size,
-                struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_map_flags_vid(struct vm_gk20a *vm, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem);
-void gk20a_gmmu_unmap_free(struct vm_gk20a *vm, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc(struct gk20a *g, size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_flags(struct gk20a *g, unsigned long flags, size_t size,
-                struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_sys(struct gk20a *g, size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_flags_sys(struct gk20a *g, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_vid(struct gk20a *g, size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_flags_vid(struct gk20a *g, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem);
-int gk20a_gmmu_alloc_flags_vid_at(struct gk20a *g, unsigned long flags,
-                size_t size, struct nvgpu_mem *mem, dma_addr_t at);
-void gk20a_gmmu_free(struct gk20a *g, struct nvgpu_mem *mem);
 static inline phys_addr_t gk20a_mem_phys(struct nvgpu_mem *mem)
 {
        /* FIXME: the sgt/sgl may get null if this is accessed e.g. in an isr
diff --git a/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c b/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c
index 591b7163..7a6bfe22 100644
--- a/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c
@@ -26,6 +26,7 @@
 #include <nvgpu/nvgpu_common.h>
 #include <nvgpu/timers.h>
 #include <nvgpu/kmem.h>
+#include <nvgpu/dma.h>
 #include "gk20a.h"
 #include "gr_gk20a.h"
author	Alex Waterman <alexw@nvidia.com>	2017-03-21 17:32:13 -0400
committer	mobile promotions <svcmobile_promotions@nvidia.com>	2017-04-06 21:14:58 -0400
commit	8f2d4a3f4a0acc81bae6725d30506e92651a42b5 (patch)
tree	5cfe8a72fc824d167d3ce0f207621e1e4eb88391 /drivers/gpu/nvgpu/gk20a
parent	c9665079d7b12f22a847c62587724b4ee120ca6e (diff)

diff --git a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c index 0db6c21a..e70ee4a6 100644 --- a/drivers/gpu/nvgpu/gk20a/cde_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/cde_gk20a.c
@@ -24,6 +24,7 @@
24		24
25	#include <trace/events/gk20a.h>	25	#include <trace/events/gk20a.h>
26		26
		27	#include <nvgpu/dma.h>
27	#include <nvgpu/timers.h>	28	#include <nvgpu/timers.h>
28	#include <nvgpu/nvgpu_common.h>	29	#include <nvgpu/nvgpu_common.h>
29	#include <nvgpu/kmem.h>	30	#include <nvgpu/kmem.h>


diff --git a/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c b/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c index ce76bfc3..9cc4b678 100644 --- a/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/ce2_gk20a.c
@@ -26,6 +26,7 @@
26	#include <linux/debugfs.h>	26	#include <linux/debugfs.h>
27		27
28	#include <nvgpu/kmem.h>	28	#include <nvgpu/kmem.h>
		29	#include <nvgpu/dma.h>
29		30
30	#include "gk20a.h"	31	#include "gk20a.h"
31	#include "debug_gk20a.h"	32	#include "debug_gk20a.h"


diff --git a/drivers/gpu/nvgpu/gk20a/channel_gk20a.c b/drivers/gpu/nvgpu/gk20a/channel_gk20a.c index d0e2be79..6be616b3 100644 --- a/drivers/gpu/nvgpu/gk20a/channel_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/channel_gk20a.c
@@ -26,6 +26,7 @@
26	#include <nvgpu/semaphore.h>	26	#include <nvgpu/semaphore.h>
27	#include <nvgpu/timers.h>	27	#include <nvgpu/timers.h>
28	#include <nvgpu/kmem.h>	28	#include <nvgpu/kmem.h>
		29	#include <nvgpu/dma.h>
29		30
30	#include "gk20a.h"	31	#include "gk20a.h"
31	#include "debug_gk20a.h"	32	#include "debug_gk20a.h"


diff --git a/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c index 98fa53ab..738e8c1c 100644 --- a/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/css_gr_gk20a.c
@@ -22,6 +22,7 @@
22		22
23	#include <nvgpu/kmem.h>	23	#include <nvgpu/kmem.h>
24	#include <nvgpu/lock.h>	24	#include <nvgpu/lock.h>
		25	#include <nvgpu/dma.h>
25		26
26	#include "gk20a.h"	27	#include "gk20a.h"
27	#include "css_gr_gk20a.h"	28	#include "css_gr_gk20a.h"


diff --git a/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c b/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c index 3ed28718..d8fa7505 100644 --- a/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/fecs_trace_gk20a.c
@@ -24,6 +24,7 @@
24	#include <uapi/linux/nvgpu.h>	24	#include <uapi/linux/nvgpu.h>
25		25
26	#include <nvgpu/kmem.h>	26	#include <nvgpu/kmem.h>
		27	#include <nvgpu/dma.h>
27		28
28	#include "ctxsw_trace_gk20a.h"	29	#include "ctxsw_trace_gk20a.h"
29	#include "fecs_trace_gk20a.h"	30	#include "fecs_trace_gk20a.h"


diff --git a/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c b/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c index 1e9a8e15..c1f94eb3 100644 --- a/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/fifo_gk20a.c
@@ -26,6 +26,7 @@
26	#endif	26	#endif
27	#include <linux/sort.h>	27	#include <linux/sort.h>
28		28
		29	#include <nvgpu/dma.h>
29	#include <nvgpu/timers.h>	30	#include <nvgpu/timers.h>
30	#include <nvgpu/semaphore.h>	31	#include <nvgpu/semaphore.h>
31	#include <nvgpu/kmem.h>	32	#include <nvgpu/kmem.h>


diff --git a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c index 971e2320..a9b6a546 100644 --- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -29,6 +29,7 @@
29	#include <linux/bsearch.h>	29	#include <linux/bsearch.h>
30	#include <trace/events/gk20a.h>	30	#include <trace/events/gk20a.h>
31		31
		32	#include <nvgpu/dma.h>
32	#include <nvgpu/kmem.h>	33	#include <nvgpu/kmem.h>
33	#include <nvgpu/timers.h>	34	#include <nvgpu/timers.h>
34	#include <nvgpu/nvgpu_common.h>	35	#include <nvgpu/nvgpu_common.h>


diff --git a/drivers/gpu/nvgpu/gk20a/ltc_common.c b/drivers/gpu/nvgpu/gk20a/ltc_common.c index 7c4db84e..7c73be77 100644 --- a/drivers/gpu/nvgpu/gk20a/ltc_common.c +++ b/drivers/gpu/nvgpu/gk20a/ltc_common.c
@@ -21,6 +21,8 @@
21	#include <linux/dma-mapping.h>	21	#include <linux/dma-mapping.h>
22	#include <linux/delay.h>	22	#include <linux/delay.h>
23		23
		24	#include <nvgpu/dma.h>
		25
24	#include "gk20a.h"	26	#include "gk20a.h"
25	#include "gr_gk20a.h"	27	#include "gr_gk20a.h"
26		28


diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c index cdd0e541..79654af3 100644 --- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -30,6 +30,7 @@
30	#include <uapi/linux/nvgpu.h>	30	#include <uapi/linux/nvgpu.h>
31	#include <trace/events/gk20a.h>	31	#include <trace/events/gk20a.h>
32		32
		33	#include <nvgpu/dma.h>
33	#include <nvgpu/kmem.h>	34	#include <nvgpu/kmem.h>
34	#include <nvgpu/timers.h>	35	#include <nvgpu/timers.h>
35	#include <nvgpu/pramin.h>	36	#include <nvgpu/pramin.h>
@@ -2519,152 +2520,6 @@ u64 gk20a_gmmu_fixed_map(struct vm_gk20a *vm,
2519	aperture);	2520	aperture);
2520	}	2521	}
2521		2522
2522	int gk20a_gmmu_alloc(struct gk20a g, size_t size, struct nvgpu_mem mem)
2523	{
2524	return gk20a_gmmu_alloc_flags(g, 0, size, mem);
2525	}
2526
2527	int gk20a_gmmu_alloc_flags(struct gk20a *g, unsigned long flags, size_t size,
2528	struct nvgpu_mem *mem)
2529	{
2530	if (g->mm.vidmem_is_vidmem) {
2531	/*
2532	* Force the no-kernel-mapping flag on because we don't support
2533	* the lack of it for vidmem - the user should not care when
2534	* using gk20a_gmmu_alloc_map and it's vidmem, or if there's a
2535	* difference, the user should use the flag explicitly anyway.
2536	*/
2537	int err = gk20a_gmmu_alloc_flags_vid(g,
2538	flags \| NVGPU_DMA_NO_KERNEL_MAPPING,
2539	size, mem);
2540
2541	if (!err)
2542	return 0;
2543	/*
2544	* Fall back to sysmem (which may then also fail) in case
2545	* vidmem is exhausted.
2546	*/
2547	}
2548
2549	return gk20a_gmmu_alloc_flags_sys(g, flags, size, mem);
2550	}
2551
2552	int gk20a_gmmu_alloc_sys(struct gk20a g, size_t size, struct nvgpu_mem mem)
2553	{
2554	return gk20a_gmmu_alloc_flags_sys(g, 0, size, mem);
2555	}
2556
2557	#if LINUX_VERSION_CODE >= KERNEL_VERSION(4, 9, 0)
2558	static void gk20a_dma_flags_to_attrs(unsigned long *attrs,
2559	unsigned long flags)
2560	#define ATTR_ARG(x) *x
2561	#else
2562	static void gk20a_dma_flags_to_attrs(struct dma_attrs *attrs,
2563	unsigned long flags)
2564	#define ATTR_ARG(x) x
2565	#endif
2566	{
2567	if (flags & NVGPU_DMA_NO_KERNEL_MAPPING)
2568	dma_set_attr(DMA_ATTR_NO_KERNEL_MAPPING, ATTR_ARG(attrs));
2569	if (flags & NVGPU_DMA_FORCE_CONTIGUOUS)
2570	dma_set_attr(DMA_ATTR_FORCE_CONTIGUOUS, ATTR_ARG(attrs));
2571	if (flags & NVGPU_DMA_READ_ONLY)
2572	dma_set_attr(DMA_ATTR_READ_ONLY, ATTR_ARG(attrs));
2573	#undef ATTR_ARG
2574	}
2575
2576	int gk20a_gmmu_alloc_flags_sys(struct gk20a *g, unsigned long flags,
2577	size_t size, struct nvgpu_mem *mem)
2578	{
2579	struct device *d = dev_from_gk20a(g);
2580	int err;
2581	dma_addr_t iova;
2582
2583	gk20a_dbg_fn("");
2584
2585	if (flags) {
2586	DEFINE_DMA_ATTRS(dma_attrs);
2587
2588	gk20a_dma_flags_to_attrs(&dma_attrs, flags);
2589
2590	if (flags & NVGPU_DMA_NO_KERNEL_MAPPING) {
2591	mem->pages = dma_alloc_attrs(d,
2592	size, &iova, GFP_KERNEL,
2593	__DMA_ATTR(dma_attrs));
2594	if (!mem->pages)
2595	return -ENOMEM;
2596	} else {
2597	mem->cpu_va = dma_alloc_attrs(d,
2598	size, &iova, GFP_KERNEL,
2599	__DMA_ATTR(dma_attrs));
2600	if (!mem->cpu_va)
2601	return -ENOMEM;
2602	}
2603	} else {
2604	mem->cpu_va = dma_alloc_coherent(d, size, &iova, GFP_KERNEL);
2605	if (!mem->cpu_va)
2606	return -ENOMEM;
2607	}
2608
2609	if (flags & NVGPU_DMA_NO_KERNEL_MAPPING)
2610	err = gk20a_get_sgtable_from_pages(d, &mem->sgt, mem->pages,
2611	iova, size);
2612	else {
2613	err = gk20a_get_sgtable(d, &mem->sgt, mem->cpu_va, iova, size);
2614	memset(mem->cpu_va, 0, size);
2615	}
2616	if (err)
2617	goto fail_free;
2618
2619	mem->size = size;
2620	mem->aperture = APERTURE_SYSMEM;
2621	mem->flags = flags;
2622
2623	gk20a_dbg_fn("done");
2624
2625	return 0;
2626
2627	fail_free:
2628	dma_free_coherent(d, size, mem->cpu_va, iova);
2629	mem->cpu_va = NULL;
2630	mem->sgt = NULL;
2631	return err;
2632	}
2633
2634	static void gk20a_gmmu_free_sys(struct gk20a g, struct nvgpu_mem mem)
2635	{
2636	struct device *d = dev_from_gk20a(g);
2637
2638	if (mem->cpu_va \|\| mem->pages) {
2639	if (mem->flags) {
2640	DEFINE_DMA_ATTRS(dma_attrs);
2641
2642	gk20a_dma_flags_to_attrs(&dma_attrs, mem->flags);
2643
2644	if (mem->flags & NVGPU_DMA_NO_KERNEL_MAPPING) {
2645	dma_free_attrs(d, mem->size, mem->pages,
2646	sg_dma_address(mem->sgt->sgl),
2647	__DMA_ATTR(dma_attrs));
2648	} else {
2649	dma_free_attrs(d, mem->size, mem->cpu_va,
2650	sg_dma_address(mem->sgt->sgl),
2651	__DMA_ATTR(dma_attrs));
2652	}
2653	} else {
2654	dma_free_coherent(d, mem->size, mem->cpu_va,
2655	sg_dma_address(mem->sgt->sgl));
2656	}
2657	mem->cpu_va = NULL;
2658	mem->pages = NULL;
2659	}
2660
2661	if (mem->sgt)
2662	gk20a_free_sgtable(g, &mem->sgt);
2663
2664	mem->size = 0;
2665	mem->aperture = APERTURE_INVALID;
2666	}
2667
2668	#if defined(CONFIG_GK20A_VIDMEM)	2523	#if defined(CONFIG_GK20A_VIDMEM)
2669	static int gk20a_gmmu_clear_vidmem_mem(struct gk20a g, struct nvgpu_mem mem)	2524	static int gk20a_gmmu_clear_vidmem_mem(struct gk20a g, struct nvgpu_mem mem)
2670	{	2525	{
@@ -2728,153 +2583,6 @@ static int gk20a_gmmu_clear_vidmem_mem(struct gk20a g, struct nvgpu_mem mem)
2728	}	2583	}
2729	#endif	2584	#endif
2730		2585
2731	int gk20a_gmmu_alloc_vid(struct gk20a g, size_t size, struct nvgpu_mem mem)
2732	{
2733	return gk20a_gmmu_alloc_flags_vid(g,
2734	NVGPU_DMA_NO_KERNEL_MAPPING, size, mem);
2735	}
2736
2737	int gk20a_gmmu_alloc_flags_vid(struct gk20a *g, unsigned long flags,
2738	size_t size, struct nvgpu_mem *mem)
2739	{
2740	return gk20a_gmmu_alloc_flags_vid_at(g, flags, size, mem, 0);
2741	}
2742
2743	#if defined(CONFIG_GK20A_VIDMEM)
2744	static u64 __gk20a_gmmu_alloc(struct nvgpu_allocator *allocator, dma_addr_t at,
2745	size_t size)
2746	{
2747	u64 addr = 0;
2748
2749	if (at)
2750	addr = nvgpu_alloc_fixed(allocator, at, size, 0);
2751	else
2752	addr = nvgpu_alloc(allocator, size);
2753
2754	return addr;
2755	}
2756	#endif
2757
2758	int gk20a_gmmu_alloc_flags_vid_at(struct gk20a *g, unsigned long flags,
2759	size_t size, struct nvgpu_mem *mem, dma_addr_t at)
2760	{
2761	#if defined(CONFIG_GK20A_VIDMEM)
2762	u64 addr;
2763	int err;
2764	struct nvgpu_allocator *vidmem_alloc = g->mm.vidmem.cleared ?
2765	&g->mm.vidmem.allocator :
2766	&g->mm.vidmem.bootstrap_allocator;
2767	int before_pending;
2768
2769	gk20a_dbg_fn("");
2770
2771	if (!nvgpu_alloc_initialized(&g->mm.vidmem.allocator))
2772	return -ENOSYS;
2773
2774	/*
2775	* Our own allocator doesn't have any flags yet, and we can't
2776	* kernel-map these, so require explicit flags.
2777	*/
2778	WARN_ON(flags != NVGPU_DMA_NO_KERNEL_MAPPING);
2779
2780	nvgpu_mutex_acquire(&g->mm.vidmem.clear_list_mutex);
2781	before_pending = atomic64_read(&g->mm.vidmem.bytes_pending);
2782	addr = __gk20a_gmmu_alloc(vidmem_alloc, at, size);
2783	nvgpu_mutex_release(&g->mm.vidmem.clear_list_mutex);
2784	if (!addr) {
2785	/*
2786	* If memory is known to be freed soon, let the user know that
2787	* it may be available after a while.
2788	*/
2789	if (before_pending)
2790	return -EAGAIN;
2791	else
2792	return -ENOMEM;
2793	}
2794
2795	if (at)
2796	mem->fixed = true;
2797	else
2798	mem->fixed = false;
2799
2800	mem->sgt = nvgpu_kzalloc(g, sizeof(struct sg_table));
2801	if (!mem->sgt) {
2802	err = -ENOMEM;
2803	goto fail_physfree;
2804	}
2805
2806	err = sg_alloc_table(mem->sgt, 1, GFP_KERNEL);
2807	if (err)
2808	goto fail_kfree;
2809
2810	set_vidmem_page_alloc(mem->sgt->sgl, addr);
2811	sg_set_page(mem->sgt->sgl, NULL, size, 0);
2812
2813	mem->size = size;
2814	mem->aperture = APERTURE_VIDMEM;
2815	mem->allocator = vidmem_alloc;
2816	mem->flags = flags;
2817
2818	nvgpu_init_list_node(&mem->clear_list_entry);
2819
2820	gk20a_dbg_fn("done at 0x%llx size %zu", addr, size);
2821
2822	return 0;
2823
2824	fail_kfree:
2825	nvgpu_kfree(g, mem->sgt);
2826	fail_physfree:
2827	nvgpu_free(&g->mm.vidmem.allocator, addr);
2828	return err;
2829	#else
2830	return -ENOSYS;
2831	#endif
2832	}
2833
2834	static void gk20a_gmmu_free_vid(struct gk20a g, struct nvgpu_mem mem)
2835	{
2836	#if defined(CONFIG_GK20A_VIDMEM)
2837	bool was_empty;
2838
2839	/* Sanity check - only this supported when allocating. */
2840	WARN_ON(mem->flags != NVGPU_DMA_NO_KERNEL_MAPPING);
2841
2842	if (mem->user_mem) {
2843	nvgpu_mutex_acquire(&g->mm.vidmem.clear_list_mutex);
2844	was_empty = nvgpu_list_empty(&g->mm.vidmem.clear_list_head);
2845	nvgpu_list_add_tail(&mem->clear_list_entry,
2846	&g->mm.vidmem.clear_list_head);
2847	atomic64_add(mem->size, &g->mm.vidmem.bytes_pending);
2848	nvgpu_mutex_release(&g->mm.vidmem.clear_list_mutex);
2849
2850	if (was_empty) {
2851	cancel_work_sync(&g->mm.vidmem.clear_mem_worker);
2852	schedule_work(&g->mm.vidmem.clear_mem_worker);
2853	}
2854	} else {
2855	nvgpu_memset(g, mem, 0, 0, mem->size);
2856	nvgpu_free(mem->allocator,
2857	(u64)get_vidmem_page_alloc(mem->sgt->sgl));
2858	gk20a_free_sgtable(g, &mem->sgt);
2859
2860	mem->size = 0;
2861	mem->aperture = APERTURE_INVALID;
2862	}
2863	#endif
2864	}
2865
2866	void gk20a_gmmu_free(struct gk20a g, struct nvgpu_mem mem)
2867	{
2868	switch (mem->aperture) {
2869	case APERTURE_SYSMEM:
2870	return gk20a_gmmu_free_sys(g, mem);
2871	case APERTURE_VIDMEM:
2872	return gk20a_gmmu_free_vid(g, mem);
2873	default:
2874	break; /* like free() on "null" memory */
2875	}
2876	}
2877
2878	/*	2586	/*
2879	* If mem is in VIDMEM, return base address in vidmem	2587	* If mem is in VIDMEM, return base address in vidmem
2880	* else return IOVA address for SYSMEM	2588	* else return IOVA address for SYSMEM
@@ -2938,105 +2646,6 @@ static void gk20a_vidmem_clear_mem_worker(struct work_struct *work)
2938	}	2646	}
2939	#endif	2647	#endif
2940		2648
2941	int gk20a_gmmu_alloc_map(struct vm_gk20a *vm, size_t size,
2942	struct nvgpu_mem *mem)
2943	{
2944	return gk20a_gmmu_alloc_map_flags(vm, 0, size, mem);
2945	}
2946
2947	int gk20a_gmmu_alloc_map_flags(struct vm_gk20a *vm, unsigned long flags,
2948	size_t size, struct nvgpu_mem *mem)
2949	{
2950	if (vm->mm->vidmem_is_vidmem) {
2951	/*
2952	* Force the no-kernel-mapping flag on because we don't support
2953	* the lack of it for vidmem - the user should not care when
2954	* using gk20a_gmmu_alloc_map and it's vidmem, or if there's a
2955	* difference, the user should use the flag explicitly anyway.
2956	*/
2957	int err = gk20a_gmmu_alloc_map_flags_vid(vm,
2958	flags \| NVGPU_DMA_NO_KERNEL_MAPPING,
2959	size, mem);
2960
2961	if (!err)
2962	return 0;
2963	/*
2964	* Fall back to sysmem (which may then also fail) in case
2965	* vidmem is exhausted.
2966	*/
2967	}
2968
2969	return gk20a_gmmu_alloc_map_flags_sys(vm, flags, size, mem);
2970	}
2971
2972	int gk20a_gmmu_alloc_map_sys(struct vm_gk20a *vm, size_t size,
2973	struct nvgpu_mem *mem)
2974	{
2975	return gk20a_gmmu_alloc_map_flags_sys(vm, 0, size, mem);
2976	}
2977
2978	int gk20a_gmmu_alloc_map_flags_sys(struct vm_gk20a *vm, unsigned long flags,
2979	size_t size, struct nvgpu_mem *mem)
2980	{
2981	int err = gk20a_gmmu_alloc_flags_sys(vm->mm->g, flags, size, mem);
2982
2983	if (err)
2984	return err;
2985
2986	mem->gpu_va = gk20a_gmmu_map(vm, &mem->sgt, size, 0,
2987	gk20a_mem_flag_none, false,
2988	mem->aperture);
2989	if (!mem->gpu_va) {
2990	err = -ENOMEM;
2991	goto fail_free;
2992	}
2993
2994	return 0;
2995
2996	fail_free:
2997	gk20a_gmmu_free(vm->mm->g, mem);
2998	return err;
2999	}
3000
3001	int gk20a_gmmu_alloc_map_vid(struct vm_gk20a *vm, size_t size,
3002	struct nvgpu_mem *mem)
3003	{
3004	return gk20a_gmmu_alloc_map_flags_vid(vm,
3005	NVGPU_DMA_NO_KERNEL_MAPPING, size, mem);
3006	}
3007
3008	int gk20a_gmmu_alloc_map_flags_vid(struct vm_gk20a *vm, unsigned long flags,
3009	size_t size, struct nvgpu_mem *mem)
3010	{
3011	int err = gk20a_gmmu_alloc_flags_vid(vm->mm->g, flags, size, mem);
3012
3013	if (err)
3014	return err;
3015
3016	mem->gpu_va = gk20a_gmmu_map(vm, &mem->sgt, size, 0,
3017	gk20a_mem_flag_none, false,
3018	mem->aperture);
3019	if (!mem->gpu_va) {
3020	err = -ENOMEM;
3021	goto fail_free;
3022	}
3023
3024	return 0;
3025
3026	fail_free:
3027	gk20a_gmmu_free(vm->mm->g, mem);
3028	return err;
3029	}
3030
3031	void gk20a_gmmu_unmap_free(struct vm_gk20a vm, struct nvgpu_mem mem)
3032	{
3033	if (mem->gpu_va)
3034	gk20a_gmmu_unmap(vm, mem->gpu_va, mem->size, gk20a_mem_flag_none);
3035	mem->gpu_va = 0;
3036
3037	gk20a_gmmu_free(vm->mm->g, mem);
3038	}
3039
3040	dma_addr_t gk20a_mm_gpuva_to_iova_base(struct vm_gk20a *vm, u64 gpu_vaddr)	2649	dma_addr_t gk20a_mm_gpuva_to_iova_base(struct vm_gk20a *vm, u64 gpu_vaddr)
3041	{	2650	{
3042	struct mapped_buffer_node *buffer;	2651	struct mapped_buffer_node *buffer;


diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h index db72ca79..53366caf 100644 --- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h +++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -524,56 +524,6 @@ u64 gk20a_gmmu_fixed_map(struct vm_gk20a *vm,
524	bool priv,	524	bool priv,
525	enum nvgpu_aperture aperture);	525	enum nvgpu_aperture aperture);
526		526
527	/* Flags for the below gk20a_gmmu_{alloc,alloc_map}_flags* */
528
529	/*
530	* Don't create a virtual kernel mapping for the buffer but only allocate it;
531	* this may save some resources. The buffer can be mapped later explicitly.
532	*/
533	#define NVGPU_DMA_NO_KERNEL_MAPPING (1 << 0)
534	/*
535	* Don't allow building the buffer from individual pages but require a
536	* physically contiguous block.
537	*/
538	#define NVGPU_DMA_FORCE_CONTIGUOUS (1 << 1)
539	/*
540	* Make the mapping read-only.
541	*/
542	#define NVGPU_DMA_READ_ONLY (1 << 2)
543
544	int gk20a_gmmu_alloc_map(struct vm_gk20a *vm, size_t size,
545	struct nvgpu_mem *mem);
546	int gk20a_gmmu_alloc_map_flags(struct vm_gk20a *vm, unsigned long flags,
547	size_t size, struct nvgpu_mem *mem);
548
549	int gk20a_gmmu_alloc_map_sys(struct vm_gk20a *vm, size_t size,
550	struct nvgpu_mem *mem);
551	int gk20a_gmmu_alloc_map_flags_sys(struct vm_gk20a *vm, unsigned long flags,
552	size_t size, struct nvgpu_mem *mem);
553
554	int gk20a_gmmu_alloc_map_vid(struct vm_gk20a *vm, size_t size,
555	struct nvgpu_mem *mem);
556	int gk20a_gmmu_alloc_map_flags_vid(struct vm_gk20a *vm, unsigned long flags,
557	size_t size, struct nvgpu_mem *mem);
558
559	void gk20a_gmmu_unmap_free(struct vm_gk20a vm, struct nvgpu_mem mem);
560
561	int gk20a_gmmu_alloc(struct gk20a g, size_t size, struct nvgpu_mem mem);
562	int gk20a_gmmu_alloc_flags(struct gk20a *g, unsigned long flags, size_t size,
563	struct nvgpu_mem *mem);
564
565	int gk20a_gmmu_alloc_sys(struct gk20a g, size_t size, struct nvgpu_mem mem);
566	int gk20a_gmmu_alloc_flags_sys(struct gk20a *g, unsigned long flags,
567	size_t size, struct nvgpu_mem *mem);
568
569	int gk20a_gmmu_alloc_vid(struct gk20a g, size_t size, struct nvgpu_mem mem);
570	int gk20a_gmmu_alloc_flags_vid(struct gk20a *g, unsigned long flags,
571	size_t size, struct nvgpu_mem *mem);
572	int gk20a_gmmu_alloc_flags_vid_at(struct gk20a *g, unsigned long flags,
573	size_t size, struct nvgpu_mem *mem, dma_addr_t at);
574
575	void gk20a_gmmu_free(struct gk20a g, struct nvgpu_mem mem);
576
577	static inline phys_addr_t gk20a_mem_phys(struct nvgpu_mem *mem)	527	static inline phys_addr_t gk20a_mem_phys(struct nvgpu_mem *mem)
578	{	528	{
579	/* FIXME: the sgt/sgl may get null if this is accessed e.g. in an isr	529	/* FIXME: the sgt/sgl may get null if this is accessed e.g. in an isr


diff --git a/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c b/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c index 591b7163..7a6bfe22 100644 --- a/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/pmu_gk20a.c
@@ -26,6 +26,7 @@
26	#include <nvgpu/nvgpu_common.h>	26	#include <nvgpu/nvgpu_common.h>
27	#include <nvgpu/timers.h>	27	#include <nvgpu/timers.h>
28	#include <nvgpu/kmem.h>	28	#include <nvgpu/kmem.h>
		29	#include <nvgpu/dma.h>
29		30
30	#include "gk20a.h"	31	#include "gk20a.h"
31	#include "gr_gk20a.h"	32	#include "gr_gk20a.h"