gpu: nvgpu: Implement common nvgpu_mem_rd* functions

nvgpu_mem_rd*() functions were implemented per OS. They also used nvgpu_pramin_access_batched() and implemented a big portion of logic for using PRAMIN in OS specific code. Make the implementation for the functions generic. Move all PRAMIN logic to PRAMIN and simplify the interface provided by PRAMIN. Change-Id: I1acb9e8d7d424325dc73314d5738cb2c9ebf7692 Signed-off-by: Terje Bergstrom <tbergstrom@nvidia.com> Reviewed-on: https://git-master.nvidia.com/r/1753708 Reviewed-by: Konsta Holtta <kholtta@nvidia.com> GVS: Gerrit_Virtual_Submit Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com> Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
author: Terje Bergstrom <tbergstrom@nvidia.com> 2018-06-15 12:25:01 -0400
committer: mobile promotions <svcmobile_promotions@nvidia.com> 2018-07-02 13:19:19 -0400
commit: 6ea52c59b0262556edb01835eaf91b3bfcdcdd71 (patch)
tree: 15fcd2bf17b28cea51384a7f8b0b2044f449ecae
parent: cf2ac655fdaeba5779ce9d73cbe567218a7c5a58 (diff)
8 files changed, 201 insertions, 270 deletions
diff --git a/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c b/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
index 855d455d..9f3b6cfa 100644
--- a/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
+++ b/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
@@ -177,3 +177,112 @@ u64 nvgpu_sgt_alignment(struct gk20a *g, struct nvgpu_sgt *sgt)
        return align;
 }
+u32 nvgpu_mem_rd32(struct gk20a *g, struct nvgpu_mem *mem, u32 w)
+{
+        u32 data = 0;
+        if (mem->aperture == APERTURE_SYSMEM) {
+                u32 *ptr = mem->cpu_va;
+                WARN_ON(!ptr);
+                data = ptr[w];
+        } else if (mem->aperture == APERTURE_VIDMEM) {
+                nvgpu_pramin_rd_n(g, mem, w * sizeof(u32), sizeof(u32), &data);
+        } else {
+                WARN_ON("Accessing unallocated nvgpu_mem");
+        }
+        return data;
+}
+u32 nvgpu_mem_rd(struct gk20a *g, struct nvgpu_mem *mem, u32 offset)
+{
+        WARN_ON(offset & 3);
+        return nvgpu_mem_rd32(g, mem, offset / sizeof(u32));
+}
+void nvgpu_mem_rd_n(struct gk20a *g, struct nvgpu_mem *mem,
+                u32 offset, void *dest, u32 size)
+{
+        WARN_ON(offset & 3);
+        WARN_ON(size & 3);
+        if (mem->aperture == APERTURE_SYSMEM) {
+                u8 *src = (u8 *)mem->cpu_va + offset;
+                WARN_ON(!mem->cpu_va);
+                memcpy(dest, src, size);
+        } else if (mem->aperture == APERTURE_VIDMEM) {
+                nvgpu_pramin_rd_n(g, mem, offset, size, dest);
+        } else {
+                WARN_ON("Accessing unallocated nvgpu_mem");
+        }
+}
+void nvgpu_mem_wr32(struct gk20a *g, struct nvgpu_mem *mem, u32 w, u32 data)
+{
+        if (mem->aperture == APERTURE_SYSMEM) {
+                u32 *ptr = mem->cpu_va;
+                WARN_ON(!ptr);
+                ptr[w] = data;
+        } else if (mem->aperture == APERTURE_VIDMEM) {
+                nvgpu_pramin_wr_n(g, mem, w * sizeof(u32), sizeof(u32), &data);
+                if (!mem->skip_wmb)
+                        nvgpu_wmb();
+        } else {
+                WARN_ON("Accessing unallocated nvgpu_mem");
+        }
+}
+void nvgpu_mem_wr(struct gk20a *g, struct nvgpu_mem *mem, u32 offset, u32 data)
+{
+        WARN_ON(offset & 3);
+        nvgpu_mem_wr32(g, mem, offset / sizeof(u32), data);
+}
+void nvgpu_mem_wr_n(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
+                void *src, u32 size)
+{
+        WARN_ON(offset & 3);
+        WARN_ON(size & 3);
+        if (mem->aperture == APERTURE_SYSMEM) {
+                u8 *dest = (u8 *)mem->cpu_va + offset;
+                WARN_ON(!mem->cpu_va);
+                memcpy(dest, src, size);
+        } else if (mem->aperture == APERTURE_VIDMEM) {
+                nvgpu_pramin_wr_n(g, mem, offset, size, src);
+                if (!mem->skip_wmb)
+                        nvgpu_wmb();
+        } else {
+                WARN_ON("Accessing unallocated nvgpu_mem");
+        }
+}
+void nvgpu_memset(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
+                u32 c, u32 size)
+{
+        WARN_ON(offset & 3);
+        WARN_ON(size & 3);
+        WARN_ON(c & ~0xff);
+        c &= 0xff;
+        if (mem->aperture == APERTURE_SYSMEM) {
+                u8 *dest = (u8 *)mem->cpu_va + offset;
+                WARN_ON(!mem->cpu_va);
+                memset(dest, c, size);
+        } else if (mem->aperture == APERTURE_VIDMEM) {
+                u32 repeat_value = c | (c << 8) | (c << 16) | (c << 24);
+                nvgpu_pramin_memset(g, mem, offset, size, repeat_value);
+                if (!mem->skip_wmb)
+                        nvgpu_wmb();
+        } else {
+                WARN_ON("Accessing unallocated nvgpu_mem");
+        }
+}
diff --git a/drivers/gpu/nvgpu/common/posix/io.c b/drivers/gpu/nvgpu/common/posix/io.c
index ce018940..dc32c20e 100644
--- a/drivers/gpu/nvgpu/common/posix/io.c
+++ b/drivers/gpu/nvgpu/common/posix/io.c
@@ -35,6 +35,11 @@ void nvgpu_writel(struct gk20a *g, u32 r, u32 v)
        BUG();
 }
+void nvgpu_writel_relaxed(struct gk20a *g, u32 r, u32 v)
+{
+        BUG();
+}
 u32 nvgpu_readl(struct gk20a *g, u32 r)
 {
        BUG();
diff --git a/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c b/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c
index 7f3bf9f1..fa92a7c6 100644
--- a/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c
+++ b/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c
@@ -27,65 +27,6 @@
 #include <nvgpu/nvgpu_mem.h>
 /*
- * DMA memory buffers - obviously we don't really have DMA in userspace but we
- * can emulate a lot of the DMA mem functionality for unit testing purposes.
- */
-u32 nvgpu_mem_rd32(struct gk20a *g, struct nvgpu_mem *mem, u32 w)
-{
-        u32 *mem_ptr = (u32 *)mem->cpu_va;
-        return mem_ptr[w];
-}
-u32 nvgpu_mem_rd(struct gk20a *g, struct nvgpu_mem *mem, u32 offset)
-{
-        if (offset & 0x3)
-                BUG();
-        return nvgpu_mem_rd32(g, mem, offset >> 2);
-}
-void nvgpu_mem_rd_n(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
-                    void *dest, u32 size)
-{
-        if (offset & 0x3 || size & 0x3)
-                BUG();
-        memcpy(dest, ((char *)mem->cpu_va) + offset, size);
-}
-void nvgpu_mem_wr32(struct gk20a *g, struct nvgpu_mem *mem, u32 w, u32 data)
-{
-        u32 *mem_ptr = (u32 *)mem->cpu_va;
-        mem_ptr[w] = data;
-}
-void nvgpu_mem_wr(struct gk20a *g, struct nvgpu_mem *mem, u32 offset, u32 data)
-{
-        if (offset & 0x3)
-                BUG();
-        nvgpu_mem_wr32(g, mem, offset >> 2, data);
-}
-void nvgpu_mem_wr_n(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
-                    void *src, u32 size)
-{
-        if (offset & 0x3 || size & 0x3)
-                BUG();
-        memcpy(((char *)mem->cpu_va) + offset, src, size);
-}
-void nvgpu_memset(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
-                  u32 c, u32 size)
-{
-        memset(((char *)mem->cpu_va) + offset, c, size);
-}
-/*
 * These functions are somewhat meaningless.
 */
 u64 nvgpu_mem_get_addr(struct gk20a *g, struct nvgpu_mem *mem)
diff --git a/drivers/gpu/nvgpu/common/pramin.c b/drivers/gpu/nvgpu/common/pramin.c
index 4c6a4a0d..99d588aa 100644
--- a/drivers/gpu/nvgpu/common/pramin.c
+++ b/drivers/gpu/nvgpu/common/pramin.c
@@ -28,11 +28,18 @@
 #include "gk20a/gk20a.h"
 /*
+ * This typedef is for functions that get called during the access_batched()
+ * operation.
+ */
+typedef void (*pramin_access_batch_fn)(struct gk20a *g, u32 start, u32 words,
+                                       u32 **arg);
+/*
 * The PRAMIN range is 1 MB, must change base addr if a buffer crosses that.
 * This same loop is used for read/write/memset. Offset and size in bytes.
 * One call to "loop" is done per range, with "arg" supplied.
 */
-void nvgpu_pramin_access_batched(struct gk20a *g, struct nvgpu_mem *mem,
+static void nvgpu_pramin_access_batched(struct gk20a *g, struct nvgpu_mem *mem,
                u32 offset, u32 size, pramin_access_batch_fn loop, u32 **arg)
 {
        struct nvgpu_page_alloc *alloc = NULL;
@@ -87,6 +94,69 @@ void nvgpu_pramin_access_batched(struct gk20a *g, struct nvgpu_mem *mem,
        }
 }
+static void nvgpu_pramin_access_batch_rd_n(struct gk20a *g,
+                                           u32 start, u32 words, u32 **arg)
+{
+        u32 r = start, *dest_u32 = *arg;
+        while (words--) {
+                *dest_u32++ = nvgpu_readl(g, r);
+                r += sizeof(u32);
+        }
+        *arg = dest_u32;
+}
+void nvgpu_pramin_rd_n(struct gk20a *g, struct nvgpu_mem *mem,
+                                           u32 start, u32 size, void *dest)
+{
+        u32 *dest_u32 = dest;
+        return nvgpu_pramin_access_batched(g, mem, start, size,
+                        nvgpu_pramin_access_batch_rd_n, &dest_u32);
+}
+static void nvgpu_pramin_access_batch_wr_n(struct gk20a *g,
+                                           u32 start, u32 words, u32 **arg)
+{
+        u32 r = start, *src_u32 = *arg;
+        while (words--) {
+                nvgpu_writel_relaxed(g, r, *src_u32++);
+                r += sizeof(u32);
+        }
+        *arg = src_u32;
+}
+void nvgpu_pramin_wr_n(struct gk20a *g, struct nvgpu_mem *mem,
+                                           u32 start, u32 size, void *src)
+{
+        u32 *src_u32 = src;
+        return nvgpu_pramin_access_batched(g, mem, start, size,
+                        nvgpu_pramin_access_batch_wr_n, &src_u32);
+}
+static void nvgpu_pramin_access_batch_set(struct gk20a *g,
+                                          u32 start, u32 words, u32 **arg)
+{
+        u32 r = start, repeat = **arg;
+        while (words--) {
+                nvgpu_writel_relaxed(g, r, repeat);
+                r += sizeof(u32);
+        }
+}
+void nvgpu_pramin_memset(struct gk20a *g, struct nvgpu_mem *mem,
+                         u32 start, u32 size, u32 w)
+{
+        u32 *p = &w;
+        return nvgpu_pramin_access_batched(g, mem, start, size,
+                        nvgpu_pramin_access_batch_set, &p);
+}
 void nvgpu_init_pramin(struct mm_gk20a *mm)
 {
        mm->pramin_window = 0;
diff --git a/drivers/gpu/nvgpu/include/nvgpu/io.h b/drivers/gpu/nvgpu/include/nvgpu/io.h
index 28011e04..8504829c 100644
--- a/drivers/gpu/nvgpu/include/nvgpu/io.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/io.h
@@ -36,6 +36,7 @@
 struct gk20a;
 void nvgpu_writel(struct gk20a *g, u32 r, u32 v);
+void nvgpu_writel_relaxed(struct gk20a *g, u32 r, u32 v);
 u32 nvgpu_readl(struct gk20a *g, u32 r);
 u32 __nvgpu_readl(struct gk20a *g, u32 r);
 void nvgpu_writel_check(struct gk20a *g, u32 r, u32 v);
diff --git a/drivers/gpu/nvgpu/include/nvgpu/pramin.h b/drivers/gpu/nvgpu/include/nvgpu/pramin.h
index 33702bc8..c9f54a6f 100644
--- a/drivers/gpu/nvgpu/include/nvgpu/pramin.h
+++ b/drivers/gpu/nvgpu/include/nvgpu/pramin.h
@@ -29,16 +29,10 @@ struct gk20a;
 struct mm_gk20a;
 struct nvgpu_mem;
-/*
- * This typedef is for functions that get called during the access_batched()
- * operation.
- */
-typedef void (*pramin_access_batch_fn)(struct gk20a *g, u32 start, u32 words,
-                                       u32 **arg);
-void nvgpu_pramin_access_batched(struct gk20a *g, struct nvgpu_mem *mem,
+void nvgpu_pramin_rd_n(struct gk20a *g, struct nvgpu_mem *mem, u32 start, u32 words, void *dest);
-                                 u32 offset, u32 size,
+void nvgpu_pramin_wr_n(struct gk20a *g, struct nvgpu_mem *mem, u32 start, u32 words, void *src);
-                                 pramin_access_batch_fn loop, u32 **arg);
+void nvgpu_pramin_memset(struct gk20a *g, struct nvgpu_mem *mem, u32 start, u32 words, u32 w);
 void nvgpu_init_pramin(struct mm_gk20a *mm);
diff --git a/drivers/gpu/nvgpu/os/linux/io.c b/drivers/gpu/nvgpu/os/linux/io.c
index c06512a5..9a0e29d7 100644
--- a/drivers/gpu/nvgpu/os/linux/io.c
+++ b/drivers/gpu/nvgpu/os/linux/io.c
@@ -31,6 +31,18 @@ void nvgpu_writel(struct gk20a *g, u32 r, u32 v)
        }
 }
+void nvgpu_writel_relaxed(struct gk20a *g, u32 r, u32 v)
+{
+        struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
+        if (unlikely(!l->regs)) {
+                __gk20a_warn_on_no_regs();
+                nvgpu_log(g, gpu_dbg_reg, "r=0x%x v=0x%x (failed)", r, v);
+        } else {
+                writel_relaxed(v, l->regs + r);
+        }
+}
 u32 nvgpu_readl(struct gk20a *g, u32 r)
 {
        u32 v = __nvgpu_readl(g, r);
diff --git a/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c b/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c
index 04b2afa7..aa8fcd84 100644
--- a/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c
+++ b/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c
@@ -48,207 +48,6 @@ static u64 __nvgpu_sgl_phys(struct gk20a *g, struct nvgpu_sgl *sgl)
        return ipa;
 }
-static void pramin_access_batch_rd_n(struct gk20a *g, u32 start, u32 words, u32 **arg)
-{
-        struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
-        u32 r = start, *dest_u32 = *arg;
-        if (!l->regs) {
-                __gk20a_warn_on_no_regs();
-                return;
-        }
-        while (words--) {
-                *dest_u32++ = gk20a_readl(g, r);
-                r += sizeof(u32);
-        }
-        *arg = dest_u32;
-}
-u32 nvgpu_mem_rd32(struct gk20a *g, struct nvgpu_mem *mem, u32 w)
-{
-        u32 data = 0;
-        if (mem->aperture == APERTURE_SYSMEM) {
-                u32 *ptr = mem->cpu_va;
-                WARN_ON(!ptr);
-                data = ptr[w];
-#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
-                nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x", ptr + w, data);
-#endif
-        } else if (mem->aperture == APERTURE_VIDMEM) {
-                u32 value;
-                u32 *p = &value;
-                nvgpu_pramin_access_batched(g, mem, w * sizeof(u32),
-                                sizeof(u32), pramin_access_batch_rd_n, &p);
-                data = value;
-        } else {
-                WARN_ON("Accessing unallocated nvgpu_mem");
-        }
-        return data;
-}
-u32 nvgpu_mem_rd(struct gk20a *g, struct nvgpu_mem *mem, u32 offset)
-{
-        WARN_ON(offset & 3);
-        return nvgpu_mem_rd32(g, mem, offset / sizeof(u32));
-}
-void nvgpu_mem_rd_n(struct gk20a *g, struct nvgpu_mem *mem,
-                u32 offset, void *dest, u32 size)
-{
-        WARN_ON(offset & 3);
-        WARN_ON(size & 3);
-        if (mem->aperture == APERTURE_SYSMEM) {
-                u8 *src = (u8 *)mem->cpu_va + offset;
-                WARN_ON(!mem->cpu_va);
-                memcpy(dest, src, size);
-#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
-                if (size)
-                        nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x ... [%d bytes]",
-                                        src, *dest, size);
-#endif
-        } else if (mem->aperture == APERTURE_VIDMEM) {
-                u32 *dest_u32 = dest;
-                nvgpu_pramin_access_batched(g, mem, offset, size,
-                                pramin_access_batch_rd_n, &dest_u32);
-        } else {
-                WARN_ON("Accessing unallocated nvgpu_mem");
-        }
-}
-static void pramin_access_batch_wr_n(struct gk20a *g, u32 start, u32 words, u32 **arg)
-{
-        struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
-        u32 r = start, *src_u32 = *arg;
-        if (!l->regs) {
-                __gk20a_warn_on_no_regs();
-                return;
-        }
-        while (words--) {
-                writel_relaxed(*src_u32++, l->regs + r);
-                r += sizeof(u32);
-        }
-        *arg = src_u32;
-}
-void nvgpu_mem_wr32(struct gk20a *g, struct nvgpu_mem *mem, u32 w, u32 data)
-{
-        if (mem->aperture == APERTURE_SYSMEM) {
-                u32 *ptr = mem->cpu_va;
-                WARN_ON(!ptr);
-#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
-                nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x", ptr + w, data);
-#endif
-                ptr[w] = data;
-        } else if (mem->aperture == APERTURE_VIDMEM) {
-                u32 value = data;
-                u32 *p = &value;
-                nvgpu_pramin_access_batched(g, mem, w * sizeof(u32),
-                                sizeof(u32), pramin_access_batch_wr_n, &p);
-                if (!mem->skip_wmb)
-                        wmb();
-        } else {
-                WARN_ON("Accessing unallocated nvgpu_mem");
-        }
-}
-void nvgpu_mem_wr(struct gk20a *g, struct nvgpu_mem *mem, u32 offset, u32 data)
-{
-        WARN_ON(offset & 3);
-        nvgpu_mem_wr32(g, mem, offset / sizeof(u32), data);
-}
-void nvgpu_mem_wr_n(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
-                void *src, u32 size)
-{
-        WARN_ON(offset & 3);
-        WARN_ON(size & 3);
-        if (mem->aperture == APERTURE_SYSMEM) {
-                u8 *dest = (u8 *)mem->cpu_va + offset;
-                WARN_ON(!mem->cpu_va);
-#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
-                if (size)
-                        nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x ... [%d bytes]",
-                                        dest, *src, size);
-#endif
-                memcpy(dest, src, size);
-        } else if (mem->aperture == APERTURE_VIDMEM) {
-                u32 *src_u32 = src;
-                nvgpu_pramin_access_batched(g, mem, offset, size,
-                                pramin_access_batch_wr_n, &src_u32);
-                if (!mem->skip_wmb)
-                        wmb();
-        } else {
-                WARN_ON("Accessing unallocated nvgpu_mem");
-        }
-}
-static void pramin_access_batch_set(struct gk20a *g, u32 start, u32 words, u32 **arg)
-{
-        struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
-        u32 r = start, repeat = **arg;
-        if (!l->regs) {
-                __gk20a_warn_on_no_regs();
-                return;
-        }
-        while (words--) {
-                writel_relaxed(repeat, l->regs + r);
-                r += sizeof(u32);
-        }
-}
-void nvgpu_memset(struct gk20a *g, struct nvgpu_mem *mem, u32 offset,
-                u32 c, u32 size)
-{
-        WARN_ON(offset & 3);
-        WARN_ON(size & 3);
-        WARN_ON(c & ~0xff);
-        c &= 0xff;
-        if (mem->aperture == APERTURE_SYSMEM) {
-                u8 *dest = (u8 *)mem->cpu_va + offset;
-                WARN_ON(!mem->cpu_va);
-#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
-                if (size)
-                        nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x [times %d]",
-                                dest, c, size);
-#endif
-                memset(dest, c, size);
-        } else if (mem->aperture == APERTURE_VIDMEM) {
-                u32 repeat_value = c | (c << 8) | (c << 16) | (c << 24);
-                u32 *p = &repeat_value;
-                nvgpu_pramin_access_batched(g, mem, offset, size,
-                                pramin_access_batch_set, &p);
-                if (!mem->skip_wmb)
-                        wmb();
-        } else {
-                WARN_ON("Accessing unallocated nvgpu_mem");
-        }
-}
 /*
 * Obtain a SYSMEM address from a Linux SGL. This should eventually go away
 * and/or become private to this file once all bad usages of Linux SGLs are
author	Terje Bergstrom <tbergstrom@nvidia.com>	2018-06-15 12:25:01 -0400
committer	mobile promotions <svcmobile_promotions@nvidia.com>	2018-07-02 13:19:19 -0400
commit	6ea52c59b0262556edb01835eaf91b3bfcdcdd71 (patch)
tree	15fcd2bf17b28cea51384a7f8b0b2044f449ecae
parent	cf2ac655fdaeba5779ce9d73cbe567218a7c5a58 (diff)

diff --git a/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c b/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c index 855d455d..9f3b6cfa 100644 --- a/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c +++ b/drivers/gpu/nvgpu/common/mm/nvgpu_mem.c
@@ -177,3 +177,112 @@ u64 nvgpu_sgt_alignment(struct gk20a g, struct nvgpu_sgt sgt)
177		177
178	return align;	178	return align;
179	}	179	}
		180
		181	u32 nvgpu_mem_rd32(struct gk20a g, struct nvgpu_mem mem, u32 w)
		182	{
		183	u32 data = 0;
		184
		185	if (mem->aperture == APERTURE_SYSMEM) {
		186	u32 *ptr = mem->cpu_va;
		187
		188	WARN_ON(!ptr);
		189	data = ptr[w];
		190	} else if (mem->aperture == APERTURE_VIDMEM) {
		191	nvgpu_pramin_rd_n(g, mem, w * sizeof(u32), sizeof(u32), &data);
		192	} else {
		193	WARN_ON("Accessing unallocated nvgpu_mem");
		194	}
		195
		196	return data;
		197	}
		198
		199	u32 nvgpu_mem_rd(struct gk20a g, struct nvgpu_mem mem, u32 offset)
		200	{
		201	WARN_ON(offset & 3);
		202	return nvgpu_mem_rd32(g, mem, offset / sizeof(u32));
		203	}
		204
		205	void nvgpu_mem_rd_n(struct gk20a g, struct nvgpu_mem mem,
		206	u32 offset, void *dest, u32 size)
		207	{
		208	WARN_ON(offset & 3);
		209	WARN_ON(size & 3);
		210
		211	if (mem->aperture == APERTURE_SYSMEM) {
		212	u8 src = (u8 )mem->cpu_va + offset;
		213
		214	WARN_ON(!mem->cpu_va);
		215	memcpy(dest, src, size);
		216	} else if (mem->aperture == APERTURE_VIDMEM) {
		217	nvgpu_pramin_rd_n(g, mem, offset, size, dest);
		218	} else {
		219	WARN_ON("Accessing unallocated nvgpu_mem");
		220	}
		221	}
		222
		223	void nvgpu_mem_wr32(struct gk20a g, struct nvgpu_mem mem, u32 w, u32 data)
		224	{
		225	if (mem->aperture == APERTURE_SYSMEM) {
		226	u32 *ptr = mem->cpu_va;
		227
		228	WARN_ON(!ptr);
		229	ptr[w] = data;
		230	} else if (mem->aperture == APERTURE_VIDMEM) {
		231	nvgpu_pramin_wr_n(g, mem, w * sizeof(u32), sizeof(u32), &data);
		232	if (!mem->skip_wmb)
		233	nvgpu_wmb();
		234	} else {
		235	WARN_ON("Accessing unallocated nvgpu_mem");
		236	}
		237	}
		238
		239	void nvgpu_mem_wr(struct gk20a g, struct nvgpu_mem mem, u32 offset, u32 data)
		240	{
		241	WARN_ON(offset & 3);
		242	nvgpu_mem_wr32(g, mem, offset / sizeof(u32), data);
		243	}
		244
		245	void nvgpu_mem_wr_n(struct gk20a g, struct nvgpu_mem mem, u32 offset,
		246	void *src, u32 size)
		247	{
		248	WARN_ON(offset & 3);
		249	WARN_ON(size & 3);
		250
		251	if (mem->aperture == APERTURE_SYSMEM) {
		252	u8 dest = (u8 )mem->cpu_va + offset;
		253
		254	WARN_ON(!mem->cpu_va);
		255	memcpy(dest, src, size);
		256	} else if (mem->aperture == APERTURE_VIDMEM) {
		257	nvgpu_pramin_wr_n(g, mem, offset, size, src);
		258	if (!mem->skip_wmb)
		259	nvgpu_wmb();
		260	} else {
		261	WARN_ON("Accessing unallocated nvgpu_mem");
		262	}
		263	}
		264
		265	void nvgpu_memset(struct gk20a g, struct nvgpu_mem mem, u32 offset,
		266	u32 c, u32 size)
		267	{
		268	WARN_ON(offset & 3);
		269	WARN_ON(size & 3);
		270	WARN_ON(c & ~0xff);
		271
		272	c &= 0xff;
		273
		274	if (mem->aperture == APERTURE_SYSMEM) {
		275	u8 dest = (u8 )mem->cpu_va + offset;
		276
		277	WARN_ON(!mem->cpu_va);
		278	memset(dest, c, size);
		279	} else if (mem->aperture == APERTURE_VIDMEM) {
		280	u32 repeat_value = c \| (c << 8) \| (c << 16) \| (c << 24);
		281
		282	nvgpu_pramin_memset(g, mem, offset, size, repeat_value);
		283	if (!mem->skip_wmb)
		284	nvgpu_wmb();
		285	} else {
		286	WARN_ON("Accessing unallocated nvgpu_mem");
		287	}
		288	}


diff --git a/drivers/gpu/nvgpu/common/posix/io.c b/drivers/gpu/nvgpu/common/posix/io.c index ce018940..dc32c20e 100644 --- a/drivers/gpu/nvgpu/common/posix/io.c +++ b/drivers/gpu/nvgpu/common/posix/io.c
@@ -35,6 +35,11 @@ void nvgpu_writel(struct gk20a *g, u32 r, u32 v)
35	BUG();	35	BUG();
36	}	36	}
37		37
		38	void nvgpu_writel_relaxed(struct gk20a *g, u32 r, u32 v)
		39	{
		40	BUG();
		41	}
		42
38	u32 nvgpu_readl(struct gk20a *g, u32 r)	43	u32 nvgpu_readl(struct gk20a *g, u32 r)
39	{	44	{
40	BUG();	45	BUG();


diff --git a/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c b/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c index 7f3bf9f1..fa92a7c6 100644 --- a/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c +++ b/drivers/gpu/nvgpu/common/posix/posix-nvgpu_mem.c
@@ -27,65 +27,6 @@
27	#include <nvgpu/nvgpu_mem.h>	27	#include <nvgpu/nvgpu_mem.h>
28		28
29	/*	29	/*
30	* DMA memory buffers - obviously we don't really have DMA in userspace but we
31	* can emulate a lot of the DMA mem functionality for unit testing purposes.
32	*/
33
34	u32 nvgpu_mem_rd32(struct gk20a g, struct nvgpu_mem mem, u32 w)
35	{
36	u32 mem_ptr = (u32 )mem->cpu_va;
37
38	return mem_ptr[w];
39	}
40
41	u32 nvgpu_mem_rd(struct gk20a g, struct nvgpu_mem mem, u32 offset)
42	{
43	if (offset & 0x3)
44	BUG();
45
46	return nvgpu_mem_rd32(g, mem, offset >> 2);
47	}
48
49	void nvgpu_mem_rd_n(struct gk20a g, struct nvgpu_mem mem, u32 offset,
50	void *dest, u32 size)
51	{
52	if (offset & 0x3 \|\| size & 0x3)
53	BUG();
54
55	memcpy(dest, ((char *)mem->cpu_va) + offset, size);
56	}
57
58	void nvgpu_mem_wr32(struct gk20a g, struct nvgpu_mem mem, u32 w, u32 data)
59	{
60	u32 mem_ptr = (u32 )mem->cpu_va;
61
62	mem_ptr[w] = data;
63	}
64
65	void nvgpu_mem_wr(struct gk20a g, struct nvgpu_mem mem, u32 offset, u32 data)
66	{
67	if (offset & 0x3)
68	BUG();
69
70	nvgpu_mem_wr32(g, mem, offset >> 2, data);
71	}
72
73	void nvgpu_mem_wr_n(struct gk20a g, struct nvgpu_mem mem, u32 offset,
74	void *src, u32 size)
75	{
76	if (offset & 0x3 \|\| size & 0x3)
77	BUG();
78
79	memcpy(((char *)mem->cpu_va) + offset, src, size);
80	}
81
82	void nvgpu_memset(struct gk20a g, struct nvgpu_mem mem, u32 offset,
83	u32 c, u32 size)
84	{
85	memset(((char *)mem->cpu_va) + offset, c, size);
86	}
87
88	/*
89	* These functions are somewhat meaningless.	30	* These functions are somewhat meaningless.
90	*/	31	*/
91	u64 nvgpu_mem_get_addr(struct gk20a g, struct nvgpu_mem mem)	32	u64 nvgpu_mem_get_addr(struct gk20a g, struct nvgpu_mem mem)


diff --git a/drivers/gpu/nvgpu/common/pramin.c b/drivers/gpu/nvgpu/common/pramin.c index 4c6a4a0d..99d588aa 100644 --- a/drivers/gpu/nvgpu/common/pramin.c +++ b/drivers/gpu/nvgpu/common/pramin.c
@@ -28,11 +28,18 @@
28	#include "gk20a/gk20a.h"	28	#include "gk20a/gk20a.h"
29		29
30	/*	30	/*
		31	* This typedef is for functions that get called during the access_batched()
		32	* operation.
		33	*/
		34	typedef void (pramin_access_batch_fn)(struct gk20a g, u32 start, u32 words,
		35	u32 **arg);
		36
		37	/*
31	* The PRAMIN range is 1 MB, must change base addr if a buffer crosses that.	38	* The PRAMIN range is 1 MB, must change base addr if a buffer crosses that.
32	* This same loop is used for read/write/memset. Offset and size in bytes.	39	* This same loop is used for read/write/memset. Offset and size in bytes.
33	* One call to "loop" is done per range, with "arg" supplied.	40	* One call to "loop" is done per range, with "arg" supplied.
34	*/	41	*/
35	void nvgpu_pramin_access_batched(struct gk20a g, struct nvgpu_mem mem,	42	static void nvgpu_pramin_access_batched(struct gk20a g, struct nvgpu_mem mem,
36	u32 offset, u32 size, pramin_access_batch_fn loop, u32 **arg)	43	u32 offset, u32 size, pramin_access_batch_fn loop, u32 **arg)
37	{	44	{
38	struct nvgpu_page_alloc *alloc = NULL;	45	struct nvgpu_page_alloc *alloc = NULL;
@@ -87,6 +94,69 @@ void nvgpu_pramin_access_batched(struct gk20a g, struct nvgpu_mem mem,
87	}	94	}
88	}	95	}
89		96
		97	static void nvgpu_pramin_access_batch_rd_n(struct gk20a *g,
		98	u32 start, u32 words, u32 **arg)
		99	{
		100	u32 r = start, dest_u32 = arg;
		101
		102	while (words--) {
		103	*dest_u32++ = nvgpu_readl(g, r);
		104	r += sizeof(u32);
		105	}
		106
		107	*arg = dest_u32;
		108	}
		109
		110	void nvgpu_pramin_rd_n(struct gk20a g, struct nvgpu_mem mem,
		111	u32 start, u32 size, void *dest)
		112	{
		113	u32 *dest_u32 = dest;
		114
		115	return nvgpu_pramin_access_batched(g, mem, start, size,
		116	nvgpu_pramin_access_batch_rd_n, &dest_u32);
		117	}
		118
		119	static void nvgpu_pramin_access_batch_wr_n(struct gk20a *g,
		120	u32 start, u32 words, u32 **arg)
		121	{
		122	u32 r = start, src_u32 = arg;
		123
		124	while (words--) {
		125	nvgpu_writel_relaxed(g, r, *src_u32++);
		126	r += sizeof(u32);
		127	}
		128
		129	*arg = src_u32;
		130	}
		131
		132	void nvgpu_pramin_wr_n(struct gk20a g, struct nvgpu_mem mem,
		133	u32 start, u32 size, void *src)
		134	{
		135	u32 *src_u32 = src;
		136
		137	return nvgpu_pramin_access_batched(g, mem, start, size,
		138	nvgpu_pramin_access_batch_wr_n, &src_u32);
		139	}
		140
		141	static void nvgpu_pramin_access_batch_set(struct gk20a *g,
		142	u32 start, u32 words, u32 **arg)
		143	{
		144	u32 r = start, repeat = **arg;
		145
		146	while (words--) {
		147	nvgpu_writel_relaxed(g, r, repeat);
		148	r += sizeof(u32);
		149	}
		150	}
		151
		152	void nvgpu_pramin_memset(struct gk20a g, struct nvgpu_mem mem,
		153	u32 start, u32 size, u32 w)
		154	{
		155	u32 *p = &w;
		156
		157	return nvgpu_pramin_access_batched(g, mem, start, size,
		158	nvgpu_pramin_access_batch_set, &p);
		159	}
90	void nvgpu_init_pramin(struct mm_gk20a *mm)	160	void nvgpu_init_pramin(struct mm_gk20a *mm)
91	{	161	{
92	mm->pramin_window = 0;	162	mm->pramin_window = 0;


diff --git a/drivers/gpu/nvgpu/include/nvgpu/io.h b/drivers/gpu/nvgpu/include/nvgpu/io.h index 28011e04..8504829c 100644 --- a/drivers/gpu/nvgpu/include/nvgpu/io.h +++ b/drivers/gpu/nvgpu/include/nvgpu/io.h
@@ -36,6 +36,7 @@
36	struct gk20a;	36	struct gk20a;
37		37
38	void nvgpu_writel(struct gk20a *g, u32 r, u32 v);	38	void nvgpu_writel(struct gk20a *g, u32 r, u32 v);
		39	void nvgpu_writel_relaxed(struct gk20a *g, u32 r, u32 v);
39	u32 nvgpu_readl(struct gk20a *g, u32 r);	40	u32 nvgpu_readl(struct gk20a *g, u32 r);
40	u32 __nvgpu_readl(struct gk20a *g, u32 r);	41	u32 __nvgpu_readl(struct gk20a *g, u32 r);
41	void nvgpu_writel_check(struct gk20a *g, u32 r, u32 v);	42	void nvgpu_writel_check(struct gk20a *g, u32 r, u32 v);


diff --git a/drivers/gpu/nvgpu/include/nvgpu/pramin.h b/drivers/gpu/nvgpu/include/nvgpu/pramin.h index 33702bc8..c9f54a6f 100644 --- a/drivers/gpu/nvgpu/include/nvgpu/pramin.h +++ b/drivers/gpu/nvgpu/include/nvgpu/pramin.h
@@ -29,16 +29,10 @@ struct gk20a;
29	struct mm_gk20a;	29	struct mm_gk20a;
30	struct nvgpu_mem;	30	struct nvgpu_mem;
31		31
32	/*
33	* This typedef is for functions that get called during the access_batched()
34	* operation.
35	*/
36	typedef void (pramin_access_batch_fn)(struct gk20a g, u32 start, u32 words,
37	u32 **arg);
38		32
39	void nvgpu_pramin_access_batched(struct gk20a g, struct nvgpu_mem mem,	33	void nvgpu_pramin_rd_n(struct gk20a g, struct nvgpu_mem mem, u32 start, u32 words, void *dest);
40	u32 offset, u32 size,	34	void nvgpu_pramin_wr_n(struct gk20a g, struct nvgpu_mem mem, u32 start, u32 words, void *src);
41	pramin_access_batch_fn loop, u32 **arg);	35	void nvgpu_pramin_memset(struct gk20a g, struct nvgpu_mem mem, u32 start, u32 words, u32 w);
42		36
43	void nvgpu_init_pramin(struct mm_gk20a *mm);	37	void nvgpu_init_pramin(struct mm_gk20a *mm);
44		38


diff --git a/drivers/gpu/nvgpu/os/linux/io.c b/drivers/gpu/nvgpu/os/linux/io.c index c06512a5..9a0e29d7 100644 --- a/drivers/gpu/nvgpu/os/linux/io.c +++ b/drivers/gpu/nvgpu/os/linux/io.c
@@ -31,6 +31,18 @@ void nvgpu_writel(struct gk20a *g, u32 r, u32 v)
31	}	31	}
32	}	32	}
33		33
		34	void nvgpu_writel_relaxed(struct gk20a *g, u32 r, u32 v)
		35	{
		36	struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
		37
		38	if (unlikely(!l->regs)) {
		39	__gk20a_warn_on_no_regs();
		40	nvgpu_log(g, gpu_dbg_reg, "r=0x%x v=0x%x (failed)", r, v);
		41	} else {
		42	writel_relaxed(v, l->regs + r);
		43	}
		44	}
		45
34	u32 nvgpu_readl(struct gk20a *g, u32 r)	46	u32 nvgpu_readl(struct gk20a *g, u32 r)
35	{	47	{
36	u32 v = __nvgpu_readl(g, r);	48	u32 v = __nvgpu_readl(g, r);


diff --git a/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c b/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c index 04b2afa7..aa8fcd84 100644 --- a/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c +++ b/drivers/gpu/nvgpu/os/linux/nvgpu_mem.c
@@ -48,207 +48,6 @@ static u64 __nvgpu_sgl_phys(struct gk20a g, struct nvgpu_sgl sgl)
48	return ipa;	48	return ipa;
49	}	49	}
50		50
51	static void pramin_access_batch_rd_n(struct gk20a g, u32 start, u32 words, u32 *arg)
52	{
53	struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
54	u32 r = start, dest_u32 = arg;
55
56	if (!l->regs) {
57	__gk20a_warn_on_no_regs();
58	return;
59	}
60
61	while (words--) {
62	*dest_u32++ = gk20a_readl(g, r);
63	r += sizeof(u32);
64	}
65
66	*arg = dest_u32;
67	}
68
69	u32 nvgpu_mem_rd32(struct gk20a g, struct nvgpu_mem mem, u32 w)
70	{
71	u32 data = 0;
72
73	if (mem->aperture == APERTURE_SYSMEM) {
74	u32 *ptr = mem->cpu_va;
75
76	WARN_ON(!ptr);
77	data = ptr[w];
78	#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
79	nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x", ptr + w, data);
80	#endif
81	} else if (mem->aperture == APERTURE_VIDMEM) {
82	u32 value;
83	u32 *p = &value;
84
85	nvgpu_pramin_access_batched(g, mem, w * sizeof(u32),
86	sizeof(u32), pramin_access_batch_rd_n, &p);
87
88	data = value;
89
90	} else {
91	WARN_ON("Accessing unallocated nvgpu_mem");
92	}
93
94	return data;
95	}
96
97	u32 nvgpu_mem_rd(struct gk20a g, struct nvgpu_mem mem, u32 offset)
98	{
99	WARN_ON(offset & 3);
100	return nvgpu_mem_rd32(g, mem, offset / sizeof(u32));
101	}
102
103	void nvgpu_mem_rd_n(struct gk20a g, struct nvgpu_mem mem,
104	u32 offset, void *dest, u32 size)
105	{
106	WARN_ON(offset & 3);
107	WARN_ON(size & 3);
108
109	if (mem->aperture == APERTURE_SYSMEM) {
110	u8 src = (u8 )mem->cpu_va + offset;
111
112	WARN_ON(!mem->cpu_va);
113	memcpy(dest, src, size);
114	#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
115	if (size)
116	nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x ... [%d bytes]",
117	src, *dest, size);
118	#endif
119	} else if (mem->aperture == APERTURE_VIDMEM) {
120	u32 *dest_u32 = dest;
121
122	nvgpu_pramin_access_batched(g, mem, offset, size,
123	pramin_access_batch_rd_n, &dest_u32);
124	} else {
125	WARN_ON("Accessing unallocated nvgpu_mem");
126	}
127	}
128
129	static void pramin_access_batch_wr_n(struct gk20a g, u32 start, u32 words, u32 *arg)
130	{
131	struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
132	u32 r = start, src_u32 = arg;
133
134	if (!l->regs) {
135	__gk20a_warn_on_no_regs();
136	return;
137	}
138
139	while (words--) {
140	writel_relaxed(*src_u32++, l->regs + r);
141	r += sizeof(u32);
142	}
143
144	*arg = src_u32;
145	}
146
147	void nvgpu_mem_wr32(struct gk20a g, struct nvgpu_mem mem, u32 w, u32 data)
148	{
149	if (mem->aperture == APERTURE_SYSMEM) {
150	u32 *ptr = mem->cpu_va;
151
152	WARN_ON(!ptr);
153	#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
154	nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x", ptr + w, data);
155	#endif
156	ptr[w] = data;
157	} else if (mem->aperture == APERTURE_VIDMEM) {
158	u32 value = data;
159	u32 *p = &value;
160
161	nvgpu_pramin_access_batched(g, mem, w * sizeof(u32),
162	sizeof(u32), pramin_access_batch_wr_n, &p);
163	if (!mem->skip_wmb)
164	wmb();
165	} else {
166	WARN_ON("Accessing unallocated nvgpu_mem");
167	}
168	}
169
170	void nvgpu_mem_wr(struct gk20a g, struct nvgpu_mem mem, u32 offset, u32 data)
171	{
172	WARN_ON(offset & 3);
173	nvgpu_mem_wr32(g, mem, offset / sizeof(u32), data);
174	}
175
176	void nvgpu_mem_wr_n(struct gk20a g, struct nvgpu_mem mem, u32 offset,
177	void *src, u32 size)
178	{
179	WARN_ON(offset & 3);
180	WARN_ON(size & 3);
181
182	if (mem->aperture == APERTURE_SYSMEM) {
183	u8 dest = (u8 )mem->cpu_va + offset;
184
185	WARN_ON(!mem->cpu_va);
186	#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
187	if (size)
188	nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x ... [%d bytes]",
189	dest, *src, size);
190	#endif
191	memcpy(dest, src, size);
192	} else if (mem->aperture == APERTURE_VIDMEM) {
193	u32 *src_u32 = src;
194
195	nvgpu_pramin_access_batched(g, mem, offset, size,
196	pramin_access_batch_wr_n, &src_u32);
197	if (!mem->skip_wmb)
198	wmb();
199	} else {
200	WARN_ON("Accessing unallocated nvgpu_mem");
201	}
202	}
203
204	static void pramin_access_batch_set(struct gk20a g, u32 start, u32 words, u32 *arg)
205	{
206	struct nvgpu_os_linux *l = nvgpu_os_linux_from_gk20a(g);
207	u32 r = start, repeat = **arg;
208
209	if (!l->regs) {
210	__gk20a_warn_on_no_regs();
211	return;
212	}
213
214	while (words--) {
215	writel_relaxed(repeat, l->regs + r);
216	r += sizeof(u32);
217	}
218	}
219
220	void nvgpu_memset(struct gk20a g, struct nvgpu_mem mem, u32 offset,
221	u32 c, u32 size)
222	{
223	WARN_ON(offset & 3);
224	WARN_ON(size & 3);
225	WARN_ON(c & ~0xff);
226
227	c &= 0xff;
228
229	if (mem->aperture == APERTURE_SYSMEM) {
230	u8 dest = (u8 )mem->cpu_va + offset;
231
232	WARN_ON(!mem->cpu_va);
233	#ifdef CONFIG_TEGRA_SIMULATION_PLATFORM
234	if (size)
235	nvgpu_log(g, gpu_dbg_mem, " %p = 0x%x [times %d]",
236	dest, c, size);
237	#endif
238	memset(dest, c, size);
239	} else if (mem->aperture == APERTURE_VIDMEM) {
240	u32 repeat_value = c \| (c << 8) \| (c << 16) \| (c << 24);
241	u32 *p = &repeat_value;
242
243	nvgpu_pramin_access_batched(g, mem, offset, size,
244	pramin_access_batch_set, &p);
245	if (!mem->skip_wmb)
246	wmb();
247	} else {
248	WARN_ON("Accessing unallocated nvgpu_mem");
249	}
250	}
251
252	/*	51	/*
253	* Obtain a SYSMEM address from a Linux SGL. This should eventually go away	52	* Obtain a SYSMEM address from a Linux SGL. This should eventually go away
254	* and/or become private to this file once all bad usages of Linux SGLs are	53	* and/or become private to this file once all bad usages of Linux SGLs are