gpu: nvgpu: use nvgpu rbtree to store mapped buffers

Use nvgpu rbtree instead of linux rbtree to store mapped buffers for each VM Move to use "struct nvgpu_rbtree_node" instead of "struct rb_node" And similarly use rbtree APIs from <nvgpu/rbtree.h> instead of linux APIs Jira NVGPU-13 Change-Id: Id96ba76e20fa9ecad016cd5d5a6a7d40579a70f2 Signed-off-by: Deepak Nibade <dnibade@nvidia.com> Reviewed-on: http://git-master/r/1453043 Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com> Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
author: Deepak Nibade <dnibade@nvidia.com> 2017-03-31 02:46:33 -0400
committer: mobile promotions <svcmobile_promotions@nvidia.com> 2017-04-06 13:57:28 -0400
commit: ce3c30f14f1eed9ace2028b48c7e8f6cdd6b65cb (patch)
tree: f4fcc21aeccd99aa56d19ca67fdbee38dc4e311a /drivers
parent: 6dda47a114d1ecbef4f5fa77e8100d795ee23ff1 (diff)
3 files changed, 81 insertions, 99 deletions
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
index 461cf324..2fe76d80 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -311,10 +311,10 @@ static inline u32 lo32(u64 f)
 }
 static struct mapped_buffer_node *find_mapped_buffer_locked(
-                                        struct rb_root *root, u64 addr);
+                                struct nvgpu_rbtree_node *root, u64 addr);
 static struct mapped_buffer_node *find_mapped_buffer_reverse_locked(
-                                struct rb_root *root, struct dma_buf *dmabuf,
+                        struct nvgpu_rbtree_node *root, struct dma_buf *dmabuf,
-                                u32 kind);
+                        u32 kind);
 static int update_gmmu_ptes_locked(struct vm_gk20a *vm,
                                   enum gmmu_pgsz_gk20a pgsz_idx,
                                   struct sg_table *sgt, u64 buffer_offset,
@@ -1289,7 +1289,7 @@ int gk20a_vm_get_buffers(struct vm_gk20a *vm,
 {
        struct mapped_buffer_node *mapped_buffer;
        struct mapped_buffer_node **buffer_list;
-        struct rb_node *node;
+        struct nvgpu_rbtree_node *node = NULL;
        int i = 0;
        if (vm->userspace_managed) {
@@ -1307,16 +1307,15 @@ int gk20a_vm_get_buffers(struct vm_gk20a *vm,
                return -ENOMEM;
        }
-        node = rb_first(&vm->mapped_buffers);
+        nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
        while (node) {
-                mapped_buffer =
+                mapped_buffer = mapped_buffer_from_rbtree_node(node);
-                        container_of(node, struct mapped_buffer_node, node);
                if (mapped_buffer->user_mapped) {
                        buffer_list[i] = mapped_buffer;
                        kref_get(&mapped_buffer->ref);
                        i++;
                }
-                node = rb_next(&mapped_buffer->node);
+                nvgpu_rbtree_enum_next(&node, node);
        }
        BUG_ON(i != vm->num_user_mapped_buffers);
@@ -1396,7 +1395,7 @@ static void gk20a_vm_unmap_user(struct vm_gk20a *vm, u64 offset,
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
-        mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers, offset);
+        mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers, offset);
        if (!mapped_buffer) {
                nvgpu_mutex_release(&vm->update_gmmu_lock);
                gk20a_err(d, "invalid addr to unmap 0x%llx", offset);
@@ -1488,104 +1487,81 @@ int gk20a_vm_free_va(struct vm_gk20a *vm,
        return 0;
 }
-static int insert_mapped_buffer(struct rb_root *root,
+static void remove_mapped_buffer(struct vm_gk20a *vm,
                                struct mapped_buffer_node *mapped_buffer)
 {
-        struct rb_node **new_node = &(root->rb_node), *parent = NULL;
+        nvgpu_rbtree_unlink(&mapped_buffer->node, &vm->mapped_buffers);
+}
-        /* Figure out where to put new node */
-        while (*new_node) {
-                struct mapped_buffer_node *cmp_with =
-                        container_of(*new_node, struct mapped_buffer_node,
-                                     node);
-                parent = *new_node;
-                if (cmp_with->addr > mapped_buffer->addr) /* u64 cmp */
+static int insert_mapped_buffer(struct vm_gk20a *vm,
-                        new_node = &((*new_node)->rb_left);
+                                struct mapped_buffer_node *mapped_buffer)
-                else if (cmp_with->addr != mapped_buffer->addr) /* u64 cmp */
+{
-                        new_node = &((*new_node)->rb_right);
+        mapped_buffer->node.key_start = mapped_buffer->addr;
-                else
+        mapped_buffer->node.key_end = mapped_buffer->addr + mapped_buffer->size;
-                        return -EINVAL; /* no fair dup'ing */
-        }
-        /* Add new node and rebalance tree. */
+        nvgpu_rbtree_insert(&mapped_buffer->node, &vm->mapped_buffers);
-        rb_link_node(&mapped_buffer->node, parent, new_node);
-        rb_insert_color(&mapped_buffer->node, root);
        return 0;
 }
 static struct mapped_buffer_node *find_mapped_buffer_reverse_locked(
-                                struct rb_root *root, struct dma_buf *dmabuf,
+                        struct nvgpu_rbtree_node *root, struct dma_buf *dmabuf,
-                                u32 kind)
+                        u32 kind)
 {
-        struct rb_node *node = rb_first(root);
+        struct nvgpu_rbtree_node *node = NULL;
+        nvgpu_rbtree_enum_start(0, &node, root);
        while (node) {
                struct mapped_buffer_node *mapped_buffer =
-                        container_of(node, struct mapped_buffer_node, node);
+                                mapped_buffer_from_rbtree_node(node);
                if (mapped_buffer->dmabuf == dmabuf &&
                    kind == mapped_buffer->kind)
                        return mapped_buffer;
-                node = rb_next(&mapped_buffer->node);
+                nvgpu_rbtree_enum_next(&node, node);
        }
        return NULL;
 }
 static struct mapped_buffer_node *find_mapped_buffer_locked(
-                                        struct rb_root *root, u64 addr)
+                                struct nvgpu_rbtree_node *root, u64 addr)
 {
+        struct nvgpu_rbtree_node *node = NULL;
-        struct rb_node *node = root->rb_node;
+        nvgpu_rbtree_search(addr, &node, root);
-        while (node) {
+        if (!node)
-                struct mapped_buffer_node *mapped_buffer =
+                return NULL;
-                        container_of(node, struct mapped_buffer_node, node);
-                if (mapped_buffer->addr > addr) /* u64 cmp */
+        return mapped_buffer_from_rbtree_node(node);
-                        node = node->rb_left;
-                else if (mapped_buffer->addr != addr) /* u64 cmp */
-                        node = node->rb_right;
-                else
-                        return mapped_buffer;
-        }
-        return NULL;
 }
 static struct mapped_buffer_node *find_mapped_buffer_range_locked(
-                                        struct rb_root *root, u64 addr)
+                                struct nvgpu_rbtree_node *root, u64 addr)
 {
-        struct rb_node *node = root->rb_node;
+        struct nvgpu_rbtree_node *node = NULL;
-        while (node) {
-                struct mapped_buffer_node *m =
+        nvgpu_rbtree_range_search(addr, &node, root);
-                        container_of(node, struct mapped_buffer_node, node);
+        if (!node)
-                if (m->addr <= addr && m->addr + m->size > addr)
+                return NULL;
-                        return m;
-                else if (m->addr > addr) /* u64 cmp */
+        return mapped_buffer_from_rbtree_node(node);
-                        node = node->rb_left;
-                else
-                        node = node->rb_right;
-        }
-        return NULL;
 }
 /* find the first mapped buffer with GPU VA less than addr */
 static struct mapped_buffer_node *find_mapped_buffer_less_than_locked(
-        struct rb_root *root, u64 addr)
+        struct nvgpu_rbtree_node *root, u64 addr)
 {
-        struct rb_node *node = root->rb_node;
+        struct nvgpu_rbtree_node *node = NULL;
-        struct mapped_buffer_node *ret = NULL;
-        while (node) {
+        nvgpu_rbtree_less_than_search(addr, &node, root);
-                struct mapped_buffer_node *mapped_buffer =
+        if (!node)
-                        container_of(node, struct mapped_buffer_node, node);
+                return NULL;
-                if (mapped_buffer->addr >= addr)
-                        node = node->rb_left;
-                else {
-                        ret = mapped_buffer;
-                        node = node->rb_right;
-                }
-        }
-        return ret;
+        return mapped_buffer_from_rbtree_node(node);
 }
 #define BFR_ATTRS (sizeof(nvmap_bfr_param)/sizeof(nvmap_bfr_param[0]))
@@ -1693,7 +1669,7 @@ static int validate_fixed_buffer(struct vm_gk20a *vm,
         * mappings by checking the buffer with the highest GPU VA
         * that is less than our buffer end */
        buffer = find_mapped_buffer_less_than_locked(
-                &vm->mapped_buffers, map_offset + map_size);
+                vm->mapped_buffers, map_offset + map_size);
        if (buffer && buffer->addr + buffer->size > map_offset) {
                gk20a_warn(dev, "overlapping buffer map requested");
                return -EINVAL;
@@ -1877,7 +1853,7 @@ static u64 gk20a_vm_map_duplicate_locked(struct vm_gk20a *vm,
        struct mapped_buffer_node *mapped_buffer = NULL;
        if (flags & NVGPU_AS_MAP_BUFFER_FLAGS_FIXED_OFFSET) {
-                mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers,
+                mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers,
                                                          offset_align);
                if (!mapped_buffer)
                        return 0;
@@ -1887,7 +1863,7 @@ static u64 gk20a_vm_map_duplicate_locked(struct vm_gk20a *vm,
                        return 0;
        } else {
                mapped_buffer =
-                        find_mapped_buffer_reverse_locked(&vm->mapped_buffers,
+                        find_mapped_buffer_reverse_locked(vm->mapped_buffers,
                                                  dmabuf, kind);
                if (!mapped_buffer)
                        return 0;
@@ -2433,7 +2409,7 @@ u64 gk20a_vm_map(struct vm_gk20a *vm,
        nvgpu_init_list_node(&mapped_buffer->va_buffers_list);
        kref_init(&mapped_buffer->ref);
-        err = insert_mapped_buffer(&vm->mapped_buffers, mapped_buffer);
+        err = insert_mapped_buffer(vm, mapped_buffer);
        if (err) {
                gk20a_err(d, "failed to insert into mapped buffer tree");
                goto clean_up;
@@ -2456,7 +2432,7 @@ u64 gk20a_vm_map(struct vm_gk20a *vm,
 clean_up:
        if (inserted) {
-                rb_erase(&mapped_buffer->node, &vm->mapped_buffers);
+                remove_mapped_buffer(vm, mapped_buffer);
                if (user_mapped)
                        vm->num_user_mapped_buffers--;
        }
@@ -2483,7 +2459,7 @@ int gk20a_vm_get_compbits_info(struct vm_gk20a *vm,
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
-        mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers, mapping_gva);
+        mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers, mapping_gva);
        if (!mapped_buffer || !mapped_buffer->user_mapped)
        {
@@ -2542,7 +2518,7 @@ int gk20a_vm_map_compbits(struct vm_gk20a *vm,
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
        mapped_buffer =
-                find_mapped_buffer_locked(&vm->mapped_buffers, mapping_gva);
+                find_mapped_buffer_locked(vm->mapped_buffers, mapping_gva);
        if (!mapped_buffer || !mapped_buffer->user_mapped) {
                nvgpu_mutex_release(&vm->update_gmmu_lock);
@@ -3274,7 +3250,7 @@ dma_addr_t gk20a_mm_gpuva_to_iova_base(struct vm_gk20a *vm, u64 gpu_vaddr)
        struct gk20a *g = gk20a_from_vm(vm);
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
-        buffer = find_mapped_buffer_locked(&vm->mapped_buffers, gpu_vaddr);
+        buffer = find_mapped_buffer_locked(vm->mapped_buffers, gpu_vaddr);
        if (buffer)
                addr = g->ops.mm.get_iova_addr(g, buffer->sgt->sgl,
                                buffer->flags);
@@ -3886,7 +3862,7 @@ void gk20a_vm_unmap_locked(struct mapped_buffer_node *mapped_buffer,
                       mapped_buffer->sgt);
        /* remove from mapped buffer tree and remove list, free */
-        rb_erase(&mapped_buffer->node, &vm->mapped_buffers);
+        remove_mapped_buffer(vm, mapped_buffer);
        if (!nvgpu_list_empty(&mapped_buffer->va_buffers_list))
                nvgpu_list_del(&mapped_buffer->va_buffers_list);
@@ -3908,7 +3884,7 @@ void gk20a_vm_unmap(struct vm_gk20a *vm, u64 offset)
        struct mapped_buffer_node *mapped_buffer;
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
-        mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers, offset);
+        mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers, offset);
        if (!mapped_buffer) {
                nvgpu_mutex_release(&vm->update_gmmu_lock);
                gk20a_err(d, "invalid addr to unmap 0x%llx", offset);
@@ -3939,7 +3915,7 @@ static void gk20a_vm_remove_support_nofree(struct vm_gk20a *vm)
 {
        struct mapped_buffer_node *mapped_buffer;
        struct vm_reserved_va_node *va_node, *va_node_tmp;
-        struct rb_node *node;
+        struct nvgpu_rbtree_node *node = NULL;
        struct gk20a *g = vm->mm->g;
        gk20a_dbg_fn("");
@@ -3961,12 +3937,11 @@ static void gk20a_vm_remove_support_nofree(struct vm_gk20a *vm)
        /* TBD: add a flag here for the unmap code to recognize teardown
         * and short-circuit any otherwise expensive operations. */
-        node = rb_first(&vm->mapped_buffers);
+        nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
        while (node) {
-                mapped_buffer =
+                mapped_buffer = mapped_buffer_from_rbtree_node(node);
-                        container_of(node, struct mapped_buffer_node, node);
                gk20a_vm_unmap_locked(mapped_buffer, NULL);
-                node = rb_first(&vm->mapped_buffers);
+                nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
        }
        /* destroy remaining reserved memory areas */
@@ -4402,7 +4377,7 @@ int gk20a_init_vm(struct mm_gk20a *mm,
        if (err)
                goto clean_up_allocators;
-        vm->mapped_buffers = RB_ROOT;
+        vm->mapped_buffers = NULL;
        nvgpu_mutex_init(&vm->update_gmmu_lock);
        kref_init(&vm->ref);
@@ -5199,7 +5174,7 @@ int gk20a_vm_find_buffer(struct vm_gk20a *vm, u64 gpu_va,
        nvgpu_mutex_acquire(&vm->update_gmmu_lock);
-        mapped_buffer = find_mapped_buffer_range_locked(&vm->mapped_buffers,
+        mapped_buffer = find_mapped_buffer_range_locked(vm->mapped_buffers,
                                                        gpu_va);
        if (!mapped_buffer) {
                nvgpu_mutex_release(&vm->update_gmmu_lock);
diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
index a16ab588..b425ec5c 100644
--- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
+++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -26,6 +26,7 @@
 #include <nvgpu/allocator.h>
 #include <nvgpu/list.h>
+#include <nvgpu/rbtree.h>
 #ifdef CONFIG_ARM64
 #define outer_flush_range(a, b)
@@ -196,7 +197,7 @@ struct priv_cmd_entry {
 struct mapped_buffer_node {
        struct vm_gk20a *vm;
-        struct rb_node node;
+        struct nvgpu_rbtree_node node;
        struct list_head unmap_list;
        struct nvgpu_list_node va_buffers_list;
        struct vm_reserved_va_node *va_node;
@@ -231,6 +232,13 @@ mapped_buffer_node_from_va_buffers_list(struct nvgpu_list_node *node)
                ((uintptr_t)node - offsetof(struct mapped_buffer_node, va_buffers_list));
 };
+static inline struct mapped_buffer_node *
+mapped_buffer_from_rbtree_node(struct nvgpu_rbtree_node *node)
+{
+        return (struct mapped_buffer_node *)
+                  ((uintptr_t)node - offsetof(struct mapped_buffer_node, node));
+};
 struct vm_reserved_va_node {
        struct nvgpu_list_node reserved_va_list;
        struct nvgpu_list_node va_buffers_list;
@@ -306,7 +314,7 @@ struct vm_gk20a {
        struct nvgpu_allocator user;
        struct nvgpu_allocator user_lp;
-        struct rb_root mapped_buffers;
+        struct nvgpu_rbtree_node *mapped_buffers;
        struct nvgpu_list_node reserved_va_list;
diff --git a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
index 7d0f7e9c..54ac36db 100644
--- a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
+++ b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
@@ -202,7 +202,7 @@ static void vgpu_vm_remove_support(struct vm_gk20a *vm)
        struct vm_reserved_va_node *va_node, *va_node_tmp;
        struct tegra_vgpu_cmd_msg msg;
        struct tegra_vgpu_as_share_params *p = &msg.params.as_share;
-        struct rb_node *node;
+        struct nvgpu_rbtree_node *node = NULL;
        int err;
        gk20a_dbg_fn("");
@@ -211,12 +211,11 @@ static void vgpu_vm_remove_support(struct vm_gk20a *vm)
        /* TBD: add a flag here for the unmap code to recognize teardown
         * and short-circuit any otherwise expensive operations. */
-        node = rb_first(&vm->mapped_buffers);
+        nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
        while (node) {
-                mapped_buffer =
+                mapped_buffer = mapped_buffer_from_rbtree_node(node);
-                        container_of(node, struct mapped_buffer_node, node);
                gk20a_vm_unmap_locked(mapped_buffer, NULL);
-                node = rb_first(&vm->mapped_buffers);
+                nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
        }
        /* destroy remaining reserved memory areas */
@@ -406,7 +405,7 @@ static int vgpu_vm_alloc_share(struct gk20a_as_share *as_share,
        if (err)
                goto clean_up_user_allocator;
-        vm->mapped_buffers = RB_ROOT;
+        vm->mapped_buffers = NULL;
        nvgpu_mutex_init(&vm->update_gmmu_lock);
        kref_init(&vm->ref);
author	Deepak Nibade <dnibade@nvidia.com>	2017-03-31 02:46:33 -0400
committer	mobile promotions <svcmobile_promotions@nvidia.com>	2017-04-06 13:57:28 -0400
commit	ce3c30f14f1eed9ace2028b48c7e8f6cdd6b65cb (patch)
tree	f4fcc21aeccd99aa56d19ca67fdbee38dc4e311a /drivers
parent	6dda47a114d1ecbef4f5fa77e8100d795ee23ff1 (diff)

diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c index 461cf324..2fe76d80 100644 --- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.c +++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.c
@@ -311,10 +311,10 @@ static inline u32 lo32(u64 f)
311	}	311	}
312		312
313	static struct mapped_buffer_node *find_mapped_buffer_locked(	313	static struct mapped_buffer_node *find_mapped_buffer_locked(
314	struct rb_root *root, u64 addr);	314	struct nvgpu_rbtree_node *root, u64 addr);
315	static struct mapped_buffer_node *find_mapped_buffer_reverse_locked(	315	static struct mapped_buffer_node *find_mapped_buffer_reverse_locked(
316	struct rb_root root, struct dma_buf dmabuf,	316	struct nvgpu_rbtree_node root, struct dma_buf dmabuf,
317	u32 kind);	317	u32 kind);
318	static int update_gmmu_ptes_locked(struct vm_gk20a *vm,	318	static int update_gmmu_ptes_locked(struct vm_gk20a *vm,
319	enum gmmu_pgsz_gk20a pgsz_idx,	319	enum gmmu_pgsz_gk20a pgsz_idx,
320	struct sg_table *sgt, u64 buffer_offset,	320	struct sg_table *sgt, u64 buffer_offset,
@@ -1289,7 +1289,7 @@ int gk20a_vm_get_buffers(struct vm_gk20a *vm,
1289	{	1289	{
1290	struct mapped_buffer_node *mapped_buffer;	1290	struct mapped_buffer_node *mapped_buffer;
1291	struct mapped_buffer_node **buffer_list;	1291	struct mapped_buffer_node **buffer_list;
1292	struct rb_node *node;	1292	struct nvgpu_rbtree_node *node = NULL;
1293	int i = 0;	1293	int i = 0;
1294		1294
1295	if (vm->userspace_managed) {	1295	if (vm->userspace_managed) {
@@ -1307,16 +1307,15 @@ int gk20a_vm_get_buffers(struct vm_gk20a *vm,
1307	return -ENOMEM;	1307	return -ENOMEM;
1308	}	1308	}
1309		1309
1310	node = rb_first(&vm->mapped_buffers);	1310	nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
1311	while (node) {	1311	while (node) {
1312	mapped_buffer =	1312	mapped_buffer = mapped_buffer_from_rbtree_node(node);
1313	container_of(node, struct mapped_buffer_node, node);
1314	if (mapped_buffer->user_mapped) {	1313	if (mapped_buffer->user_mapped) {
1315	buffer_list[i] = mapped_buffer;	1314	buffer_list[i] = mapped_buffer;
1316	kref_get(&mapped_buffer->ref);	1315	kref_get(&mapped_buffer->ref);
1317	i++;	1316	i++;
1318	}	1317	}
1319	node = rb_next(&mapped_buffer->node);	1318	nvgpu_rbtree_enum_next(&node, node);
1320	}	1319	}
1321		1320
1322	BUG_ON(i != vm->num_user_mapped_buffers);	1321	BUG_ON(i != vm->num_user_mapped_buffers);
@@ -1396,7 +1395,7 @@ static void gk20a_vm_unmap_user(struct vm_gk20a *vm, u64 offset,
1396		1395
1397	nvgpu_mutex_acquire(&vm->update_gmmu_lock);	1396	nvgpu_mutex_acquire(&vm->update_gmmu_lock);
1398		1397
1399	mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers, offset);	1398	mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers, offset);
1400	if (!mapped_buffer) {	1399	if (!mapped_buffer) {
1401	nvgpu_mutex_release(&vm->update_gmmu_lock);	1400	nvgpu_mutex_release(&vm->update_gmmu_lock);
1402	gk20a_err(d, "invalid addr to unmap 0x%llx", offset);	1401	gk20a_err(d, "invalid addr to unmap 0x%llx", offset);
@@ -1488,104 +1487,81 @@ int gk20a_vm_free_va(struct vm_gk20a *vm,
1488	return 0;	1487	return 0;
1489	}	1488	}
1490		1489
1491	static int insert_mapped_buffer(struct rb_root *root,	1490
		1491	static void remove_mapped_buffer(struct vm_gk20a *vm,
1492	struct mapped_buffer_node *mapped_buffer)	1492	struct mapped_buffer_node *mapped_buffer)
1493	{	1493	{
1494	struct rb_node *new_node = &(root->rb_node), parent = NULL;	1494	nvgpu_rbtree_unlink(&mapped_buffer->node, &vm->mapped_buffers);
1495		1495	}
1496	/* Figure out where to put new node */
1497	while (*new_node) {
1498	struct mapped_buffer_node *cmp_with =
1499	container_of(*new_node, struct mapped_buffer_node,
1500	node);
1501
1502	parent = *new_node;
1503		1496
1504	if (cmp_with->addr > mapped_buffer->addr) /* u64 cmp */	1497	static int insert_mapped_buffer(struct vm_gk20a *vm,
1505	new_node = &((*new_node)->rb_left);	1498	struct mapped_buffer_node *mapped_buffer)
1506	else if (cmp_with->addr != mapped_buffer->addr) /* u64 cmp */	1499	{
1507	new_node = &((*new_node)->rb_right);	1500	mapped_buffer->node.key_start = mapped_buffer->addr;
1508	else	1501	mapped_buffer->node.key_end = mapped_buffer->addr + mapped_buffer->size;
1509	return -EINVAL; /* no fair dup'ing */
1510	}
1511		1502
1512	/* Add new node and rebalance tree. */	1503	nvgpu_rbtree_insert(&mapped_buffer->node, &vm->mapped_buffers);
1513	rb_link_node(&mapped_buffer->node, parent, new_node);
1514	rb_insert_color(&mapped_buffer->node, root);
1515		1504
1516	return 0;	1505	return 0;
1517	}	1506	}
1518		1507
1519	static struct mapped_buffer_node *find_mapped_buffer_reverse_locked(	1508	static struct mapped_buffer_node *find_mapped_buffer_reverse_locked(
1520	struct rb_root root, struct dma_buf dmabuf,	1509	struct nvgpu_rbtree_node root, struct dma_buf dmabuf,
1521	u32 kind)	1510	u32 kind)
1522	{	1511	{
1523	struct rb_node *node = rb_first(root);	1512	struct nvgpu_rbtree_node *node = NULL;
		1513
		1514	nvgpu_rbtree_enum_start(0, &node, root);
		1515
1524	while (node) {	1516	while (node) {
1525	struct mapped_buffer_node *mapped_buffer =	1517	struct mapped_buffer_node *mapped_buffer =
1526	container_of(node, struct mapped_buffer_node, node);	1518	mapped_buffer_from_rbtree_node(node);
		1519
1527	if (mapped_buffer->dmabuf == dmabuf &&	1520	if (mapped_buffer->dmabuf == dmabuf &&
1528	kind == mapped_buffer->kind)	1521	kind == mapped_buffer->kind)
1529	return mapped_buffer;	1522	return mapped_buffer;
1530	node = rb_next(&mapped_buffer->node);	1523
		1524	nvgpu_rbtree_enum_next(&node, node);
1531	}	1525	}
		1526
1532	return NULL;	1527	return NULL;
1533	}	1528	}
1534		1529
1535	static struct mapped_buffer_node *find_mapped_buffer_locked(	1530	static struct mapped_buffer_node *find_mapped_buffer_locked(
1536	struct rb_root *root, u64 addr)	1531	struct nvgpu_rbtree_node *root, u64 addr)
1537	{	1532	{
		1533	struct nvgpu_rbtree_node *node = NULL;
1538		1534
1539	struct rb_node *node = root->rb_node;	1535	nvgpu_rbtree_search(addr, &node, root);
1540	while (node) {	1536	if (!node)
1541	struct mapped_buffer_node *mapped_buffer =	1537	return NULL;
1542	container_of(node, struct mapped_buffer_node, node);	1538
1543	if (mapped_buffer->addr > addr) /* u64 cmp */	1539	return mapped_buffer_from_rbtree_node(node);
1544	node = node->rb_left;
1545	else if (mapped_buffer->addr != addr) /* u64 cmp */
1546	node = node->rb_right;
1547	else
1548	return mapped_buffer;
1549	}
1550	return NULL;
1551	}	1540	}
1552		1541
1553	static struct mapped_buffer_node *find_mapped_buffer_range_locked(	1542	static struct mapped_buffer_node *find_mapped_buffer_range_locked(
1554	struct rb_root *root, u64 addr)	1543	struct nvgpu_rbtree_node *root, u64 addr)
1555	{	1544	{
1556	struct rb_node *node = root->rb_node;	1545	struct nvgpu_rbtree_node *node = NULL;
1557	while (node) {	1546
1558	struct mapped_buffer_node *m =	1547	nvgpu_rbtree_range_search(addr, &node, root);
1559	container_of(node, struct mapped_buffer_node, node);	1548	if (!node)
1560	if (m->addr <= addr && m->addr + m->size > addr)	1549	return NULL;
1561	return m;	1550
1562	else if (m->addr > addr) /* u64 cmp */	1551	return mapped_buffer_from_rbtree_node(node);
1563	node = node->rb_left;
1564	else
1565	node = node->rb_right;
1566	}
1567	return NULL;
1568	}	1552	}
1569		1553
1570	/* find the first mapped buffer with GPU VA less than addr */	1554	/* find the first mapped buffer with GPU VA less than addr */
1571	static struct mapped_buffer_node *find_mapped_buffer_less_than_locked(	1555	static struct mapped_buffer_node *find_mapped_buffer_less_than_locked(
1572	struct rb_root *root, u64 addr)	1556	struct nvgpu_rbtree_node *root, u64 addr)
1573	{	1557	{
1574	struct rb_node *node = root->rb_node;	1558	struct nvgpu_rbtree_node *node = NULL;
1575	struct mapped_buffer_node *ret = NULL;
1576		1559
1577	while (node) {	1560	nvgpu_rbtree_less_than_search(addr, &node, root);
1578	struct mapped_buffer_node *mapped_buffer =	1561	if (!node)
1579	container_of(node, struct mapped_buffer_node, node);	1562	return NULL;
1580	if (mapped_buffer->addr >= addr)
1581	node = node->rb_left;
1582	else {
1583	ret = mapped_buffer;
1584	node = node->rb_right;
1585	}
1586	}
1587		1563
1588	return ret;	1564	return mapped_buffer_from_rbtree_node(node);
1589	}	1565	}
1590		1566
1591	#define BFR_ATTRS (sizeof(nvmap_bfr_param)/sizeof(nvmap_bfr_param[0]))	1567	#define BFR_ATTRS (sizeof(nvmap_bfr_param)/sizeof(nvmap_bfr_param[0]))
@@ -1693,7 +1669,7 @@ static int validate_fixed_buffer(struct vm_gk20a *vm,
1693	* mappings by checking the buffer with the highest GPU VA	1669	* mappings by checking the buffer with the highest GPU VA
1694	* that is less than our buffer end */	1670	* that is less than our buffer end */
1695	buffer = find_mapped_buffer_less_than_locked(	1671	buffer = find_mapped_buffer_less_than_locked(
1696	&vm->mapped_buffers, map_offset + map_size);	1672	vm->mapped_buffers, map_offset + map_size);
1697	if (buffer && buffer->addr + buffer->size > map_offset) {	1673	if (buffer && buffer->addr + buffer->size > map_offset) {
1698	gk20a_warn(dev, "overlapping buffer map requested");	1674	gk20a_warn(dev, "overlapping buffer map requested");
1699	return -EINVAL;	1675	return -EINVAL;
@@ -1877,7 +1853,7 @@ static u64 gk20a_vm_map_duplicate_locked(struct vm_gk20a *vm,
1877	struct mapped_buffer_node *mapped_buffer = NULL;	1853	struct mapped_buffer_node *mapped_buffer = NULL;
1878		1854
1879	if (flags & NVGPU_AS_MAP_BUFFER_FLAGS_FIXED_OFFSET) {	1855	if (flags & NVGPU_AS_MAP_BUFFER_FLAGS_FIXED_OFFSET) {
1880	mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers,	1856	mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers,
1881	offset_align);	1857	offset_align);
1882	if (!mapped_buffer)	1858	if (!mapped_buffer)
1883	return 0;	1859	return 0;
@@ -1887,7 +1863,7 @@ static u64 gk20a_vm_map_duplicate_locked(struct vm_gk20a *vm,
1887	return 0;	1863	return 0;
1888	} else {	1864	} else {
1889	mapped_buffer =	1865	mapped_buffer =
1890	find_mapped_buffer_reverse_locked(&vm->mapped_buffers,	1866	find_mapped_buffer_reverse_locked(vm->mapped_buffers,
1891	dmabuf, kind);	1867	dmabuf, kind);
1892	if (!mapped_buffer)	1868	if (!mapped_buffer)
1893	return 0;	1869	return 0;
@@ -2433,7 +2409,7 @@ u64 gk20a_vm_map(struct vm_gk20a *vm,
2433	nvgpu_init_list_node(&mapped_buffer->va_buffers_list);	2409	nvgpu_init_list_node(&mapped_buffer->va_buffers_list);
2434	kref_init(&mapped_buffer->ref);	2410	kref_init(&mapped_buffer->ref);
2435		2411
2436	err = insert_mapped_buffer(&vm->mapped_buffers, mapped_buffer);	2412	err = insert_mapped_buffer(vm, mapped_buffer);
2437	if (err) {	2413	if (err) {
2438	gk20a_err(d, "failed to insert into mapped buffer tree");	2414	gk20a_err(d, "failed to insert into mapped buffer tree");
2439	goto clean_up;	2415	goto clean_up;
@@ -2456,7 +2432,7 @@ u64 gk20a_vm_map(struct vm_gk20a *vm,
2456		2432
2457	clean_up:	2433	clean_up:
2458	if (inserted) {	2434	if (inserted) {
2459	rb_erase(&mapped_buffer->node, &vm->mapped_buffers);	2435	remove_mapped_buffer(vm, mapped_buffer);
2460	if (user_mapped)	2436	if (user_mapped)
2461	vm->num_user_mapped_buffers--;	2437	vm->num_user_mapped_buffers--;
2462	}	2438	}
@@ -2483,7 +2459,7 @@ int gk20a_vm_get_compbits_info(struct vm_gk20a *vm,
2483		2459
2484	nvgpu_mutex_acquire(&vm->update_gmmu_lock);	2460	nvgpu_mutex_acquire(&vm->update_gmmu_lock);
2485		2461
2486	mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers, mapping_gva);	2462	mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers, mapping_gva);
2487		2463
2488	if (!mapped_buffer \|\| !mapped_buffer->user_mapped)	2464	if (!mapped_buffer \|\| !mapped_buffer->user_mapped)
2489	{	2465	{
@@ -2542,7 +2518,7 @@ int gk20a_vm_map_compbits(struct vm_gk20a *vm,
2542	nvgpu_mutex_acquire(&vm->update_gmmu_lock);	2518	nvgpu_mutex_acquire(&vm->update_gmmu_lock);
2543		2519
2544	mapped_buffer =	2520	mapped_buffer =
2545	find_mapped_buffer_locked(&vm->mapped_buffers, mapping_gva);	2521	find_mapped_buffer_locked(vm->mapped_buffers, mapping_gva);
2546		2522
2547	if (!mapped_buffer \|\| !mapped_buffer->user_mapped) {	2523	if (!mapped_buffer \|\| !mapped_buffer->user_mapped) {
2548	nvgpu_mutex_release(&vm->update_gmmu_lock);	2524	nvgpu_mutex_release(&vm->update_gmmu_lock);
@@ -3274,7 +3250,7 @@ dma_addr_t gk20a_mm_gpuva_to_iova_base(struct vm_gk20a *vm, u64 gpu_vaddr)
3274	struct gk20a *g = gk20a_from_vm(vm);	3250	struct gk20a *g = gk20a_from_vm(vm);
3275		3251
3276	nvgpu_mutex_acquire(&vm->update_gmmu_lock);	3252	nvgpu_mutex_acquire(&vm->update_gmmu_lock);
3277	buffer = find_mapped_buffer_locked(&vm->mapped_buffers, gpu_vaddr);	3253	buffer = find_mapped_buffer_locked(vm->mapped_buffers, gpu_vaddr);
3278	if (buffer)	3254	if (buffer)
3279	addr = g->ops.mm.get_iova_addr(g, buffer->sgt->sgl,	3255	addr = g->ops.mm.get_iova_addr(g, buffer->sgt->sgl,
3280	buffer->flags);	3256	buffer->flags);
@@ -3886,7 +3862,7 @@ void gk20a_vm_unmap_locked(struct mapped_buffer_node *mapped_buffer,
3886	mapped_buffer->sgt);	3862	mapped_buffer->sgt);
3887		3863
3888	/* remove from mapped buffer tree and remove list, free */	3864	/* remove from mapped buffer tree and remove list, free */
3889	rb_erase(&mapped_buffer->node, &vm->mapped_buffers);	3865	remove_mapped_buffer(vm, mapped_buffer);
3890	if (!nvgpu_list_empty(&mapped_buffer->va_buffers_list))	3866	if (!nvgpu_list_empty(&mapped_buffer->va_buffers_list))
3891	nvgpu_list_del(&mapped_buffer->va_buffers_list);	3867	nvgpu_list_del(&mapped_buffer->va_buffers_list);
3892		3868
@@ -3908,7 +3884,7 @@ void gk20a_vm_unmap(struct vm_gk20a *vm, u64 offset)
3908	struct mapped_buffer_node *mapped_buffer;	3884	struct mapped_buffer_node *mapped_buffer;
3909		3885
3910	nvgpu_mutex_acquire(&vm->update_gmmu_lock);	3886	nvgpu_mutex_acquire(&vm->update_gmmu_lock);
3911	mapped_buffer = find_mapped_buffer_locked(&vm->mapped_buffers, offset);	3887	mapped_buffer = find_mapped_buffer_locked(vm->mapped_buffers, offset);
3912	if (!mapped_buffer) {	3888	if (!mapped_buffer) {
3913	nvgpu_mutex_release(&vm->update_gmmu_lock);	3889	nvgpu_mutex_release(&vm->update_gmmu_lock);
3914	gk20a_err(d, "invalid addr to unmap 0x%llx", offset);	3890	gk20a_err(d, "invalid addr to unmap 0x%llx", offset);
@@ -3939,7 +3915,7 @@ static void gk20a_vm_remove_support_nofree(struct vm_gk20a *vm)
3939	{	3915	{
3940	struct mapped_buffer_node *mapped_buffer;	3916	struct mapped_buffer_node *mapped_buffer;
3941	struct vm_reserved_va_node va_node, va_node_tmp;	3917	struct vm_reserved_va_node va_node, va_node_tmp;
3942	struct rb_node *node;	3918	struct nvgpu_rbtree_node *node = NULL;
3943	struct gk20a *g = vm->mm->g;	3919	struct gk20a *g = vm->mm->g;
3944		3920
3945	gk20a_dbg_fn("");	3921	gk20a_dbg_fn("");
@@ -3961,12 +3937,11 @@ static void gk20a_vm_remove_support_nofree(struct vm_gk20a *vm)
3961	/* TBD: add a flag here for the unmap code to recognize teardown	3937	/* TBD: add a flag here for the unmap code to recognize teardown
3962	* and short-circuit any otherwise expensive operations. */	3938	* and short-circuit any otherwise expensive operations. */
3963		3939
3964	node = rb_first(&vm->mapped_buffers);	3940	nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
3965	while (node) {	3941	while (node) {
3966	mapped_buffer =	3942	mapped_buffer = mapped_buffer_from_rbtree_node(node);
3967	container_of(node, struct mapped_buffer_node, node);
3968	gk20a_vm_unmap_locked(mapped_buffer, NULL);	3943	gk20a_vm_unmap_locked(mapped_buffer, NULL);
3969	node = rb_first(&vm->mapped_buffers);	3944	nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
3970	}	3945	}
3971		3946
3972	/* destroy remaining reserved memory areas */	3947	/* destroy remaining reserved memory areas */
@@ -4402,7 +4377,7 @@ int gk20a_init_vm(struct mm_gk20a *mm,
4402	if (err)	4377	if (err)
4403	goto clean_up_allocators;	4378	goto clean_up_allocators;
4404		4379
4405	vm->mapped_buffers = RB_ROOT;	4380	vm->mapped_buffers = NULL;
4406		4381
4407	nvgpu_mutex_init(&vm->update_gmmu_lock);	4382	nvgpu_mutex_init(&vm->update_gmmu_lock);
4408	kref_init(&vm->ref);	4383	kref_init(&vm->ref);
@@ -5199,7 +5174,7 @@ int gk20a_vm_find_buffer(struct vm_gk20a *vm, u64 gpu_va,
5199		5174
5200	nvgpu_mutex_acquire(&vm->update_gmmu_lock);	5175	nvgpu_mutex_acquire(&vm->update_gmmu_lock);
5201		5176
5202	mapped_buffer = find_mapped_buffer_range_locked(&vm->mapped_buffers,	5177	mapped_buffer = find_mapped_buffer_range_locked(vm->mapped_buffers,
5203	gpu_va);	5178	gpu_va);
5204	if (!mapped_buffer) {	5179	if (!mapped_buffer) {
5205	nvgpu_mutex_release(&vm->update_gmmu_lock);	5180	nvgpu_mutex_release(&vm->update_gmmu_lock);


diff --git a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h index a16ab588..b425ec5c 100644 --- a/drivers/gpu/nvgpu/gk20a/mm_gk20a.h +++ b/drivers/gpu/nvgpu/gk20a/mm_gk20a.h
@@ -26,6 +26,7 @@
26		26
27	#include <nvgpu/allocator.h>	27	#include <nvgpu/allocator.h>
28	#include <nvgpu/list.h>	28	#include <nvgpu/list.h>
		29	#include <nvgpu/rbtree.h>
29		30
30	#ifdef CONFIG_ARM64	31	#ifdef CONFIG_ARM64
31	#define outer_flush_range(a, b)	32	#define outer_flush_range(a, b)
@@ -196,7 +197,7 @@ struct priv_cmd_entry {
196		197
197	struct mapped_buffer_node {	198	struct mapped_buffer_node {
198	struct vm_gk20a *vm;	199	struct vm_gk20a *vm;
199	struct rb_node node;	200	struct nvgpu_rbtree_node node;
200	struct list_head unmap_list;	201	struct list_head unmap_list;
201	struct nvgpu_list_node va_buffers_list;	202	struct nvgpu_list_node va_buffers_list;
202	struct vm_reserved_va_node *va_node;	203	struct vm_reserved_va_node *va_node;
@@ -231,6 +232,13 @@ mapped_buffer_node_from_va_buffers_list(struct nvgpu_list_node *node)
231	((uintptr_t)node - offsetof(struct mapped_buffer_node, va_buffers_list));	232	((uintptr_t)node - offsetof(struct mapped_buffer_node, va_buffers_list));
232	};	233	};
233		234
		235	static inline struct mapped_buffer_node *
		236	mapped_buffer_from_rbtree_node(struct nvgpu_rbtree_node *node)
		237	{
		238	return (struct mapped_buffer_node *)
		239	((uintptr_t)node - offsetof(struct mapped_buffer_node, node));
		240	};
		241
234	struct vm_reserved_va_node {	242	struct vm_reserved_va_node {
235	struct nvgpu_list_node reserved_va_list;	243	struct nvgpu_list_node reserved_va_list;
236	struct nvgpu_list_node va_buffers_list;	244	struct nvgpu_list_node va_buffers_list;
@@ -306,7 +314,7 @@ struct vm_gk20a {
306	struct nvgpu_allocator user;	314	struct nvgpu_allocator user;
307	struct nvgpu_allocator user_lp;	315	struct nvgpu_allocator user_lp;
308		316
309	struct rb_root mapped_buffers;	317	struct nvgpu_rbtree_node *mapped_buffers;
310		318
311	struct nvgpu_list_node reserved_va_list;	319	struct nvgpu_list_node reserved_va_list;
312		320


diff --git a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c index 7d0f7e9c..54ac36db 100644 --- a/drivers/gpu/nvgpu/vgpu/mm_vgpu.c +++ b/drivers/gpu/nvgpu/vgpu/mm_vgpu.c
@@ -202,7 +202,7 @@ static void vgpu_vm_remove_support(struct vm_gk20a *vm)
202	struct vm_reserved_va_node va_node, va_node_tmp;	202	struct vm_reserved_va_node va_node, va_node_tmp;
203	struct tegra_vgpu_cmd_msg msg;	203	struct tegra_vgpu_cmd_msg msg;
204	struct tegra_vgpu_as_share_params *p = &msg.params.as_share;	204	struct tegra_vgpu_as_share_params *p = &msg.params.as_share;
205	struct rb_node *node;	205	struct nvgpu_rbtree_node *node = NULL;
206	int err;	206	int err;
207		207
208	gk20a_dbg_fn("");	208	gk20a_dbg_fn("");
@@ -211,12 +211,11 @@ static void vgpu_vm_remove_support(struct vm_gk20a *vm)
211	/* TBD: add a flag here for the unmap code to recognize teardown	211	/* TBD: add a flag here for the unmap code to recognize teardown
212	* and short-circuit any otherwise expensive operations. */	212	* and short-circuit any otherwise expensive operations. */
213		213
214	node = rb_first(&vm->mapped_buffers);	214	nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
215	while (node) {	215	while (node) {
216	mapped_buffer =	216	mapped_buffer = mapped_buffer_from_rbtree_node(node);
217	container_of(node, struct mapped_buffer_node, node);
218	gk20a_vm_unmap_locked(mapped_buffer, NULL);	217	gk20a_vm_unmap_locked(mapped_buffer, NULL);
219	node = rb_first(&vm->mapped_buffers);	218	nvgpu_rbtree_enum_start(0, &node, vm->mapped_buffers);
220	}	219	}
221		220
222	/* destroy remaining reserved memory areas */	221	/* destroy remaining reserved memory areas */
@@ -406,7 +405,7 @@ static int vgpu_vm_alloc_share(struct gk20a_as_share *as_share,
406	if (err)	405	if (err)
407	goto clean_up_user_allocator;	406	goto clean_up_user_allocator;
408		407
409	vm->mapped_buffers = RB_ROOT;	408	vm->mapped_buffers = NULL;
410		409
411	nvgpu_mutex_init(&vm->update_gmmu_lock);	410	nvgpu_mutex_init(&vm->update_gmmu_lock);
412	kref_init(&vm->ref);	411	kref_init(&vm->ref);