gpu: nvgpu: clean up memory leaks in gr init

This is to resolve memory leak after modifying tpc_fs_mask sysfs which sets gr.sw_ready to false and forces gr to re-initialize. echo 1 > /sys/devices/gpu.0/force_idle echo 5 > /sys/devices/gpu.0/tpc_fs_mask echo 0 > /sys/devices/gpu.0/force_idle Bug 200393029 Change-Id: I76299f53fc87823071c672ec682c3eb51f72f513 Signed-off-by: Seema Khowala <seemaj@nvidia.com> Reviewed-on: https://git-master.nvidia.com/r/1666018 Reviewed-by: svc-mobile-coverity <svc-mobile-coverity@nvidia.com> GVS: Gerrit_Virtual_Submit Reviewed-by: Deepak Nibade <dnibade@nvidia.com> Reviewed-by: Terje Bergstrom <tbergstrom@nvidia.com> Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com> Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
author: Seema Khowala <seemaj@nvidia.com> 2018-02-28 15:25:13 -0500
committer: mobile promotions <svcmobile_promotions@nvidia.com> 2018-03-06 01:22:36 -0500
commit: 33d1e22230726a2176e72567a95bfceb6062a017 (patch)
tree: 05e5b1387df602500638382c123d22af7433d92b
parent: c2d01257d79e52a6f4e0ae4335df1b125284accf (diff)
2 files changed, 66 insertions, 19 deletions
diff --git a/drivers/gpu/nvgpu/common/ltc.c b/drivers/gpu/nvgpu/common/ltc.c
index 006e2ed2..024c2e49 100644
--- a/drivers/gpu/nvgpu/common/ltc.c
+++ b/drivers/gpu/nvgpu/common/ltc.c
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2017, NVIDIA CORPORATION.  All rights reserved.
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
 *
 * Permission is hereby granted, free of charge, to any person obtaining a
 * copy of this software and associated documentation files (the "Software"),
@@ -22,6 +22,7 @@
 #include <nvgpu/ltc.h>
 #include <nvgpu/dma.h>
+#include <nvgpu/nvgpu_mem.h>
 #include "gk20a/gk20a.h"
 #include "gk20a/gr_gk20a.h"
@@ -54,6 +55,9 @@ int nvgpu_ltc_alloc_cbc(struct gk20a *g, size_t compbit_backing_size)
        struct gr_gk20a *gr = &g->gr;
        unsigned long flags = 0;
+        if (nvgpu_mem_is_valid(&gr->compbit_store.mem))
+                return 0;
        if (!nvgpu_iommuable(g))
                flags = NVGPU_DMA_FORCE_CONTIGUOUS;
diff --git a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
index 7160ab6f..09e8aa0f 100644
--- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -3124,10 +3124,15 @@ static int gr_gk20a_init_gr_config(struct gk20a *g, struct gr_gk20a *gr)
        gr->fbp_en_mask = g->ops.gr.get_fbp_en_mask(g);
-        gr->fbp_rop_l2_en_mask =
+        if (gr->fbp_rop_l2_en_mask == NULL) {
-                nvgpu_kzalloc(g, gr->max_fbps_count * sizeof(u32));
+                gr->fbp_rop_l2_en_mask =
-        if (!gr->fbp_rop_l2_en_mask)
+                        nvgpu_kzalloc(g, gr->max_fbps_count * sizeof(u32));
-                goto clean_up;
+                if (!gr->fbp_rop_l2_en_mask)
+                        goto clean_up;
+        } else {
+                memset(gr->fbp_rop_l2_en_mask, 0, gr->max_fbps_count *
+                                sizeof(u32));
+        }
        tmp = gk20a_readl(g, top_tpc_per_gpc_r());
        gr->max_tpc_per_gpc_count = top_tpc_per_gpc_value_v(tmp);
@@ -3152,13 +3157,40 @@ static int gr_gk20a_init_gr_config(struct gk20a *g, struct gr_gk20a *gr)
                goto clean_up;
        }
-        gr->gpc_tpc_count = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
+        if (gr->gpc_tpc_count == NULL)
-        gr->gpc_tpc_mask = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
+                gr->gpc_tpc_count = nvgpu_kzalloc(g, gr->gpc_count *
-        gr->gpc_zcb_count = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
+                                        sizeof(u32));
-        gr->gpc_ppc_count = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
+        else
+                memset(gr->gpc_tpc_count, 0, gr->gpc_count *
+                                        sizeof(u32));
+        if (gr->gpc_tpc_mask == NULL)
+                gr->gpc_tpc_mask = nvgpu_kzalloc(g, gr->gpc_count *
+                                        sizeof(u32));
+        else
+                memset(gr->gpc_tpc_mask, 0,  gr->gpc_count *
+                                        sizeof(u32));
+        if (gr->gpc_zcb_count == NULL)
+                gr->gpc_zcb_count = nvgpu_kzalloc(g, gr->gpc_count *
+                                        sizeof(u32));
+        else
+                memset(gr->gpc_zcb_count, 0, gr->gpc_count *
+                                        sizeof(u32));
+        if (gr->gpc_ppc_count == NULL)
+                gr->gpc_ppc_count = nvgpu_kzalloc(g, gr->gpc_count *
+                                        sizeof(u32));
+        else
+                memset(gr->gpc_ppc_count, 0, gr->gpc_count *
+                                        sizeof(u32));
-        gr->gpc_skip_mask =
+        if (gr->gpc_skip_mask == NULL)
-                nvgpu_kzalloc(g, gr_pd_dist_skip_table__size_1_v() *
+                gr->gpc_skip_mask =
+                        nvgpu_kzalloc(g, gr_pd_dist_skip_table__size_1_v() *
+                              4 * sizeof(u32));
+        else
+                memset(gr->gpc_skip_mask, 0, gr_pd_dist_skip_table__size_1_v() *
                              4 * sizeof(u32));
        if (!gr->gpc_tpc_count || !gr->gpc_tpc_mask || !gr->gpc_zcb_count ||
@@ -3246,8 +3278,15 @@ static int gr_gk20a_init_gr_config(struct gk20a *g, struct gr_gk20a *gr)
                gr->gpc_skip_mask[gpc_index] = gpc_new_skip_mask;
        }
-        gr->sm_to_cluster = nvgpu_kzalloc(g, gr->gpc_count * gr->tpc_count *
+        /* allocate for max tpc per gpc */
-                                sm_per_tpc * sizeof(struct sm_info));
+        if (gr->sm_to_cluster == NULL)
+                gr->sm_to_cluster = nvgpu_kzalloc(g, gr->gpc_count *
+                                        gr->max_tpc_per_gpc_count *
+                                        sm_per_tpc * sizeof(struct sm_info));
+        else
+                memset(gr->sm_to_cluster, 0, gr->gpc_count *
+                                        gr->max_tpc_per_gpc_count *
+                                        sm_per_tpc * sizeof(struct sm_info));
        gr->no_of_sm = 0;
        gk20a_dbg_info("fbps: %d", gr->num_fbps);
@@ -3316,13 +3355,17 @@ static int gr_gk20a_init_mmu_sw(struct gk20a *g, struct gr_gk20a *gr)
 {
        int err;
-        err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_wr_mem);
+        if (!nvgpu_mem_is_valid(&gr->mmu_wr_mem)) {
-        if (err)
+                err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_wr_mem);
-                goto err;
+                if (err)
+                        goto err;
+        }
-        err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_rd_mem);
+        if (!nvgpu_mem_is_valid(&gr->mmu_rd_mem)) {
-        if (err)
+                err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_rd_mem);
-                goto err_free_wr_mem;
+                if (err)
+                        goto err_free_wr_mem;
+        }
        return 0;
 err_free_wr_mem:
author	Seema Khowala <seemaj@nvidia.com>	2018-02-28 15:25:13 -0500
committer	mobile promotions <svcmobile_promotions@nvidia.com>	2018-03-06 01:22:36 -0500
commit	33d1e22230726a2176e72567a95bfceb6062a017 (patch)
tree	05e5b1387df602500638382c123d22af7433d92b
parent	c2d01257d79e52a6f4e0ae4335df1b125284accf (diff)