From 33d1e22230726a2176e72567a95bfceb6062a017 Mon Sep 17 00:00:00 2001
From: Seema Khowala <seemaj@nvidia.com>
Date: Wed, 28 Feb 2018 12:25:13 -0800
Subject: gpu: nvgpu: clean up memory leaks in gr init

This is to resolve memory leak after modifying
tpc_fs_mask sysfs which sets gr.sw_ready to false and
forces gr to re-initialize.

echo 1 > /sys/devices/gpu.0/force_idle
echo 5 > /sys/devices/gpu.0/tpc_fs_mask
echo 0 > /sys/devices/gpu.0/force_idle

Bug 200393029

Change-Id: I76299f53fc87823071c672ec682c3eb51f72f513
Signed-off-by: Seema Khowala <seemaj@nvidia.com>
Reviewed-on: https://git-master.nvidia.com/r/1666018
Reviewed-by: svc-mobile-coverity <svc-mobile-coverity@nvidia.com>
GVS: Gerrit_Virtual_Submit
Reviewed-by: Deepak Nibade <dnibade@nvidia.com>
Reviewed-by: Terje Bergstrom <tbergstrom@nvidia.com>
Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com>
Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
---
 drivers/gpu/nvgpu/common/ltc.c     |  6 ++-
 drivers/gpu/nvgpu/gk20a/gr_gk20a.c | 79 +++++++++++++++++++++++++++++---------
 2 files changed, 66 insertions(+), 19 deletions(-)

diff --git a/drivers/gpu/nvgpu/common/ltc.c b/drivers/gpu/nvgpu/common/ltc.c
index 006e2ed2..024c2e49 100644
--- a/drivers/gpu/nvgpu/common/ltc.c
+++ b/drivers/gpu/nvgpu/common/ltc.c
@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2017, NVIDIA CORPORATION.  All rights reserved.
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
  *
  * Permission is hereby granted, free of charge, to any person obtaining a
  * copy of this software and associated documentation files (the "Software"),
@@ -22,6 +22,7 @@
 
 #include <nvgpu/ltc.h>
 #include <nvgpu/dma.h>
+#include <nvgpu/nvgpu_mem.h>
 
 #include "gk20a/gk20a.h"
 #include "gk20a/gr_gk20a.h"
@@ -54,6 +55,9 @@ int nvgpu_ltc_alloc_cbc(struct gk20a *g, size_t compbit_backing_size)
 	struct gr_gk20a *gr = &g->gr;
 	unsigned long flags = 0;
 
+	if (nvgpu_mem_is_valid(&gr->compbit_store.mem))
+		return 0;
+
 	if (!nvgpu_iommuable(g))
 		flags = NVGPU_DMA_FORCE_CONTIGUOUS;
 
diff --git a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
index 7160ab6f..09e8aa0f 100644
--- a/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
+++ b/drivers/gpu/nvgpu/gk20a/gr_gk20a.c
@@ -3124,10 +3124,15 @@ static int gr_gk20a_init_gr_config(struct gk20a *g, struct gr_gk20a *gr)
 
 	gr->fbp_en_mask = g->ops.gr.get_fbp_en_mask(g);
 
-	gr->fbp_rop_l2_en_mask =
-		nvgpu_kzalloc(g, gr->max_fbps_count * sizeof(u32));
-	if (!gr->fbp_rop_l2_en_mask)
-		goto clean_up;
+	if (gr->fbp_rop_l2_en_mask == NULL) {
+		gr->fbp_rop_l2_en_mask =
+			nvgpu_kzalloc(g, gr->max_fbps_count * sizeof(u32));
+		if (!gr->fbp_rop_l2_en_mask)
+			goto clean_up;
+	} else {
+		memset(gr->fbp_rop_l2_en_mask, 0, gr->max_fbps_count *
+				sizeof(u32));
+	}
 
 	tmp = gk20a_readl(g, top_tpc_per_gpc_r());
 	gr->max_tpc_per_gpc_count = top_tpc_per_gpc_value_v(tmp);
@@ -3152,13 +3157,40 @@ static int gr_gk20a_init_gr_config(struct gk20a *g, struct gr_gk20a *gr)
 		goto clean_up;
 	}
 
-	gr->gpc_tpc_count = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
-	gr->gpc_tpc_mask = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
-	gr->gpc_zcb_count = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
-	gr->gpc_ppc_count = nvgpu_kzalloc(g, gr->gpc_count * sizeof(u32));
+	if (gr->gpc_tpc_count == NULL)
+		gr->gpc_tpc_count = nvgpu_kzalloc(g, gr->gpc_count *
+					sizeof(u32));
+	else
+		memset(gr->gpc_tpc_count, 0, gr->gpc_count *
+					sizeof(u32));
+
+	if (gr->gpc_tpc_mask == NULL)
+		gr->gpc_tpc_mask = nvgpu_kzalloc(g, gr->gpc_count *
+					sizeof(u32));
+	else
+		memset(gr->gpc_tpc_mask, 0,  gr->gpc_count *
+					sizeof(u32));
+
+	if (gr->gpc_zcb_count == NULL)
+		gr->gpc_zcb_count = nvgpu_kzalloc(g, gr->gpc_count *
+					sizeof(u32));
+	else
+		memset(gr->gpc_zcb_count, 0, gr->gpc_count *
+					sizeof(u32));
+
+	if (gr->gpc_ppc_count == NULL)
+		gr->gpc_ppc_count = nvgpu_kzalloc(g, gr->gpc_count *
+					sizeof(u32));
+	else
+		memset(gr->gpc_ppc_count, 0, gr->gpc_count *
+					sizeof(u32));
 
-	gr->gpc_skip_mask =
-		nvgpu_kzalloc(g, gr_pd_dist_skip_table__size_1_v() *
+	if (gr->gpc_skip_mask == NULL)
+		gr->gpc_skip_mask =
+			nvgpu_kzalloc(g, gr_pd_dist_skip_table__size_1_v() *
+			      4 * sizeof(u32));
+	else
+		memset(gr->gpc_skip_mask, 0, gr_pd_dist_skip_table__size_1_v() *
 			      4 * sizeof(u32));
 
 	if (!gr->gpc_tpc_count || !gr->gpc_tpc_mask || !gr->gpc_zcb_count ||
@@ -3246,8 +3278,15 @@ static int gr_gk20a_init_gr_config(struct gk20a *g, struct gr_gk20a *gr)
 		gr->gpc_skip_mask[gpc_index] = gpc_new_skip_mask;
 	}
 
-	gr->sm_to_cluster = nvgpu_kzalloc(g, gr->gpc_count * gr->tpc_count *
-				sm_per_tpc * sizeof(struct sm_info));
+	/* allocate for max tpc per gpc */
+	if (gr->sm_to_cluster == NULL)
+		gr->sm_to_cluster = nvgpu_kzalloc(g, gr->gpc_count *
+					gr->max_tpc_per_gpc_count *
+					sm_per_tpc * sizeof(struct sm_info));
+	else
+		memset(gr->sm_to_cluster, 0, gr->gpc_count *
+					gr->max_tpc_per_gpc_count *
+					sm_per_tpc * sizeof(struct sm_info));
 	gr->no_of_sm = 0;
 
 	gk20a_dbg_info("fbps: %d", gr->num_fbps);
@@ -3316,13 +3355,17 @@ static int gr_gk20a_init_mmu_sw(struct gk20a *g, struct gr_gk20a *gr)
 {
 	int err;
 
-	err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_wr_mem);
-	if (err)
-		goto err;
+	if (!nvgpu_mem_is_valid(&gr->mmu_wr_mem)) {
+		err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_wr_mem);
+		if (err)
+			goto err;
+	}
 
-	err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_rd_mem);
-	if (err)
-		goto err_free_wr_mem;
+	if (!nvgpu_mem_is_valid(&gr->mmu_rd_mem)) {
+		err = nvgpu_dma_alloc_sys(g, 0x1000, &gr->mmu_rd_mem);
+		if (err)
+			goto err_free_wr_mem;
+	}
 	return 0;
 
  err_free_wr_mem:
-- 
cgit v1.2.2