From bfe65407bde2b5d0776724301e215c6553c989f3 Mon Sep 17 00:00:00 2001
From: Vinod G <vinodg@nvidia.com>
Date: Tue, 7 Aug 2018 23:09:30 -0700
Subject: gpu: nvgpu: Read sm error ioctl support for tsg

Add READ_SM_ERROR IOCTL support to TSG level.
Moved the struct to save the sm_error details
from gr to tsg as the sm_error support is context
based, not global.

Also corrected MISRA 21.1 error in header file.

nvgpu_dbg_gpu_ioctl_write_single_sm_error_state and
nvgpu_dbg_gpu_ioctl_read_single_sm_error_state
functions are modified to use the tsg struct
nvgpu_tsg_sm_error_state.

Bug 200412642

Change-Id: I9e334b059078a4bb0e360b945444cc4bf1cc56ec
Signed-off-by: Vinod G <vinodg@nvidia.com>
Reviewed-on: https://git-master.nvidia.com/r/1794856
Reviewed-by: svc-misra-checker <svc-misra-checker@nvidia.com>
GVS: Gerrit_Virtual_Submit
Reviewed-by: Terje Bergstrom <tbergstrom@nvidia.com>
Reviewed-by: mobile promotions <svcmobile_promotions@nvidia.com>
Tested-by: mobile promotions <svcmobile_promotions@nvidia.com>
---
 drivers/gpu/nvgpu/gm20b/gr_gm20b.c | 106 +++++++++++++++++++++++--------------
 1 file changed, 65 insertions(+), 41 deletions(-)

(limited to 'drivers/gpu/nvgpu/gm20b/gr_gm20b.c')

diff --git a/drivers/gpu/nvgpu/gm20b/gr_gm20b.c b/drivers/gpu/nvgpu/gm20b/gr_gm20b.c
index 68ae91e8..fc4ab3dd 100644
--- a/drivers/gpu/nvgpu/gm20b/gr_gm20b.c
+++ b/drivers/gpu/nvgpu/gm20b/gr_gm20b.c
@@ -1268,32 +1268,68 @@ void gr_gm20b_get_access_map(struct gk20a *g,
 	*num_entries = ARRAY_SIZE(wl_addr_gm20b);
 }
 
+static void gm20b_gr_read_sm_error_state(struct gk20a *g,
+			u32 offset,
+			struct nvgpu_tsg_sm_error_state *sm_error_states)
+{
+	sm_error_states->hww_global_esr = gk20a_readl(g,
+			gr_gpc0_tpc0_sm_hww_global_esr_r() + offset);
+	sm_error_states->hww_warp_esr = gk20a_readl(g,
+			gr_gpc0_tpc0_sm_hww_warp_esr_r() + offset);
+	sm_error_states->hww_warp_esr_pc = (u64)(gk20a_readl(g,
+			gr_gpc0_tpc0_sm_hww_warp_esr_pc_r() + offset));
+	sm_error_states->hww_global_esr_report_mask = gk20a_readl(g,
+		       gr_gpc0_tpc0_sm_hww_global_esr_report_mask_r() + offset);
+	sm_error_states->hww_warp_esr_report_mask = gk20a_readl(g,
+			gr_gpc0_tpc0_sm_hww_warp_esr_report_mask_r() + offset);
+
+}
+
+static void gm20b_gr_write_sm_error_state(struct gk20a *g,
+			u32 offset,
+			struct nvgpu_tsg_sm_error_state *sm_error_states)
+{
+	gk20a_writel(g, gr_gpc0_tpc0_sm_hww_global_esr_r() + offset,
+				sm_error_states->hww_global_esr);
+	gk20a_writel(g, gr_gpc0_tpc0_sm_hww_warp_esr_r() + offset,
+				sm_error_states->hww_warp_esr);
+	gk20a_writel(g, gr_gpc0_tpc0_sm_hww_warp_esr_pc_r() + offset,
+				u64_lo32(sm_error_states->hww_warp_esr_pc));
+	gk20a_writel(g, gr_gpcs_tpcs_sm_hww_global_esr_report_mask_r() + offset,
+				sm_error_states->hww_global_esr_report_mask);
+	gk20a_writel(g, gr_gpcs_tpcs_sm_hww_warp_esr_report_mask_r() + offset,
+				sm_error_states->hww_warp_esr_report_mask);
+}
+
 int gm20b_gr_record_sm_error_state(struct gk20a *g, u32 gpc, u32 tpc, u32 sm,
 				struct channel_gk20a *fault_ch)
 {
 	int sm_id;
-	struct gr_gk20a *gr = &g->gr;
 	u32 gpc_stride = nvgpu_get_litter_value(g, GPU_LIT_GPC_STRIDE);
 	u32 tpc_in_gpc_stride = nvgpu_get_litter_value(g,
 					       GPU_LIT_TPC_IN_GPC_STRIDE);
 	u32 offset = gpc_stride * gpc + tpc_in_gpc_stride * tpc;
+	struct nvgpu_tsg_sm_error_state *sm_error_states = NULL;
+	struct tsg_gk20a *tsg = NULL;
 
 	nvgpu_mutex_acquire(&g->dbg_sessions_lock);
 
 	sm_id = gr_gpc0_tpc0_sm_cfg_sm_id_v(gk20a_readl(g,
 			gr_gpc0_tpc0_sm_cfg_r() + offset));
 
-	gr->sm_error_states[sm_id].hww_global_esr = gk20a_readl(g,
-			gr_gpc0_tpc0_sm_hww_global_esr_r() + offset);
-	gr->sm_error_states[sm_id].hww_warp_esr = gk20a_readl(g,
-			gr_gpc0_tpc0_sm_hww_warp_esr_r() + offset);
-	gr->sm_error_states[sm_id].hww_warp_esr_pc = gk20a_readl(g,
-			gr_gpc0_tpc0_sm_hww_warp_esr_pc_r() + offset);
-	gr->sm_error_states[sm_id].hww_global_esr_report_mask = gk20a_readl(g,
-		       gr_gpc0_tpc0_sm_hww_global_esr_report_mask_r() + offset);
-	gr->sm_error_states[sm_id].hww_warp_esr_report_mask = gk20a_readl(g,
-			gr_gpc0_tpc0_sm_hww_warp_esr_report_mask_r() + offset);
+	if (fault_ch != NULL) {
+		tsg = tsg_gk20a_from_ch(fault_ch);
+	}
+
+	if (tsg == NULL) {
+		nvgpu_err(g, "no valid tsg");
+		goto record_fail;
+	}
+
+	sm_error_states = tsg->sm_error_states + sm_id;
+	gm20b_gr_read_sm_error_state(g, offset, sm_error_states);
 
+record_fail:
 	nvgpu_mutex_release(&g->dbg_sessions_lock);
 
 	return sm_id;
@@ -1301,12 +1337,12 @@ int gm20b_gr_record_sm_error_state(struct gk20a *g, u32 gpc, u32 tpc, u32 sm,
 
 int gm20b_gr_update_sm_error_state(struct gk20a *g,
 		struct channel_gk20a *ch, u32 sm_id,
-		struct nvgpu_gr_sm_error_state *sm_error_state)
+		struct nvgpu_tsg_sm_error_state *sm_error_state)
 {
 	u32 gpc, tpc, offset;
-	struct gr_gk20a *gr = &g->gr;
 	struct tsg_gk20a *tsg;
 	struct nvgpu_gr_ctx *ch_ctx;
+	struct nvgpu_tsg_sm_error_state *tsg_sm_error_states;
 	u32 gpc_stride = nvgpu_get_litter_value(g, GPU_LIT_GPC_STRIDE);
 	u32 tpc_in_gpc_stride = nvgpu_get_litter_value(g,
 					       GPU_LIT_TPC_IN_GPC_STRIDE);
@@ -1320,16 +1356,8 @@ int gm20b_gr_update_sm_error_state(struct gk20a *g,
 
 	nvgpu_mutex_acquire(&g->dbg_sessions_lock);
 
-	gr->sm_error_states[sm_id].hww_global_esr =
-			sm_error_state->hww_global_esr;
-	gr->sm_error_states[sm_id].hww_warp_esr =
-			sm_error_state->hww_warp_esr;
-	gr->sm_error_states[sm_id].hww_warp_esr_pc =
-			sm_error_state->hww_warp_esr_pc;
-	gr->sm_error_states[sm_id].hww_global_esr_report_mask =
-			sm_error_state->hww_global_esr_report_mask;
-	gr->sm_error_states[sm_id].hww_warp_esr_report_mask =
-			sm_error_state->hww_warp_esr_report_mask;
+	tsg_sm_error_states = tsg->sm_error_states + sm_id;
+	gk20a_tsg_update_sm_error_state_locked(tsg, sm_id, sm_error_state);
 
 	err = gr_gk20a_disable_ctxsw(g);
 	if (err) {
@@ -1343,29 +1371,20 @@ int gm20b_gr_update_sm_error_state(struct gk20a *g,
 	offset = gpc_stride * gpc + tpc_in_gpc_stride * tpc;
 
 	if (gk20a_is_channel_ctx_resident(ch)) {
-		gk20a_writel(g, gr_gpc0_tpc0_sm_hww_global_esr_r() + offset,
-				gr->sm_error_states[sm_id].hww_global_esr);
-		gk20a_writel(g, gr_gpc0_tpc0_sm_hww_warp_esr_r() + offset,
-				gr->sm_error_states[sm_id].hww_warp_esr);
-		gk20a_writel(g, gr_gpc0_tpc0_sm_hww_warp_esr_pc_r() + offset,
-				gr->sm_error_states[sm_id].hww_warp_esr_pc);
-		gk20a_writel(g, gr_gpcs_tpcs_sm_hww_global_esr_report_mask_r() + offset,
-				gr->sm_error_states[sm_id].hww_global_esr_report_mask);
-		gk20a_writel(g, gr_gpcs_tpcs_sm_hww_warp_esr_report_mask_r() + offset,
-				gr->sm_error_states[sm_id].hww_warp_esr_report_mask);
+		gm20b_gr_write_sm_error_state(g, offset, tsg_sm_error_states);
 	} else {
 		err = gr_gk20a_ctx_patch_write_begin(g, ch_ctx, false);
 		if (err)
 			goto enable_ctxsw;
 
 		gr_gk20a_ctx_patch_write(g, ch_ctx,
-				gr_gpcs_tpcs_sm_hww_global_esr_report_mask_r() + offset,
-				gr->sm_error_states[sm_id].hww_global_esr_report_mask,
-				true);
+			gr_gpcs_tpcs_sm_hww_global_esr_report_mask_r() + offset,
+			tsg_sm_error_states->hww_global_esr_report_mask,
+			true);
 		gr_gk20a_ctx_patch_write(g, ch_ctx,
-				gr_gpcs_tpcs_sm_hww_warp_esr_report_mask_r() + offset,
-				gr->sm_error_states[sm_id].hww_warp_esr_report_mask,
-				true);
+			gr_gpcs_tpcs_sm_hww_warp_esr_report_mask_r() + offset,
+			tsg_sm_error_states->hww_warp_esr_report_mask,
+			true);
 
 		gr_gk20a_ctx_patch_write_end(g, ch_ctx, false);
 	}
@@ -1383,15 +1402,20 @@ int gm20b_gr_clear_sm_error_state(struct gk20a *g,
 {
 	u32 gpc, tpc, offset;
 	u32 val;
-	struct gr_gk20a *gr = &g->gr;
+	struct tsg_gk20a *tsg;
 	u32 gpc_stride = nvgpu_get_litter_value(g, GPU_LIT_GPC_STRIDE);
 	u32 tpc_in_gpc_stride = nvgpu_get_litter_value(g,
 					       GPU_LIT_TPC_IN_GPC_STRIDE);
 	int err = 0;
 
+	tsg = tsg_gk20a_from_ch(ch);
+	if (tsg == NULL) {
+		return -EINVAL;
+	}
+
 	nvgpu_mutex_acquire(&g->dbg_sessions_lock);
 
-	memset(&gr->sm_error_states[sm_id], 0, sizeof(*gr->sm_error_states));
+	memset(&tsg->sm_error_states[sm_id], 0, sizeof(*tsg->sm_error_states));
 
 	err = gr_gk20a_disable_ctxsw(g);
 	if (err) {
-- 
cgit v1.2.2