2 files changed, 546 insertions, 351 deletions
diff --git a/drivers/gpu/nvgpu/clk/clk_arb.c b/drivers/gpu/nvgpu/clk/clk_arb.c
index 1f7c2aea..aea32cb8 100644
--- a/drivers/gpu/nvgpu/clk/clk_arb.c
+++ b/drivers/gpu/nvgpu/clk/clk_arb.c
@@ -19,7 +19,8 @@
 #include <linux/nvgpu.h>
 #include <linux/bitops.h>
 #include <linux/spinlock.h>
+#include <linux/rculist.h>
+#include <linux/llist.h>
 #include "clk/clk_arb.h"
@@ -36,8 +37,15 @@ static int nvgpu_clk_arb_release_completion_dev(struct inode *inode,
 static unsigned int nvgpu_clk_arb_poll_dev(struct file *filp, poll_table *wait);
 static void nvgpu_clk_arb_run_arbiter_cb(struct work_struct *work);
-static void nvgpu_clk_arb_run_vftable_cb(struct work_struct *work);
+static void nvgpu_clk_arb_run_vf_table_cb(struct work_struct *work);
-static int nvgpu_clk_arb_update_vftable(struct nvgpu_clk_arb *);
+static int nvgpu_clk_arb_update_vf_table(struct nvgpu_clk_arb *arb);
+static void nvgpu_clk_arb_free_fd(struct kref *refcount);
+static void nvgpu_clk_arb_free_session(struct kref *refcount);
+static int nvgpu_clk_arb_change_vf_point(struct gk20a *g, u16 gpc2clk,
+        u16 mclk, u32 voltuv, u32 voltuv_sram);
+static void nvgpu_clk_arb_find_vf_point(struct nvgpu_clk_arb *arb,
+                u16 *gpc2clk_target, u16 *mclk_target, u32 *voltuv,
+                u32 *voltuv_sram);
 struct nvgpu_clk_vf_point {
        u16 mhz;
@@ -45,58 +53,80 @@ struct nvgpu_clk_vf_point {
        u32 uvolt_sram;
 };
+struct nvgpu_clk_vf_table {
+        u32 mclk_num_points;
+        struct nvgpu_clk_vf_point *mclk_points;
+        u32 gpc2clk_num_points;
+        struct nvgpu_clk_vf_point *gpc2clk_points;
+};
+#ifdef CONFIG_DEBUG_FS
+struct nvgpu_clk_arb_debug {
+        s64 switch_max;
+        s64 switch_min;
+        u64 switch_num;
+        s64 switch_avg;
+        s64 switch_std;
+};
+#endif
+struct nvgpu_clk_arb_target {
+        u16 mclk;
+        u16 gpc2clk;
+};
 struct nvgpu_clk_arb {
        spinlock_t sessions_lock;
        spinlock_t users_lock;
-        spinlock_t req_lock;
        struct list_head users;
        struct list_head sessions;
-        struct list_head requests;
+        struct llist_head requests;
        struct gk20a *g;
-        spinlock_t data_lock;
-        spinlock_t vf_lock;
-        u16 gpc2clk_actual_mhz;
+        struct nvgpu_clk_arb_target actual_pool[2];
-        u16 gpc2clk_default_mhz;
+        struct nvgpu_clk_arb_target *actual;
-        u16 mclk_actual_mhz;
+        u16 gpc2clk_default_mhz;
        u16 mclk_default_mhz;
        u32 voltuv_actual;
        struct work_struct update_fn_work;
-        struct work_struct vftable_fn_work;
+        struct workqueue_struct *update_work_queue;
-        wait_queue_head_t vftable_wq;
+        struct work_struct vf_table_fn_work;
+        struct workqueue_struct *vf_table_work_queue;
+        wait_queue_head_t request_wq;
+        struct nvgpu_clk_vf_table *current_vf_table;
+        struct nvgpu_clk_vf_table vf_table_pool[2];
+        u32 vf_table_index;
        u16 *mclk_f_points;
-        bool vftable_set;
+        atomic_t req_nr;
-        struct nvgpu_clk_vf_point *mclk_vf_points;
        u32 mclk_f_numpoints;
        u16 *gpc2clk_f_points;
        u32 gpc2clk_f_numpoints;
-        struct nvgpu_clk_vf_point *gpc2clk_vf_points;
 #ifdef CONFIG_DEBUG_FS
-        struct mutex debug_lock;
+        struct nvgpu_clk_arb_debug debug_pool[2];
-        s64 switch_max;
+        struct nvgpu_clk_arb_debug *debug;
-        s64 switch_min;
-        u64 switch_num;
-        s64 switch_avg;
-        s64 switch_std;
        bool debugfs_set;
 #endif
 };
 struct nvgpu_clk_dev {
        struct nvgpu_clk_session *session;
-        struct list_head link;
+        union {
+                struct list_head link;
+                struct llist_node node;
+        };
        wait_queue_head_t readout_wq;
        atomic_t poll_mask;
        u16 gpc2clk_target_mhz;
        u16 mclk_target_mhz;
+        struct kref refcount;
 };
 struct nvgpu_clk_session {
@@ -104,11 +134,10 @@ struct nvgpu_clk_session {
        struct gk20a *g;
        struct kref refcount;
        struct list_head link;
-        struct list_head targets;
+        struct llist_head targets;
-        spinlock_t target_lock;
+        struct nvgpu_clk_arb_target target_pool[2];
-        u16 gpc2clk_target_mhz;
+        struct nvgpu_clk_arb_target *target;
-        u16 mclk_target_mhz;
 };
 static const struct file_operations completion_dev_ops = {
@@ -128,6 +157,8 @@ int nvgpu_clk_arb_init_arbiter(struct gk20a *g)
        struct nvgpu_clk_arb *arb;
        u16 default_mhz;
        int err;
+        int index;
+        struct nvgpu_clk_vf_table *table;
        gk20a_dbg_fn("");
@@ -140,33 +171,37 @@ int nvgpu_clk_arb_init_arbiter(struct gk20a *g)
                goto init_fail;
        }
-        arb->gpc2clk_f_numpoints = MAX_F_POINTS;
-        arb->mclk_f_numpoints = MAX_F_POINTS;
-        arb->gpc2clk_f_points = kcalloc(MAX_F_POINTS, sizeof(u16), GFP_KERNEL);
-        if (!arb->gpc2clk_f_points) {
-                err = -ENOMEM;
-                goto init_fail;
-        }
        arb->mclk_f_points = kcalloc(MAX_F_POINTS, sizeof(u16), GFP_KERNEL);
        if (!arb->mclk_f_points) {
                err = -ENOMEM;
                goto init_fail;
        }
-        arb->gpc2clk_vf_points = kcalloc(MAX_F_POINTS,
+        arb->gpc2clk_f_points = kcalloc(MAX_F_POINTS, sizeof(u16), GFP_KERNEL);
-                sizeof(struct nvgpu_clk_vf_point), GFP_KERNEL);
+        if (!arb->gpc2clk_f_points) {
-        if (!arb->gpc2clk_vf_points) {
                err = -ENOMEM;
                goto init_fail;
        }
-        arb->mclk_vf_points = kcalloc(MAX_F_POINTS,
+        for (index = 0; index < 2; index++) {
-                sizeof(struct nvgpu_clk_vf_point), GFP_KERNEL);
+                table = &arb->vf_table_pool[index];
-        if (!arb->mclk_vf_points) {
+                table->gpc2clk_num_points = MAX_F_POINTS;
-                err = -ENOMEM;
+                table->mclk_num_points = MAX_F_POINTS;
-                goto init_fail;
+                table->gpc2clk_points = kcalloc(MAX_F_POINTS,
+                        sizeof(struct nvgpu_clk_vf_point), GFP_KERNEL);
+                if (!table->gpc2clk_points) {
+                        err = -ENOMEM;
+                        goto init_fail;
+                }
+                table->mclk_points = kcalloc(MAX_F_POINTS,
+                        sizeof(struct nvgpu_clk_vf_point), GFP_KERNEL);
+                if (!table->mclk_points) {
+                        err = -ENOMEM;
+                        goto init_fail;
+                }
        }
        g->clk_arb = arb;
@@ -174,9 +209,6 @@ int nvgpu_clk_arb_init_arbiter(struct gk20a *g)
        spin_lock_init(&arb->sessions_lock);
        spin_lock_init(&arb->users_lock);
-        spin_lock_init(&arb->req_lock);
-        spin_lock_init(&arb->data_lock);
-        spin_lock_init(&arb->vf_lock);
        err =  g->ops.clk_arb.get_arbiter_clk_default(g,
                        NVGPU_GPU_CLK_DOMAIN_MCLK, &default_mhz);
@@ -196,39 +228,58 @@ int nvgpu_clk_arb_init_arbiter(struct gk20a *g)
        arb->gpc2clk_default_mhz = default_mhz;
-        INIT_LIST_HEAD(&arb->users);
+        arb->actual = &arb->actual_pool[0];
-        INIT_LIST_HEAD(&arb->sessions);
-        INIT_LIST_HEAD(&arb->requests);
+        atomic_set(&arb->req_nr, 0);
-        init_waitqueue_head(&arb->vftable_wq);
+        INIT_LIST_HEAD_RCU(&arb->users);
+        INIT_LIST_HEAD_RCU(&arb->sessions);
+        init_llist_head(&arb->requests);
-        INIT_WORK(&arb->vftable_fn_work, nvgpu_clk_arb_run_vftable_cb);
+        init_waitqueue_head(&arb->request_wq);
+        arb->vf_table_work_queue = alloc_workqueue("%s", WQ_HIGHPRI, 1,
+                "vf_table_update");
+        arb->update_work_queue = alloc_workqueue("%s", WQ_HIGHPRI, 1,
+                "arbiter_update");
+        INIT_WORK(&arb->vf_table_fn_work, nvgpu_clk_arb_run_vf_table_cb);
        INIT_WORK(&arb->update_fn_work, nvgpu_clk_arb_run_arbiter_cb);
 #ifdef CONFIG_DEBUG_FS
-        mutex_init(&arb->debug_lock);
+        arb->debug = &arb->debug_pool[0];
        if (!arb->debugfs_set) {
                if (nvgpu_clk_arb_debugfs_init(g))
                        arb->debugfs_set = true;
        }
 #endif
-        err = nvgpu_clk_arb_update_vftable(arb);
+        err = clk_vf_point_cache(g);
        if (err < 0)
                goto init_fail;
-        /* Schedule first run */
+        err = nvgpu_clk_arb_update_vf_table(arb);
-        schedule_work(&arb->update_fn_work);
+        if (err < 0)
+                goto init_fail;
+        do {
+                /* Check that first run is completed */
+                smp_mb();
+                wait_event_interruptible(arb->request_wq,
+                        atomic_read(&arb->req_nr));
+        } while (!atomic_read(&arb->req_nr));
        return 0;
 init_fail:
        kfree(arb->gpc2clk_f_points);
-        kfree(arb->gpc2clk_vf_points);
        kfree(arb->mclk_f_points);
-        kfree(arb->mclk_vf_points);
+        for (index = 0; index < 2; index++) {
+                kfree(arb->vf_table_pool[index].gpc2clk_points);
+                kfree(arb->vf_table_pool[index].mclk_points);
+        }
        kfree(arb);
@@ -275,6 +326,8 @@ static int nvgpu_clk_arb_install_fd(struct gk20a *g,
        atomic_set(&dev->poll_mask, 0);
        dev->session = session;
+        kref_init(&dev->refcount);
        kref_get(&session->refcount);
        *_dev = dev;
@@ -305,15 +358,15 @@ int nvgpu_clk_arb_init_session(struct gk20a *g,
        session->g = g;
        kref_init(&session->refcount);
-        spin_lock_init(&session->target_lock);
        session->zombie = false;
-        session->mclk_target_mhz = arb->mclk_default_mhz;
+        session->target = &session->target_pool[0];
-        session->gpc2clk_target_mhz = arb->gpc2clk_default_mhz;
+        session->target->mclk  = arb->mclk_default_mhz;
-        INIT_LIST_HEAD(&session->targets);
+        session->target->gpc2clk = arb->gpc2clk_default_mhz;
+        init_llist_head(&session->targets);
        spin_lock(&arb->sessions_lock);
-        list_add_tail(&session->link, &arb->sessions);
+        list_add_tail_rcu(&session->link, &arb->sessions);
        spin_unlock(&arb->sessions_lock);
        *_session = session;
@@ -321,19 +374,34 @@ int nvgpu_clk_arb_init_session(struct gk20a *g,
        return 0;
 }
-void nvgpu_clk_arb_free_session(struct kref *refcount)
+static void nvgpu_clk_arb_free_fd(struct kref *refcount)
+{
+        struct nvgpu_clk_dev *dev = container_of(refcount,
+                        struct nvgpu_clk_dev, refcount);
+        kfree(dev);
+}
+static void nvgpu_clk_arb_free_session(struct kref *refcount)
 {
        struct nvgpu_clk_session *session = container_of(refcount,
                        struct nvgpu_clk_session, refcount);
        struct nvgpu_clk_arb *arb = session->g->clk_arb;
+        struct nvgpu_clk_dev *dev, *tmp;
+        struct llist_node *head;
        gk20a_dbg_fn("");
        spin_lock(&arb->sessions_lock);
-        list_del(&session->link);
+        list_del_rcu(&session->link);
        spin_unlock(&arb->sessions_lock);
+        head = llist_del_all(&session->targets);
+        llist_for_each_entry_safe(dev, tmp, head, node) {
+                kref_put(&dev->refcount, nvgpu_clk_arb_free_fd);
+        }
+        synchronize_rcu();
        kfree(session);
-;
 }
 void nvgpu_clk_arb_release_session(struct gk20a *g,
@@ -346,7 +414,7 @@ void nvgpu_clk_arb_release_session(struct gk20a *g,
        session->zombie = true;
        kref_put(&session->refcount, nvgpu_clk_arb_free_session);
-        schedule_work(&arb->update_fn_work);
+        queue_work(arb->update_work_queue, &arb->update_fn_work);
 }
 int nvgpu_clk_arb_install_event_fd(struct gk20a *g,
@@ -363,7 +431,7 @@ int nvgpu_clk_arb_install_event_fd(struct gk20a *g,
                return fd;
        spin_lock(&arb->users_lock);
-        list_add_tail(&dev->link, &arb->users);
+        list_add_tail_rcu(&dev->link, &arb->users);
        spin_unlock(&arb->users_lock);
        *event_fd = fd;
@@ -388,121 +456,159 @@ int nvgpu_clk_arb_install_request_fd(struct gk20a *g,
        return 0;
 }
-static int nvgpu_clk_arb_update_vftable(struct nvgpu_clk_arb *arb)
+static int nvgpu_clk_arb_update_vf_table(struct nvgpu_clk_arb *arb)
 {
        struct gk20a *g = arb->g;
+        struct nvgpu_clk_vf_table *table;
-        int i;
+        int i, j;
        int status = 0;
        u32 gpc2clk_voltuv = 0, mclk_voltuv = 0;
        u32 gpc2clk_voltuv_sram = 0, mclk_voltuv_sram = 0;
+        u16 gpc2clk_min, gpc2clk_max, clk_cur;
+        u16 mclk_min, mclk_max;
+        u32 num_points;
+        table = ACCESS_ONCE(arb->current_vf_table);
+        /* make flag visible when all data has resolved in the tables */
+        smp_rmb();
-        /* the flag must be visible in all threads */
+        table = (table == &arb->vf_table_pool[0]) ? &arb->vf_table_pool[1] :
-        mb();
+                &arb->vf_table_pool[0];
-        ACCESS_ONCE(arb->vftable_set) = false;
-        spin_lock(&arb->vf_lock);
+        /* Get allowed memory ranges */
+        if (nvgpu_clk_arb_get_arbiter_clk_range(g, NVGPU_GPU_CLK_DOMAIN_GPC2CLK,
+                                                &gpc2clk_min, &gpc2clk_max) < 0)
+                goto exit_vf_table;
+        if (nvgpu_clk_arb_get_arbiter_clk_range(g, NVGPU_GPU_CLK_DOMAIN_MCLK,
+                                                &mclk_min, &mclk_max) < 0)
+                goto exit_vf_table;
        if (!clk_domain_get_f_points(arb->g, NVGPU_GPU_CLK_DOMAIN_GPC2CLK,
-                &arb->gpc2clk_f_numpoints, arb->gpc2clk_f_points) < 0) {
+                &table->gpc2clk_num_points, arb->gpc2clk_f_points) < 0) {
                gk20a_err(dev_from_gk20a(g),
                        "failed to fetch GPC2CLK frequency points");
-                goto exit_vftable;
+                goto exit_vf_table;
        }
        if (clk_domain_get_f_points(arb->g, NVGPU_GPU_CLK_DOMAIN_MCLK,
-                &arb->mclk_f_numpoints, arb->mclk_f_points) < 0) {
+                &table->mclk_num_points, arb->mclk_f_points) < 0) {
                gk20a_err(dev_from_gk20a(g),
                        "failed to fetch MCLK frequency points");
-                goto exit_vftable;
+                goto exit_vf_table;
        }
+        memset(table->mclk_points, 0,
+                table->mclk_num_points*sizeof(struct nvgpu_clk_vf_point));
+        memset(table->gpc2clk_points, 0,
+                table->gpc2clk_num_points*sizeof(struct nvgpu_clk_vf_point));
+        for (i = 0, j = 0, num_points = 0, clk_cur = 0;
+                        i < table->mclk_num_points; i++) {
+                if ((arb->mclk_f_points[i] >= mclk_min) &&
+                        (arb->mclk_f_points[i] <= mclk_max) &&
+                        (arb->mclk_f_points[i] != clk_cur)) {
+                        table->mclk_points[j].mhz = arb->mclk_f_points[i];
+                        mclk_voltuv = mclk_voltuv_sram = 0;
+                        status = clk_domain_get_f_or_v(g, CTRL_CLK_DOMAIN_MCLK,
+                                &table->mclk_points[j].mhz, &mclk_voltuv,
+                                CTRL_VOLT_DOMAIN_LOGIC);
+                        if (status < 0) {
+                                gk20a_err(dev_from_gk20a(g),
+                                        "failed to get MCLK LOGIC voltage");
+                                goto exit_vf_table;
+                        }
+                        status = clk_domain_get_f_or_v(g, CTRL_CLK_DOMAIN_MCLK,
+                                &table->mclk_points[j].mhz, &mclk_voltuv_sram,
+                                CTRL_VOLT_DOMAIN_SRAM);
+                        if (status < 0) {
+                                gk20a_err(dev_from_gk20a(g),
+                                        "failed to get MCLK SRAM voltage");
+                                goto exit_vf_table;
+                        }
-        memset(arb->mclk_vf_points, 0,
+                        table->mclk_points[j].uvolt = mclk_voltuv;
-                arb->mclk_f_numpoints*sizeof(struct nvgpu_clk_vf_point));
+                        table->mclk_points[j].uvolt_sram = mclk_voltuv_sram;
-        memset(arb->gpc2clk_vf_points, 0,
+                        clk_cur = table->mclk_points[j].mhz;
-                arb->gpc2clk_f_numpoints*sizeof(struct nvgpu_clk_vf_point));
+                        j++;
+                        num_points++;
-        for (i = 0 ; i < arb->mclk_f_numpoints; i++) {
-                arb->mclk_vf_points[i].mhz = arb->mclk_f_points[i];
-                mclk_voltuv = mclk_voltuv_sram = 0;
-                status = clk_domain_get_f_or_v(g, CTRL_CLK_DOMAIN_MCLK,
-                        &arb->mclk_vf_points[i].mhz, &mclk_voltuv,
-                        CTRL_VOLT_DOMAIN_LOGIC);
-                if (status < 0) {
-                        gk20a_err(dev_from_gk20a(g),
-                                "failed to get MCLK LOGIC voltage");
-                        goto exit_vftable;
-                }
-                status = clk_domain_get_f_or_v(g, CTRL_CLK_DOMAIN_MCLK,
-                        &arb->mclk_vf_points[i].mhz, &mclk_voltuv_sram,
-                        CTRL_VOLT_DOMAIN_SRAM);
-                if (status < 0) {
-                        gk20a_err(dev_from_gk20a(g),
-                                "failed to get MCLK SRAM voltage");
-                        goto exit_vftable;
                }
-                arb->mclk_vf_points[i].uvolt = mclk_voltuv;
-                arb->mclk_vf_points[i].uvolt_sram = mclk_voltuv_sram;
        }
+        table->mclk_num_points = num_points;
+        for (i = 0, j = 0, num_points = 0, clk_cur = 0;
+                        i < table->gpc2clk_num_points; i++) {
+                if ((arb->gpc2clk_f_points[i] >= gpc2clk_min) &&
+                        (arb->gpc2clk_f_points[i] <= gpc2clk_max) &&
+                        (arb->gpc2clk_f_points[i] != clk_cur)) {
+                        table->gpc2clk_points[j].mhz = arb->gpc2clk_f_points[i];
+                        gpc2clk_voltuv = gpc2clk_voltuv_sram = 0;
+                        status = clk_domain_get_f_or_v(g,
+                                CTRL_CLK_DOMAIN_GPC2CLK,
+                                &table->gpc2clk_points[j].mhz, &gpc2clk_voltuv,
+                                CTRL_VOLT_DOMAIN_LOGIC);
+                        if (status < 0) {
+                                gk20a_err(dev_from_gk20a(g),
+                                        "failed to get GPC2CLK LOGIC voltage");
+                                goto exit_vf_table;
+                        }
-        for (i = 0 ; i < arb->gpc2clk_f_numpoints; i++) {
+                        status = clk_domain_get_f_or_v(g,
-                arb->gpc2clk_vf_points[i].mhz = arb->gpc2clk_f_points[i];
+                                CTRL_CLK_DOMAIN_GPC2CLK,
-                gpc2clk_voltuv = gpc2clk_voltuv_sram = 0;
+                                &table->gpc2clk_points[j].mhz,
+                                &gpc2clk_voltuv_sram,
-                status = clk_domain_get_f_or_v(g, CTRL_CLK_DOMAIN_GPC2CLK,
+                                CTRL_VOLT_DOMAIN_SRAM);
-                        &arb->gpc2clk_vf_points[i].mhz, &gpc2clk_voltuv,
+                        if (status < 0) {
-                        CTRL_VOLT_DOMAIN_LOGIC);
+                                gk20a_err(dev_from_gk20a(g),
-                if (status < 0) {
+                                        "failed to get GPC2CLK SRAM voltage");
-                        gk20a_err(dev_from_gk20a(g),
+                                goto exit_vf_table;
-                                "failed to get GPC2CLK LOGIC voltage");
+                        }
-                        goto exit_vftable;
-                }
-                status = clk_domain_get_f_or_v(g, CTRL_CLK_DOMAIN_GPC2CLK,
-                        &arb->gpc2clk_vf_points[i].mhz, &gpc2clk_voltuv_sram,
-                        CTRL_VOLT_DOMAIN_SRAM);
-                if (status < 0) {
-                        gk20a_err(dev_from_gk20a(g),
-                                "failed to get GPC2CLK SRAM voltage");
-                        goto exit_vftable;
-                }
-                arb->gpc2clk_vf_points[i].uvolt = gpc2clk_voltuv;
-                arb->gpc2clk_vf_points[i].uvolt_sram = gpc2clk_voltuv_sram;
+                        table->gpc2clk_points[j].uvolt = gpc2clk_voltuv;
+                        table->gpc2clk_points[j].uvolt_sram =
+                                gpc2clk_voltuv_sram;
+                        clk_cur = table->gpc2clk_points[j].mhz;
+                        j++;
+                        num_points++;
+                }
        }
+        table->gpc2clk_num_points = num_points;
-        /* make flag visible when all data has resolved in the tables */
+        /* make table visible when all data has resolved in the tables */
-        wmb();
+        smp_wmb();
-        ACCESS_ONCE(arb->vftable_set) = true;
+        xchg(&arb->current_vf_table, table);
-        wake_up(&arb->vftable_wq);
-exit_vftable:
-        spin_unlock(&arb->vf_lock);
+        queue_work(arb->update_work_queue, &arb->update_fn_work);
+exit_vf_table:
        return status;
 }
-void nvgpu_clk_arb_schedule_vftable_update(struct gk20a *g)
+void nvgpu_clk_arb_schedule_vf_table_update(struct gk20a *g)
 {
        struct nvgpu_clk_arb *arb = g->clk_arb;
-        ACCESS_ONCE(arb->vftable_set) = false;
+        queue_work(arb->vf_table_work_queue, &arb->vf_table_fn_work);
-        /* Disable the flag in case arbiter gets scheduled first */
-        mb();
-        schedule_work(&arb->vftable_fn_work);
-        schedule_work(&arb->update_fn_work);
 }
-static void nvgpu_clk_arb_run_vftable_cb(struct work_struct *work)
+static void nvgpu_clk_arb_run_vf_table_cb(struct work_struct *work)
 {
        struct nvgpu_clk_arb *arb =
-                container_of(work, struct nvgpu_clk_arb, update_fn_work);
+                container_of(work, struct nvgpu_clk_arb, vf_table_fn_work);
+        struct gk20a *g = arb->g;
+        u32 err;
-        nvgpu_clk_arb_update_vftable(arb);
+        /* get latest vf curve from pmu */
+        err = clk_vf_point_cache(g);
+        if (err) {
+                gk20a_err(dev_from_gk20a(g),
+                        "failed to get GPC2CLK SRAM voltage");
+                return;
+        }
+        nvgpu_clk_arb_update_vf_table(arb);
 }
 static void nvgpu_clk_arb_run_arbiter_cb(struct work_struct *work)
@@ -512,24 +618,22 @@ static void nvgpu_clk_arb_run_arbiter_cb(struct work_struct *work)
        struct nvgpu_clk_session *session;
        struct nvgpu_clk_dev *dev;
        struct nvgpu_clk_dev *tmp;
+        struct nvgpu_clk_arb_target *target, *actual;
        struct gk20a *g = arb->g;
+        struct llist_node *head;
-        struct change_fll_clk fllclk;
-        u32 gpc2clk_voltuv = 0, mclk_voltuv = 0;
-        u32 gpc2clk_voltuv_sram = 0, mclk_voltuv_sram = 0;
        u32 voltuv, voltuv_sram;
+        bool mclk_set, gpc2clk_set;
        int status;
        /* Temporary variables for checking target frequency */
        u16 gpc2clk_target, mclk_target;
-        /* iteration index */
-        u32 index;
 #ifdef CONFIG_DEBUG_FS
        u64 t0, t1;
+        struct nvgpu_clk_arb_debug *debug;
 #endif
        gk20a_dbg_fn("");
@@ -542,37 +646,61 @@ static void nvgpu_clk_arb_run_arbiter_cb(struct work_struct *work)
        gpc2clk_target = 0;
        mclk_target = 0;
-        spin_lock(&arb->sessions_lock);
+        rcu_read_lock();
-        list_for_each_entry(session, &arb->sessions, link) {
+        list_for_each_entry_rcu(session, &arb->sessions, link) {
                if (!session->zombie) {
-                        spin_lock(&arb->req_lock);
+                        mclk_set = false;
-                        spin_lock(&session->target_lock);
+                        gpc2clk_set = false;
+                        target = ACCESS_ONCE(session->target) ==
+                                &session->target_pool[0] ?
+                                        &session->target_pool[1] :
+                                        &session->target_pool[0];
+                        /* Do not reorder pointer */
+                        smp_rmb();
+                        head = llist_del_all(&session->targets);
+                        if (head) {
+                                /* Copy over state */
+                                target->mclk = session->target->mclk;
+                                target->gpc2clk = session->target->gpc2clk;
+                                /* Query the latest committed request */
+                                llist_for_each_entry_safe(dev, tmp, head,
+                                                                        node) {
+                                        if (!mclk_set && dev->mclk_target_mhz) {
+                                                target->mclk =
+                                                        dev->mclk_target_mhz;
+                                                mclk_set = true;
+                                        }
+                                        if (!gpc2clk_set &&
+                                                dev->gpc2clk_target_mhz) {
+                                                target->gpc2clk =
+                                                        dev->gpc2clk_target_mhz;
+                                                gpc2clk_set = true;
+                                        }
+                                        kref_get(&dev->refcount);
+                                        llist_add(&dev->node, &arb->requests);
+                                }
+                                /* Ensure target is updated before ptr sawp */
+                                smp_wmb();
+                                xchg(&session->target, target);
+                        }
-                        mclk_target = mclk_target > session->mclk_target_mhz ?
+                        mclk_target = mclk_target > session->target->mclk ?
-                                mclk_target : session->mclk_target_mhz;
+                                mclk_target : session->target->mclk;
                        gpc2clk_target =
-                                gpc2clk_target > session->gpc2clk_target_mhz ?
+                                gpc2clk_target > session->target->gpc2clk ?
-                                gpc2clk_target : session->gpc2clk_target_mhz;
+                                gpc2clk_target : session->target->gpc2clk;
-                        /* Move processed requests to notification list*/
-                        list_for_each_entry_safe(dev, tmp, &session->targets,
-                                                link) {
-                                list_del_init(&dev->link);
-                                list_add_tail(&dev->link, &arb->requests);
-                        }
-                        spin_unlock(&session->target_lock);
-                        spin_unlock(&arb->req_lock);
                }
        }
-        spin_unlock(&arb->sessions_lock);
+        rcu_read_unlock();
        gpc2clk_target = (gpc2clk_target > 0) ? gpc2clk_target :
-                arb->gpc2clk_actual_mhz ? gpc2clk_target :
+                arb->actual->gpc2clk ? gpc2clk_target :
                arb->gpc2clk_default_mhz;
        mclk_target = (mclk_target > 0) ? mclk_target :
-                arb->mclk_actual_mhz ? mclk_target :
+                arb->actual->mclk ? mclk_target :
                arb->mclk_default_mhz;
        if (!gpc2clk_target && !mclk_target) {
@@ -581,163 +709,100 @@ static void nvgpu_clk_arb_run_arbiter_cb(struct work_struct *work)
        }
        if (!gpc2clk_target)
-                gpc2clk_target = arb->gpc2clk_actual_mhz;
+                gpc2clk_target = arb->actual->mclk;
-        do {
+        if (!mclk_target)
-                /* Check that the table is set */
+                mclk_target = arb->actual->mclk;
-                mb();
-                wait_event(arb->vftable_wq, arb->vftable_set);
-        } while (!ACCESS_ONCE(arb->vftable_set));
-        spin_lock(&arb->vf_lock);
-        /* round up the freq requests */
-        for (index = 0; index < arb->gpc2clk_f_numpoints; index++) {
-                if (arb->gpc2clk_vf_points[index].mhz >= gpc2clk_target) {
-                        gpc2clk_target = arb->gpc2clk_vf_points[index].mhz;
-                        gpc2clk_voltuv = arb->gpc2clk_vf_points[index].uvolt;
-                        gpc2clk_voltuv_sram =
-                                arb->gpc2clk_vf_points[index].uvolt_sram;
-                        break;
-                }
-        }
-        if (index == arb->gpc2clk_f_numpoints) {
-                gpc2clk_target = arb->gpc2clk_vf_points[index].mhz;
-                gpc2clk_voltuv = arb->gpc2clk_vf_points[index].uvolt;
-                gpc2clk_voltuv_sram =
-                        arb->gpc2clk_vf_points[index].uvolt_sram;
-        }
-        if (!mclk_target)
+        /* Query the table for the closest vf point to program */
-                mclk_target = arb->mclk_actual_mhz;
+        nvgpu_clk_arb_find_vf_point(arb, &gpc2clk_target, &mclk_target, &voltuv,
+                &voltuv_sram);
-        for (index = 0; index < arb->mclk_f_numpoints; index++) {
+        if ((arb->actual->gpc2clk == gpc2clk_target) &&
-                if (arb->mclk_vf_points[index].mhz >= mclk_target) {
+                (arb->actual->mclk == mclk_target) &&
-                        mclk_target = arb->mclk_vf_points[index].mhz;
+                (arb->voltuv_actual == voltuv)) {
-                        mclk_voltuv = arb->mclk_vf_points[index].uvolt;
+                goto exit_arb;
-                        mclk_voltuv_sram =
-                                arb->mclk_vf_points[index].uvolt_sram;
-                        break;
-                }
-        }
-        if (index == arb->mclk_f_numpoints) {
-                mclk_target = arb->mclk_vf_points[index].mhz;
-                mclk_voltuv = arb->mclk_vf_points[index].uvolt;
-                mclk_voltuv_sram =
-                        arb->mclk_vf_points[index].uvolt_sram;
        }
-        spin_unlock(&arb->vf_lock);
        /* Program clocks */
        /* A change in both mclk of gpc2clk may require a change in voltage */
-        if ((arb->gpc2clk_actual_mhz == gpc2clk_target) &&
-                (arb->mclk_actual_mhz == mclk_target)) {
-                goto exit_arb;
-        }
-        voltuv = gpc2clk_voltuv > mclk_voltuv ? gpc2clk_voltuv : mclk_voltuv;
-        voltuv_sram = gpc2clk_voltuv_sram > mclk_voltuv_sram ?
-                gpc2clk_voltuv_sram : mclk_voltuv_sram;
-        /* if voltage ascends we do:
+        status = nvgpu_clk_arb_change_vf_point(g, gpc2clk_target, mclk_target,
-         * (1) FLL change
+                voltuv, voltuv_sram);
-         * (2) Voltage change
-         * (3) MCLK change
-         * If it goes down
-         * (1) MCLK change
-         * (2) Voltage change
-         * (3) FLL change
-         */
-        /* descending */
+        if (status < 0)
-        if (voltuv <= arb->voltuv_actual) {
+                goto exit_arb;
-                status = g->clk_pmu.clk_mclk.change(g, mclk_target);
-                if (status < 0)
-                        goto exit_arb;
-                status = volt_set_voltage(g, voltuv, voltuv_sram);
+        actual = ACCESS_ONCE(arb->actual) == &arb->actual_pool[0] ?
-                if (status < 0)
+                        &arb->actual_pool[1] : &arb->actual_pool[0];
-                        goto exit_arb;
-                fllclk.api_clk_domain = CTRL_CLK_DOMAIN_GPC2CLK;
+        /* do not reorder this pointer */
-                fllclk.clkmhz = gpc2clk_target;
+        smp_rmb();
-                fllclk.voltuv = voltuv;
+        actual->gpc2clk = gpc2clk_target;
-                status = clk_program_fll_clks(g, &fllclk);
+        actual->mclk = mclk_target;
-                if (status < 0)
+        arb->voltuv_actual = voltuv;
-                        goto exit_arb;
-        } else {
-                fllclk.api_clk_domain = CTRL_CLK_DOMAIN_GPC2CLK;
-                fllclk.clkmhz = gpc2clk_target;
-                fllclk.voltuv = voltuv;
-                status = clk_program_fll_clks(g, &fllclk);
-                if (status < 0)
-                        goto exit_arb;
-                status = volt_set_voltage(g, voltuv, voltuv_sram);
+        /* Make changes visible to other threads */
-                if (status < 0)
+        smp_wmb();
-                        goto exit_arb;
+        xchg(&arb->actual, actual);
-                status = g->clk_pmu.clk_mclk.change(g, mclk_target);
+        atomic_inc(&arb->req_nr);
-                if (status < 0)
-                        goto exit_arb;
-        }
-        spin_lock(&arb->data_lock);
+        wake_up_interruptible(&arb->request_wq);
-        arb->gpc2clk_actual_mhz = gpc2clk_target;
-        arb->mclk_actual_mhz = mclk_target;
-        arb->voltuv_actual = voltuv;
-        /* Make changes visible to other threads */
-        wmb();
-        spin_unlock(&arb->data_lock);
 #ifdef CONFIG_DEBUG_FS
        g->ops.read_ptimer(g, &t1);
-        arb->switch_num++;
-        mutex_lock(&arb->debug_lock);
+        debug = arb->debug == &arb->debug_pool[0] ?
-        if (arb->switch_num == 1) {
+                &arb->debug_pool[1] : &arb->debug_pool[0];
-                arb->switch_max = arb->switch_min =
-                        arb->switch_avg = (t1-t0)/1000;
+        memcpy(debug, arb->debug, sizeof(arb->debug_pool[0]));
-                arb->switch_std = 0;
+        debug->switch_num++;
+        if (debug->switch_num == 1) {
+                debug->switch_max = debug->switch_min =
+                        debug->switch_avg = (t1-t0)/1000;
+                debug->switch_std = 0;
        } else {
                s64 prev_avg;
                u64 curr = (t1-t0)/1000;
-                arb->switch_max = curr > arb->switch_max ?
+                debug->switch_max = curr > debug->switch_max ?
-                        curr : arb->switch_max;
+                        curr : debug->switch_max;
-                arb->switch_min = arb->switch_min ?
+                debug->switch_min = debug->switch_min ?
-                        (curr < arb->switch_min ?
+                        (curr < debug->switch_min ?
-                                curr : arb->switch_min) : curr;
+                                curr : debug->switch_min) : curr;
-                prev_avg = arb->switch_avg;
+                prev_avg = debug->switch_avg;
-                arb->switch_avg = (curr +
+                debug->switch_avg = (curr +
-                        (arb->switch_avg * (arb->switch_num-1))) /
+                        (debug->switch_avg * (debug->switch_num-1))) /
-                        arb->switch_num;
+                        debug->switch_num;
-                arb->switch_std +=
+                debug->switch_std +=
-                        (curr - arb->switch_avg) * (curr - prev_avg);
+                        (curr - debug->switch_avg) * (curr - prev_avg);
        }
-        mutex_unlock(&arb->debug_lock);
+        /* commit changes before exchanging debug pointer */
+        smp_wmb();
+        xchg(&arb->debug, debug);
 #endif
 exit_arb:
-        spin_lock(&arb->req_lock);
        /* notify completion for all requests */
-        list_for_each_entry_safe(dev, tmp, &arb->requests, link) {
+        head = llist_del_all(&arb->requests);
+        llist_for_each_entry_safe(dev, tmp, head, node) {
                atomic_set(&dev->poll_mask, POLLIN | POLLRDNORM);
                wake_up_interruptible(&dev->readout_wq);
-                list_del_init(&dev->link);
+                kref_put(&dev->refcount, nvgpu_clk_arb_free_fd);
        }
-        spin_unlock(&arb->req_lock);
        /* notify event for all users */
-        spin_lock(&arb->users_lock);
+        rcu_read_lock();
-        list_for_each_entry(dev, &arb->users, link) {
+        list_for_each_entry_rcu(dev, &arb->users, link) {
                atomic_set(&dev->poll_mask, POLLIN | POLLRDNORM);
                wake_up_interruptible(&dev->readout_wq);
        }
-        spin_unlock(&arb->users_lock);
+        rcu_read_unlock();
 }
 int nvgpu_clk_arb_commit_request_fd(struct gk20a *g,
@@ -761,17 +826,10 @@ int nvgpu_clk_arb_commit_request_fd(struct gk20a *g,
                err = -EINVAL;
                goto fdput_fd;
        }
-        spin_lock(&session->target_lock);
+        kref_get(&dev->refcount);
-        session->mclk_target_mhz = dev->mclk_target_mhz ? dev->mclk_target_mhz :
+        llist_add(&dev->node, &session->targets);
-                session->mclk_target_mhz;
-        session->gpc2clk_target_mhz = dev->gpc2clk_target_mhz ?
-                dev->gpc2clk_target_mhz :
-                session->gpc2clk_target_mhz;
-        list_add_tail(&dev->link, &session->targets);
-        spin_unlock(&session->target_lock);
-        schedule_work(&arb->update_fn_work);
+        queue_work(arb->update_work_queue, &arb->update_fn_work);
 fdput_fd:
        fdput(fd);
@@ -799,15 +857,8 @@ static int nvgpu_clk_arb_release_completion_dev(struct inode *inode,
        gk20a_dbg_fn("");
-        spin_lock(&arb->req_lock);
-        spin_lock(&session->target_lock);
-        if (!list_empty(&dev->link))
-                list_del_init(&dev->link);
-        spin_unlock(&session->target_lock);
-        spin_unlock(&arb->req_lock);
        kref_put(&session->refcount, nvgpu_clk_arb_free_session);
-        kfree(dev);
+        kref_put(&dev->refcount, nvgpu_clk_arb_free_fd);
        return 0;
 }
@@ -824,10 +875,11 @@ static int nvgpu_clk_arb_release_event_dev(struct inode *inode,
        gk20a_dbg_fn("");
        spin_lock(&arb->users_lock);
-        list_del(&dev->link);
+        list_del_rcu(&dev->link);
        spin_unlock(&arb->users_lock);
        kref_put(&session->refcount, nvgpu_clk_arb_free_session);
+        synchronize_rcu();
        kfree(dev);
        return 0;
@@ -875,24 +927,27 @@ int nvgpu_clk_arb_get_session_target_mhz(struct nvgpu_clk_session *session,
                u32 api_domain, u16 *freq_mhz)
 {
        int err = 0;
+        struct nvgpu_clk_arb_target *target;
-        spin_lock(&session->target_lock);
+        do {
+                target = ACCESS_ONCE(session->target);
-        switch (api_domain) {
+                /* no reordering of this pointer */
-        case NVGPU_GPU_CLK_DOMAIN_MCLK:
+                smp_rmb();
-                *freq_mhz = session->mclk_target_mhz;
-                break;
-        case NVGPU_GPU_CLK_DOMAIN_GPC2CLK:
+                switch (api_domain) {
-                *freq_mhz = session->gpc2clk_target_mhz;
+                case NVGPU_GPU_CLK_DOMAIN_MCLK:
-                break;
+                        *freq_mhz = target->mclk;
+                        break;
-        default:
+                case NVGPU_GPU_CLK_DOMAIN_GPC2CLK:
-                *freq_mhz = 0;
+                        *freq_mhz = target->gpc2clk;
-                err = -EINVAL;
+                        break;
-        }
-        spin_unlock(&session->target_lock);
+                default:
+                        *freq_mhz = 0;
+                        err = -EINVAL;
+                }
+        } while (target != ACCESS_ONCE(session->target));
        return err;
 }
@@ -901,24 +956,27 @@ int nvgpu_clk_arb_get_arbiter_actual_mhz(struct gk20a *g,
 {
        struct nvgpu_clk_arb *arb = g->clk_arb;
        int err = 0;
+        struct nvgpu_clk_arb_target *actual;
-        spin_lock(&arb->data_lock);
+        do {
+                actual = ACCESS_ONCE(arb->actual);
-        switch (api_domain) {
+                /* no reordering of this pointer */
-        case NVGPU_GPU_CLK_DOMAIN_MCLK:
+                smp_rmb();
-                *freq_mhz = arb->mclk_actual_mhz;
-                break;
-        case NVGPU_GPU_CLK_DOMAIN_GPC2CLK:
+                switch (api_domain) {
-                *freq_mhz = arb->gpc2clk_actual_mhz;
+                case NVGPU_GPU_CLK_DOMAIN_MCLK:
-                break;
+                        *freq_mhz = actual->mclk;
+                        break;
-        default:
+                case NVGPU_GPU_CLK_DOMAIN_GPC2CLK:
-                *freq_mhz = 0;
+                        *freq_mhz = actual->gpc2clk;
-                err = -EINVAL;
+                        break;
-        }
-        spin_unlock(&arb->data_lock);
+                default:
+                        *freq_mhz = 0;
+                        err = -EINVAL;
+                }
+        } while (actual != ACCESS_ONCE(arb->actual));
        return err;
 }
@@ -948,22 +1006,163 @@ int nvgpu_clk_arb_get_arbiter_clk_f_points(struct gk20a *g,
        return (int)clk_domain_get_f_points(g, api_domain, max_points, fpoints);
 }
+static void nvgpu_clk_arb_find_vf_point(struct nvgpu_clk_arb *arb,
+                u16 *gpc2clk, u16 *mclk, u32 *voltuv,
+                u32 *voltuv_sram)
+{
+        u16 gpc2clk_target, mclk_target;
+        u32 gpc2clk_voltuv, gpc2clk_voltuv_sram;
+        u32 mclk_voltuv, mclk_voltuv_sram;
+        struct nvgpu_clk_vf_table *table;
+        int index;
+        gpc2clk_target = *gpc2clk;
+        mclk_target = *mclk;
+        gpc2clk_voltuv = 0;
+        gpc2clk_voltuv_sram = 0;
+        mclk_voltuv = 0;
+        mclk_voltuv_sram = 0;
+        do {
+                table = ACCESS_ONCE(arb->current_vf_table);
+                /* pointer to table can be updated by callback */
+                smp_rmb();
+                if (!table)
+                        continue;
+                /* round up the freq requests */
+                for (index = 0; index < table->gpc2clk_num_points; index++) {
+                        if (table->gpc2clk_points[index].mhz >=
+                        gpc2clk_target) {
+                                gpc2clk_target =
+                                        table->gpc2clk_points[index].mhz;
+                                gpc2clk_voltuv =
+                                        table->gpc2clk_points[index].uvolt;
+                                gpc2clk_voltuv_sram =
+                                        table->gpc2clk_points[index].uvolt_sram;
+                                break;
+                        }
+                }
+                if (index == table->gpc2clk_num_points) {
+                        gpc2clk_target = table->gpc2clk_points[index].mhz;
+                        gpc2clk_voltuv = table->gpc2clk_points[index].uvolt;
+                        gpc2clk_voltuv_sram =
+                                table->gpc2clk_points[index].uvolt_sram;
+                }
+                for (index = 0; index < table->mclk_num_points; index++) {
+                        if (table->mclk_points[index].mhz >= mclk_target) {
+                                mclk_target = table->mclk_points[index].mhz;
+                                mclk_voltuv = table->mclk_points[index].uvolt;
+                                mclk_voltuv_sram =
+                                        table->mclk_points[index].uvolt_sram;
+                                break;
+                        }
+                }
+                if (index == table->mclk_num_points) {
+                        mclk_target = table->mclk_points[index].mhz;
+                        mclk_voltuv = table->mclk_points[index].uvolt;
+                        mclk_voltuv_sram =
+                                table->mclk_points[index].uvolt_sram;
+                }
+        } while (!table ||
+                (ACCESS_ONCE(arb->current_vf_table) != table));
+        *voltuv = gpc2clk_voltuv > mclk_voltuv ? gpc2clk_voltuv : mclk_voltuv;
+        *voltuv_sram = gpc2clk_voltuv_sram > mclk_voltuv_sram ?
+                gpc2clk_voltuv_sram : mclk_voltuv_sram;
+        *gpc2clk = gpc2clk_target;
+        *mclk = mclk_target;
+}
+static int nvgpu_clk_arb_change_vf_point(struct gk20a *g, u16 gpc2clk_target,
+        u16 mclk_target, u32 voltuv, u32 voltuv_sram)
+{
+        struct change_fll_clk fllclk;
+        struct nvgpu_clk_arb *arb = g->clk_arb;
+        int status;
+        /* if voltage ascends we do:
+         * (1) FLL change
+         * (2) Voltage change
+         * (3) MCLK change
+         * If it goes down
+         * (1) MCLK change
+         * (2) Voltage change
+         * (3) FLL change
+         */
+        /* descending */
+        if (voltuv < arb->voltuv_actual) {
+                status = g->clk_pmu.clk_mclk.change(g, mclk_target);
+                if (status < 0)
+                        return status;
+                status = volt_set_voltage(g, voltuv, voltuv_sram);
+                if (status < 0)
+                        return status;
+                fllclk.api_clk_domain = CTRL_CLK_DOMAIN_GPC2CLK;
+                fllclk.clkmhz = gpc2clk_target;
+                fllclk.voltuv = voltuv;
+                status = clk_program_fll_clks(g, &fllclk);
+                if (status < 0)
+                        return status;
+        } else if (voltuv > arb->voltuv_actual) {
+                fllclk.api_clk_domain = CTRL_CLK_DOMAIN_GPC2CLK;
+                fllclk.clkmhz = gpc2clk_target;
+                fllclk.voltuv = voltuv;
+                status = clk_program_fll_clks(g, &fllclk);
+                if (status < 0)
+                        return status;
+                status = volt_set_voltage(g, voltuv, voltuv_sram);
+                if (status < 0)
+                        return status;
+                status = g->clk_pmu.clk_mclk.change(g, mclk_target);
+                if (status < 0)
+                        return status;
+        } else {
+                status = g->clk_pmu.clk_mclk.change(g, mclk_target);
+                if (status < 0)
+                        return status;
+                fllclk.api_clk_domain = CTRL_CLK_DOMAIN_GPC2CLK;
+                fllclk.clkmhz = gpc2clk_target;
+                fllclk.voltuv = voltuv;
+                status = clk_program_fll_clks(g, &fllclk);
+                if (status < 0)
+                        return status;
+        }
+        return 0;
+}
 #ifdef CONFIG_DEBUG_FS
 static int nvgpu_clk_arb_stats_show(struct seq_file *s, void *unused)
 {
        struct gk20a *g = s->private;
        struct nvgpu_clk_arb *arb = g->clk_arb;
+        struct nvgpu_clk_arb_debug *debug;
        u64 num;
        s64 tmp, avg, std, max, min;
-        /* Make copy of structure to reduce time with lock held */
+        debug = ACCESS_ONCE(arb->debug);
-        mutex_lock(&arb->debug_lock);
+        /* Make copy of structure and ensure no reordering */
-        std = arb->switch_std;
+        smp_rmb();
-        avg = arb->switch_avg;
+        if (!debug)
-        max = arb->switch_max;
+                return -EINVAL;
-        min = arb->switch_min;
-        num = arb->switch_num;
+        std = debug->switch_std;
-        mutex_unlock(&arb->debug_lock);
+        avg = debug->switch_avg;
+        max = debug->switch_max;
+        min = debug->switch_min;
+        num = debug->switch_num;
        tmp = std;
        do_div(tmp, num);
diff --git a/drivers/gpu/nvgpu/pstate/pstate.c b/drivers/gpu/nvgpu/pstate/pstate.c
index f01b52ad..cf758023 100644
--- a/drivers/gpu/nvgpu/pstate/pstate.c
+++ b/drivers/gpu/nvgpu/pstate/pstate.c
@@ -149,10 +149,6 @@ int gk20a_init_pstate_pmu_support(struct gk20a *g)
        if (err)
                return err;
-        err = clk_vf_point_cache(g);
-        if (err)
-                return err;
        err = pmgr_domain_pmu_setup(g);
        return err;
 }