padata: Fix race on sequence number wrap

When padata_do_parallel() is called from multiple cpus for the same padata instance, we can get object reordering on sequence number wrap because testing for sequence number wrap and reseting the sequence number must happen atomically but is implemented with two atomic operations. This patch fixes this by converting the sequence number from atomic_t to an unsigned int and protect the access with a spin_lock. As a side effect, we get rid of the sequence number wrap handling because the seqence number wraps back to null now without the need to do anything. Signed-off-by: Steffen Klassert <steffen.klassert@secunet.com> Signed-off-by: Herbert Xu <herbert@gondor.apana.org.au>
author: Steffen Klassert <steffen.klassert@secunet.com> 2012-03-09 01:20:49 -0500
committer: Herbert Xu <herbert@gondor.apana.org.au> 2012-03-14 05:25:56 -0400
commit: 2dc9b5dbdef09840de852a4f0cc6a9c9eece7220 (patch)
tree: 4164272ddddfc2477005866ce3261c76470c0d1a /kernel/padata.c
parent: 3047817b894ddae62be07787bc8735a616104398 (diff)
1 files changed, 10 insertions, 28 deletions
diff --git a/kernel/padata.c b/kernel/padata.c
index aa9929545855..6f10eb285ece 100644
--- a/kernel/padata.c
+++ b/kernel/padata.c
@@ -29,7 +29,6 @@
 #include <linux/sysfs.h>
 #include <linux/rcupdate.h>
-#define MAX_SEQ_NR (INT_MAX - NR_CPUS)
 #define MAX_OBJ_NUM 1000
 static int padata_index_to_cpu(struct parallel_data *pd, int cpu_index)
@@ -43,18 +42,19 @@ static int padata_index_to_cpu(struct parallel_data *pd, int cpu_index)
        return target_cpu;
 }
-static int padata_cpu_hash(struct padata_priv *padata)
+static int padata_cpu_hash(struct parallel_data *pd)
 {
        int cpu_index;
-        struct parallel_data *pd;
-        pd =  padata->pd;
        /*
         * Hash the sequence numbers to the cpus by taking
         * seq_nr mod. number of cpus in use.
         */
-        cpu_index =  padata->seq_nr % cpumask_weight(pd->cpumask.pcpu);
+        spin_lock(&pd->seq_lock);
+        cpu_index =  pd->seq_nr % cpumask_weight(pd->cpumask.pcpu);
+        pd->seq_nr++;
+        spin_unlock(&pd->seq_lock);
        return padata_index_to_cpu(pd, cpu_index);
 }
@@ -132,12 +132,7 @@ int padata_do_parallel(struct padata_instance *pinst,
        padata->pd = pd;
        padata->cb_cpu = cb_cpu;
-        if (unlikely(atomic_read(&pd->seq_nr) == pd->max_seq_nr))
+        target_cpu = padata_cpu_hash(pd);
-                atomic_set(&pd->seq_nr, -1);
-        padata->seq_nr = atomic_inc_return(&pd->seq_nr);
-        target_cpu = padata_cpu_hash(padata);
        queue = per_cpu_ptr(pd->pqueue, target_cpu);
        spin_lock(&queue->parallel.lock);
@@ -173,7 +168,7 @@ EXPORT_SYMBOL(padata_do_parallel);
 static struct padata_priv *padata_get_next(struct parallel_data *pd)
 {
        int cpu, num_cpus;
-        int next_nr, next_index;
+        unsigned int next_nr, next_index;
        struct padata_parallel_queue *queue, *next_queue;
        struct padata_priv *padata;
        struct padata_list *reorder;
@@ -189,14 +184,6 @@ static struct padata_priv *padata_get_next(struct parallel_data *pd)
        cpu = padata_index_to_cpu(pd, next_index);
        next_queue = per_cpu_ptr(pd->pqueue, cpu);
-        if (unlikely(next_nr > pd->max_seq_nr)) {
-                next_nr = next_nr - pd->max_seq_nr - 1;
-                next_index = next_nr % num_cpus;
-                cpu = padata_index_to_cpu(pd, next_index);
-                next_queue = per_cpu_ptr(pd->pqueue, cpu);
-                pd->processed = 0;
-        }
        padata = NULL;
        reorder = &next_queue->reorder;
@@ -205,8 +192,6 @@ static struct padata_priv *padata_get_next(struct parallel_data *pd)
                padata = list_entry(reorder->list.next,
                                    struct padata_priv, list);
-                BUG_ON(next_nr != padata->seq_nr);
                spin_lock(&reorder->lock);
                list_del_init(&padata->list);
                atomic_dec(&pd->reorder_objects);
@@ -402,7 +387,7 @@ static void padata_init_squeues(struct parallel_data *pd)
 /* Initialize all percpu queues used by parallel workers */
 static void padata_init_pqueues(struct parallel_data *pd)
 {
-        int cpu_index, num_cpus, cpu;
+        int cpu_index, cpu;
        struct padata_parallel_queue *pqueue;
        cpu_index = 0;
@@ -417,9 +402,6 @@ static void padata_init_pqueues(struct parallel_data *pd)
                INIT_WORK(&pqueue->work, padata_parallel_worker);
                atomic_set(&pqueue->num_obj, 0);
        }
-        num_cpus = cpumask_weight(pd->cpumask.pcpu);
-        pd->max_seq_nr = num_cpus ? (MAX_SEQ_NR / num_cpus) * num_cpus - 1 : 0;
 }
 /* Allocate and initialize the internal cpumask dependend resources. */
@@ -446,7 +428,7 @@ static struct parallel_data *padata_alloc_pd(struct padata_instance *pinst,
        padata_init_pqueues(pd);
        padata_init_squeues(pd);
        setup_timer(&pd->timer, padata_reorder_timer, (unsigned long)pd);
-        atomic_set(&pd->seq_nr, -1);
+        pd->seq_nr = 0;
        atomic_set(&pd->reorder_objects, 0);
        atomic_set(&pd->refcnt, 0);
        pd->pinst = pinst;
author	Steffen Klassert <steffen.klassert@secunet.com>	2012-03-09 01:20:49 -0500
committer	Herbert Xu <herbert@gondor.apana.org.au>	2012-03-14 05:25:56 -0400
commit	2dc9b5dbdef09840de852a4f0cc6a9c9eece7220 (patch)
tree	4164272ddddfc2477005866ce3261c76470c0d1a /kernel/padata.c
parent	3047817b894ddae62be07787bc8735a616104398 (diff)

diff --git a/kernel/padata.c b/kernel/padata.c index aa9929545855..6f10eb285ece 100644 --- a/kernel/padata.c +++ b/kernel/padata.c
@@ -29,7 +29,6 @@
29	#include <linux/sysfs.h>	29	#include <linux/sysfs.h>
30	#include <linux/rcupdate.h>	30	#include <linux/rcupdate.h>
31		31
32	#define MAX_SEQ_NR (INT_MAX - NR_CPUS)
33	#define MAX_OBJ_NUM 1000	32	#define MAX_OBJ_NUM 1000
34		33
35	static int padata_index_to_cpu(struct parallel_data *pd, int cpu_index)	34	static int padata_index_to_cpu(struct parallel_data *pd, int cpu_index)
@@ -43,18 +42,19 @@ static int padata_index_to_cpu(struct parallel_data *pd, int cpu_index)
43	return target_cpu;	42	return target_cpu;
44	}	43	}
45		44
46	static int padata_cpu_hash(struct padata_priv *padata)	45	static int padata_cpu_hash(struct parallel_data *pd)
47	{	46	{
48	int cpu_index;	47	int cpu_index;
49	struct parallel_data *pd;
50
51	pd = padata->pd;
52		48
53	/*	49	/*
54	* Hash the sequence numbers to the cpus by taking	50	* Hash the sequence numbers to the cpus by taking
55	* seq_nr mod. number of cpus in use.	51	* seq_nr mod. number of cpus in use.
56	*/	52	*/
57	cpu_index = padata->seq_nr % cpumask_weight(pd->cpumask.pcpu);	53
		54	spin_lock(&pd->seq_lock);
		55	cpu_index = pd->seq_nr % cpumask_weight(pd->cpumask.pcpu);
		56	pd->seq_nr++;
		57	spin_unlock(&pd->seq_lock);
58		58
59	return padata_index_to_cpu(pd, cpu_index);	59	return padata_index_to_cpu(pd, cpu_index);
60	}	60	}
@@ -132,12 +132,7 @@ int padata_do_parallel(struct padata_instance *pinst,
132	padata->pd = pd;	132	padata->pd = pd;
133	padata->cb_cpu = cb_cpu;	133	padata->cb_cpu = cb_cpu;
134		134
135	if (unlikely(atomic_read(&pd->seq_nr) == pd->max_seq_nr))	135	target_cpu = padata_cpu_hash(pd);
136	atomic_set(&pd->seq_nr, -1);
137
138	padata->seq_nr = atomic_inc_return(&pd->seq_nr);
139
140	target_cpu = padata_cpu_hash(padata);
141	queue = per_cpu_ptr(pd->pqueue, target_cpu);	136	queue = per_cpu_ptr(pd->pqueue, target_cpu);
142		137
143	spin_lock(&queue->parallel.lock);	138	spin_lock(&queue->parallel.lock);
@@ -173,7 +168,7 @@ EXPORT_SYMBOL(padata_do_parallel);
173	static struct padata_priv padata_get_next(struct parallel_data pd)	168	static struct padata_priv padata_get_next(struct parallel_data pd)
174	{	169	{
175	int cpu, num_cpus;	170	int cpu, num_cpus;
176	int next_nr, next_index;	171	unsigned int next_nr, next_index;
177	struct padata_parallel_queue queue, next_queue;	172	struct padata_parallel_queue queue, next_queue;
178	struct padata_priv *padata;	173	struct padata_priv *padata;
179	struct padata_list *reorder;	174	struct padata_list *reorder;
@@ -189,14 +184,6 @@ static struct padata_priv padata_get_next(struct parallel_data pd)
189	cpu = padata_index_to_cpu(pd, next_index);	184	cpu = padata_index_to_cpu(pd, next_index);
190	next_queue = per_cpu_ptr(pd->pqueue, cpu);	185	next_queue = per_cpu_ptr(pd->pqueue, cpu);
191		186
192	if (unlikely(next_nr > pd->max_seq_nr)) {
193	next_nr = next_nr - pd->max_seq_nr - 1;
194	next_index = next_nr % num_cpus;
195	cpu = padata_index_to_cpu(pd, next_index);
196	next_queue = per_cpu_ptr(pd->pqueue, cpu);
197	pd->processed = 0;
198	}
199
200	padata = NULL;	187	padata = NULL;
201		188
202	reorder = &next_queue->reorder;	189	reorder = &next_queue->reorder;
@@ -205,8 +192,6 @@ static struct padata_priv padata_get_next(struct parallel_data pd)
205	padata = list_entry(reorder->list.next,	192	padata = list_entry(reorder->list.next,
206	struct padata_priv, list);	193	struct padata_priv, list);
207		194
208	BUG_ON(next_nr != padata->seq_nr);
209
210	spin_lock(&reorder->lock);	195	spin_lock(&reorder->lock);
211	list_del_init(&padata->list);	196	list_del_init(&padata->list);
212	atomic_dec(&pd->reorder_objects);	197	atomic_dec(&pd->reorder_objects);
@@ -402,7 +387,7 @@ static void padata_init_squeues(struct parallel_data *pd)
402	/* Initialize all percpu queues used by parallel workers */	387	/* Initialize all percpu queues used by parallel workers */
403	static void padata_init_pqueues(struct parallel_data *pd)	388	static void padata_init_pqueues(struct parallel_data *pd)
404	{	389	{
405	int cpu_index, num_cpus, cpu;	390	int cpu_index, cpu;
406	struct padata_parallel_queue *pqueue;	391	struct padata_parallel_queue *pqueue;
407		392
408	cpu_index = 0;	393	cpu_index = 0;
@@ -417,9 +402,6 @@ static void padata_init_pqueues(struct parallel_data *pd)
417	INIT_WORK(&pqueue->work, padata_parallel_worker);	402	INIT_WORK(&pqueue->work, padata_parallel_worker);
418	atomic_set(&pqueue->num_obj, 0);	403	atomic_set(&pqueue->num_obj, 0);
419	}	404	}
420
421	num_cpus = cpumask_weight(pd->cpumask.pcpu);
422	pd->max_seq_nr = num_cpus ? (MAX_SEQ_NR / num_cpus) * num_cpus - 1 : 0;
423	}	405	}
424		406
425	/* Allocate and initialize the internal cpumask dependend resources. */	407	/* Allocate and initialize the internal cpumask dependend resources. */
@@ -446,7 +428,7 @@ static struct parallel_data padata_alloc_pd(struct padata_instance pinst,
446	padata_init_pqueues(pd);	428	padata_init_pqueues(pd);
447	padata_init_squeues(pd);	429	padata_init_squeues(pd);
448	setup_timer(&pd->timer, padata_reorder_timer, (unsigned long)pd);	430	setup_timer(&pd->timer, padata_reorder_timer, (unsigned long)pd);
449	atomic_set(&pd->seq_nr, -1);	431	pd->seq_nr = 0;
450	atomic_set(&pd->reorder_objects, 0);	432	atomic_set(&pd->reorder_objects, 0);
451	atomic_set(&pd->refcnt, 0);	433	atomic_set(&pd->refcnt, 0);
452	pd->pinst = pinst;	434	pd->pinst = pinst;