block: Introduce new bio_split()

The new bio_split() can split arbitrary bios - it's not restricted to single page bios, like the old bio_split() (previously renamed to bio_pair_split()). It also has different semantics - it doesn't allocate a struct bio_pair, leaving it up to the caller to handle completions. Then convert the existing bio_pair_split() users to the new bio_split() - and also nvme, which was open coding bio splitting. (We have to take that BUG_ON() out of bio_integrity_trim() because this bio_split() needs to use it, and there's no reason it has to be used on bios marked as cloned; BIO_CLONED doesn't seem to have clearly documented semantics anyways.) Signed-off-by: Kent Overstreet <kmo@daterainc.com> Cc: Jens Axboe <axboe@kernel.dk> Cc: Martin K. Petersen <martin.petersen@oracle.com> Cc: Matthew Wilcox <matthew.r.wilcox@intel.com> Cc: Keith Busch <keith.busch@intel.com> Cc: Vishal Verma <vishal.l.verma@intel.com> Cc: Jiri Kosina <jkosina@suse.cz> Cc: Neil Brown <neilb@suse.de>
author: Kent Overstreet <kmo@daterainc.com> 2013-11-23 21:21:01 -0500
committer: Kent Overstreet <kmo@daterainc.com> 2013-11-24 01:33:57 -0500
commit: 20d0189b1012a37d2533a87fb451f7852f2418d1 (patch)
tree: 5ceaa6cfc0e1f1cec423c6c9f5de72d49f2d63a1 /drivers/md
parent: ee67891bf132612feb7b999ee1f3350b40867cb4 (diff)
6 files changed, 131 insertions, 250 deletions
diff --git a/drivers/md/bcache/bcache.h b/drivers/md/bcache/bcache.h
index 6b6fe935be73..964353c5329d 100644
--- a/drivers/md/bcache/bcache.h
+++ b/drivers/md/bcache/bcache.h
@@ -901,7 +901,6 @@ void bch_bbio_endio(struct cache_set *, struct bio *, int, const char *);
 void bch_bbio_free(struct bio *, struct cache_set *);
 struct bio *bch_bbio_alloc(struct cache_set *);
-struct bio *bch_bio_split(struct bio *, int, gfp_t, struct bio_set *);
 void bch_generic_make_request(struct bio *, struct bio_split_pool *);
 void __bch_submit_bbio(struct bio *, struct cache_set *);
 void bch_submit_bbio(struct bio *, struct cache_set *, struct bkey *, unsigned);
diff --git a/drivers/md/bcache/io.c b/drivers/md/bcache/io.c
index 522f95778443..fa028fa82df4 100644
--- a/drivers/md/bcache/io.c
+++ b/drivers/md/bcache/io.c
@@ -11,84 +11,6 @@
 #include <linux/blkdev.h>
-/**
- * bch_bio_split - split a bio
- * @bio:        bio to split
- * @sectors:    number of sectors to split from the front of @bio
- * @gfp:        gfp mask
- * @bs:         bio set to allocate from
- *
- * Allocates and returns a new bio which represents @sectors from the start of
- * @bio, and updates @bio to represent the remaining sectors.
- *
- * If bio_sectors(@bio) was less than or equal to @sectors, returns @bio
- * unchanged.
- *
- * The newly allocated bio will point to @bio's bi_io_vec, if the split was on a
- * bvec boundry; it is the caller's responsibility to ensure that @bio is not
- * freed before the split.
- */
-struct bio *bch_bio_split(struct bio *bio, int sectors,
-                          gfp_t gfp, struct bio_set *bs)
-{
-        unsigned vcnt = 0, nbytes = sectors << 9;
-        struct bio_vec bv;
-        struct bvec_iter iter;
-        struct bio *ret = NULL;
-        BUG_ON(sectors <= 0);
-        if (sectors >= bio_sectors(bio))
-                return bio;
-        if (bio->bi_rw & REQ_DISCARD) {
-                ret = bio_alloc_bioset(gfp, 1, bs);
-                if (!ret)
-                        return NULL;
-                goto out;
-        }
-        bio_for_each_segment(bv, bio, iter) {
-                vcnt++;
-                if (nbytes <= bv.bv_len)
-                        break;
-                nbytes -= bv.bv_len;
-        }
-        ret = bio_alloc_bioset(gfp, vcnt, bs);
-        if (!ret)
-                return NULL;
-        bio_for_each_segment(bv, bio, iter) {
-                ret->bi_io_vec[ret->bi_vcnt++] = bv;
-                if (ret->bi_vcnt == vcnt)
-                        break;
-        }
-        ret->bi_io_vec[ret->bi_vcnt - 1].bv_len = nbytes;
-out:
-        ret->bi_bdev    = bio->bi_bdev;
-        ret->bi_iter.bi_sector  = bio->bi_iter.bi_sector;
-        ret->bi_iter.bi_size    = sectors << 9;
-        ret->bi_rw      = bio->bi_rw;
-        if (bio_integrity(bio)) {
-                if (bio_integrity_clone(ret, bio, gfp)) {
-                        bio_put(ret);
-                        return NULL;
-                }
-                bio_integrity_trim(ret, 0, bio_sectors(ret));
-        }
-        bio_advance(bio, ret->bi_iter.bi_size);
-        return ret;
-}
 static unsigned bch_bio_max_sectors(struct bio *bio)
 {
        struct request_queue *q = bdev_get_queue(bio->bi_bdev);
@@ -172,8 +94,8 @@ void bch_generic_make_request(struct bio *bio, struct bio_split_pool *p)
        bio_get(bio);
        do {
-                n = bch_bio_split(bio, bch_bio_max_sectors(bio),
+                n = bio_next_split(bio, bch_bio_max_sectors(bio),
-                                  GFP_NOIO, s->p->bio_split);
+                                   GFP_NOIO, s->p->bio_split);
                n->bi_end_io    = bch_bio_submit_split_endio;
                n->bi_private   = &s->cl;
diff --git a/drivers/md/bcache/request.c b/drivers/md/bcache/request.c
index 63451c724781..5878cdb39529 100644
--- a/drivers/md/bcache/request.c
+++ b/drivers/md/bcache/request.c
@@ -371,7 +371,7 @@ static void bch_data_insert_start(struct closure *cl)
                                       op->writeback))
                        goto err;
-                n = bch_bio_split(bio, KEY_SIZE(k), GFP_NOIO, split);
+                n = bio_next_split(bio, KEY_SIZE(k), GFP_NOIO, split);
                n->bi_end_io    = bch_data_insert_endio;
                n->bi_private   = cl;
@@ -679,9 +679,9 @@ static int cache_lookup_fn(struct btree_op *op, struct btree *b, struct bkey *k)
        if (KEY_DIRTY(k))
                s->read_dirty_data = true;
-        n = bch_bio_split(bio, min_t(uint64_t, INT_MAX,
+        n = bio_next_split(bio, min_t(uint64_t, INT_MAX,
-                                     KEY_OFFSET(k) - bio->bi_iter.bi_sector),
+                                      KEY_OFFSET(k) - bio->bi_iter.bi_sector),
-                          GFP_NOIO, s->d->bio_split);
+                           GFP_NOIO, s->d->bio_split);
        bio_key = &container_of(n, struct bbio, bio)->key;
        bch_bkey_copy_single_ptr(bio_key, k, ptr);
@@ -920,7 +920,7 @@ static int cached_dev_cache_miss(struct btree *b, struct search *s,
        struct bio *miss, *cache_bio;
        if (s->cache_miss || s->iop.bypass) {
-                miss = bch_bio_split(bio, sectors, GFP_NOIO, s->d->bio_split);
+                miss = bio_next_split(bio, sectors, GFP_NOIO, s->d->bio_split);
                ret = miss == bio ? MAP_DONE : MAP_CONTINUE;
                goto out_submit;
        }
@@ -943,7 +943,7 @@ static int cached_dev_cache_miss(struct btree *b, struct search *s,
        s->iop.replace = true;
-        miss = bch_bio_split(bio, sectors, GFP_NOIO, s->d->bio_split);
+        miss = bio_next_split(bio, sectors, GFP_NOIO, s->d->bio_split);
        /* btree_search_recurse()'s btree iterator is no good anymore */
        ret = miss == bio ? MAP_DONE : -EINTR;
diff --git a/drivers/md/linear.c b/drivers/md/linear.c
index e9b53e9793bf..56f534b4a2d2 100644
--- a/drivers/md/linear.c
+++ b/drivers/md/linear.c
@@ -288,65 +288,65 @@ static int linear_stop (struct mddev *mddev)
 static void linear_make_request(struct mddev *mddev, struct bio *bio)
 {
+        char b[BDEVNAME_SIZE];
        struct dev_info *tmp_dev;
-        sector_t start_sector;
+        struct bio *split;
+        sector_t start_sector, end_sector, data_offset;
        if (unlikely(bio->bi_rw & REQ_FLUSH)) {
                md_flush_request(mddev, bio);
                return;
        }
-        rcu_read_lock();
+        do {
-        tmp_dev = which_dev(mddev, bio->bi_iter.bi_sector);
+                rcu_read_lock();
-        start_sector = tmp_dev->end_sector - tmp_dev->rdev->sectors;
-        if (unlikely(bio->bi_iter.bi_sector >= (tmp_dev->end_sector)
-                     || (bio->bi_iter.bi_sector < start_sector))) {
-                char b[BDEVNAME_SIZE];
-                printk(KERN_ERR
-                       "md/linear:%s: make_request: Sector %llu out of bounds on "
-                       "dev %s: %llu sectors, offset %llu\n",
-                       mdname(mddev),
-                       (unsigned long long)bio->bi_iter.bi_sector,
-                       bdevname(tmp_dev->rdev->bdev, b),
-                       (unsigned long long)tmp_dev->rdev->sectors,
-                       (unsigned long long)start_sector);
-                rcu_read_unlock();
-                bio_io_error(bio);
-                return;
-        }
-        if (unlikely(bio_end_sector(bio) > tmp_dev->end_sector)) {
-                /* This bio crosses a device boundary, so we have to
-                 * split it.
-                 */
-                struct bio_pair *bp;
-                sector_t end_sector = tmp_dev->end_sector;
-                rcu_read_unlock();
+                tmp_dev = which_dev(mddev, bio->bi_iter.bi_sector);
+                start_sector = tmp_dev->end_sector - tmp_dev->rdev->sectors;
-                bp = bio_pair_split(bio, end_sector - bio->bi_iter.bi_sector);
+                end_sector = tmp_dev->end_sector;
+                data_offset = tmp_dev->rdev->data_offset;
+                bio->bi_bdev = tmp_dev->rdev->bdev;
-                linear_make_request(mddev, &bp->bio1);
+                rcu_read_unlock();
-                linear_make_request(mddev, &bp->bio2);
-                bio_pair_release(bp);
-                return;
-        }
-                    
-        bio->bi_bdev = tmp_dev->rdev->bdev;
-        bio->bi_iter.bi_sector = bio->bi_iter.bi_sector - start_sector
-                + tmp_dev->rdev->data_offset;
-        rcu_read_unlock();
-        if (unlikely((bio->bi_rw & REQ_DISCARD) &&
+                if (unlikely(bio->bi_iter.bi_sector >= end_sector ||
-                     !blk_queue_discard(bdev_get_queue(bio->bi_bdev)))) {
+                             bio->bi_iter.bi_sector < start_sector))
-                /* Just ignore it */
+                        goto out_of_bounds;
-                bio_endio(bio, 0);
-                return;
+                if (unlikely(bio_end_sector(bio) > end_sector)) {
-        }
+                        /* This bio crosses a device boundary, so we have to
+                         * split it.
+                         */
+                        split = bio_split(bio, end_sector -
+                                          bio->bi_iter.bi_sector,
+                                          GFP_NOIO, fs_bio_set);
+                        bio_chain(split, bio);
+                } else {
+                        split = bio;
+                }
-        generic_make_request(bio);
+                split->bi_iter.bi_sector = split->bi_iter.bi_sector -
+                        start_sector + data_offset;
+                if (unlikely((split->bi_rw & REQ_DISCARD) &&
+                         !blk_queue_discard(bdev_get_queue(split->bi_bdev)))) {
+                        /* Just ignore it */
+                        bio_endio(split, 0);
+                } else
+                        generic_make_request(split);
+        } while (split != bio);
+        return;
+out_of_bounds:
+        printk(KERN_ERR
+               "md/linear:%s: make_request: Sector %llu out of bounds on "
+               "dev %s: %llu sectors, offset %llu\n",
+               mdname(mddev),
+               (unsigned long long)bio->bi_iter.bi_sector,
+               bdevname(tmp_dev->rdev->bdev, b),
+               (unsigned long long)tmp_dev->rdev->sectors,
+               (unsigned long long)start_sector);
+        bio_io_error(bio);
 }
 static void linear_status (struct seq_file *seq, struct mddev *mddev)
diff --git a/drivers/md/raid0.c b/drivers/md/raid0.c
index ea754dd1a5f5..407a99e46f69 100644
--- a/drivers/md/raid0.c
+++ b/drivers/md/raid0.c
@@ -513,65 +513,44 @@ static inline int is_io_in_chunk_boundary(struct mddev *mddev,
 static void raid0_make_request(struct mddev *mddev, struct bio *bio)
 {
-        unsigned int chunk_sects;
-        sector_t sector_offset;
        struct strip_zone *zone;
        struct md_rdev *tmp_dev;
+        struct bio *split;
        if (unlikely(bio->bi_rw & REQ_FLUSH)) {
                md_flush_request(mddev, bio);
                return;
        }
-        chunk_sects = mddev->chunk_sectors;
+        do {
-        if (unlikely(!is_io_in_chunk_boundary(mddev, chunk_sects, bio))) {
                sector_t sector = bio->bi_iter.bi_sector;
-                struct bio_pair *bp;
+                unsigned chunk_sects = mddev->chunk_sectors;
-                /* Sanity check -- queue functions should prevent this happening */
-                if (bio_multiple_segments(bio))
+                unsigned sectors = chunk_sects -
-                        goto bad_map;
+                        (likely(is_power_of_2(chunk_sects))
-                /* This is a one page bio that upper layers
+                         ? (sector & (chunk_sects-1))
-                 * refuse to split for us, so we need to split it.
+                         : sector_div(sector, chunk_sects));
-                 */
-                if (likely(is_power_of_2(chunk_sects)))
+                if (sectors < bio_sectors(bio)) {
-                        bp = bio_pair_split(bio, chunk_sects - (sector &
+                        split = bio_split(bio, sectors, GFP_NOIO, fs_bio_set);
-                                                           (chunk_sects-1)));
+                        bio_chain(split, bio);
-                else
+                } else {
-                        bp = bio_pair_split(bio, chunk_sects -
+                        split = bio;
-                                            sector_div(sector, chunk_sects));
+                }
-                raid0_make_request(mddev, &bp->bio1);
-                raid0_make_request(mddev, &bp->bio2);
-                bio_pair_release(bp);
-                return;
-        }
-        sector_offset = bio->bi_iter.bi_sector;
-        zone = find_zone(mddev->private, &sector_offset);
-        tmp_dev = map_sector(mddev, zone, bio->bi_iter.bi_sector,
-                             &sector_offset);
-        bio->bi_bdev = tmp_dev->bdev;
-        bio->bi_iter.bi_sector = sector_offset + zone->dev_start +
-                tmp_dev->data_offset;
-        if (unlikely((bio->bi_rw & REQ_DISCARD) &&
-                     !blk_queue_discard(bdev_get_queue(bio->bi_bdev)))) {
-                /* Just ignore it */
-                bio_endio(bio, 0);
-                return;
-        }
-        generic_make_request(bio);
-        return;
-bad_map:
-        printk("md/raid0:%s: make_request bug: can't convert block across chunks"
-               " or bigger than %dk %llu %d\n",
-               mdname(mddev), chunk_sects / 2,
-               (unsigned long long)bio->bi_iter.bi_sector,
-               bio_sectors(bio) / 2);
-        bio_io_error(bio);
+                zone = find_zone(mddev->private, &sector);
-        return;
+                tmp_dev = map_sector(mddev, zone, sector, &sector);
+                split->bi_bdev = tmp_dev->bdev;
+                split->bi_iter.bi_sector = sector + zone->dev_start +
+                        tmp_dev->data_offset;
+                if (unlikely((split->bi_rw & REQ_DISCARD) &&
+                         !blk_queue_discard(bdev_get_queue(split->bi_bdev)))) {
+                        /* Just ignore it */
+                        bio_endio(split, 0);
+                } else
+                        generic_make_request(split);
+        } while (split != bio);
 }
 static void raid0_status(struct seq_file *seq, struct mddev *mddev)
diff --git a/drivers/md/raid10.c b/drivers/md/raid10.c
index 69c1bc8da88f..6d43d88657aa 100644
--- a/drivers/md/raid10.c
+++ b/drivers/md/raid10.c
@@ -1152,14 +1152,12 @@ static void raid10_unplug(struct blk_plug_cb *cb, bool from_schedule)
        kfree(plug);
 }
-static void make_request(struct mddev *mddev, struct bio * bio)
+static void __make_request(struct mddev *mddev, struct bio *bio)
 {
        struct r10conf *conf = mddev->private;
        struct r10bio *r10_bio;
        struct bio *read_bio;
        int i;
-        sector_t chunk_mask = (conf->geo.chunk_mask & conf->prev.chunk_mask);
-        int chunk_sects = chunk_mask + 1;
        const int rw = bio_data_dir(bio);
        const unsigned long do_sync = (bio->bi_rw & REQ_SYNC);
        const unsigned long do_fua = (bio->bi_rw & REQ_FUA);
@@ -1174,69 +1172,6 @@ static void make_request(struct mddev *mddev, struct bio * bio)
        int max_sectors;
        int sectors;
-        if (unlikely(bio->bi_rw & REQ_FLUSH)) {
-                md_flush_request(mddev, bio);
-                return;
-        }
-        /* If this request crosses a chunk boundary, we need to
-         * split it.  This will only happen for 1 PAGE (or less) requests.
-         */
-        if (unlikely((bio->bi_iter.bi_sector & chunk_mask) + bio_sectors(bio)
-                     > chunk_sects
-                     && (conf->geo.near_copies < conf->geo.raid_disks
-                         || conf->prev.near_copies < conf->prev.raid_disks))) {
-                struct bio_pair *bp;
-                /* Sanity check -- queue functions should prevent this happening */
-                if (bio_multiple_segments(bio))
-                        goto bad_map;
-                /* This is a one page bio that upper layers
-                 * refuse to split for us, so we need to split it.
-                 */
-                bp = bio_pair_split(bio, chunk_sects -
-                               (bio->bi_iter.bi_sector & (chunk_sects - 1)));
-                /* Each of these 'make_request' calls will call 'wait_barrier'.
-                 * If the first succeeds but the second blocks due to the resync
-                 * thread raising the barrier, we will deadlock because the
-                 * IO to the underlying device will be queued in generic_make_request
-                 * and will never complete, so will never reduce nr_pending.
-                 * So increment nr_waiting here so no new raise_barriers will
-                 * succeed, and so the second wait_barrier cannot block.
-                 */
-                spin_lock_irq(&conf->resync_lock);
-                conf->nr_waiting++;
-                spin_unlock_irq(&conf->resync_lock);
-                make_request(mddev, &bp->bio1);
-                make_request(mddev, &bp->bio2);
-                spin_lock_irq(&conf->resync_lock);
-                conf->nr_waiting--;
-                wake_up(&conf->wait_barrier);
-                spin_unlock_irq(&conf->resync_lock);
-                bio_pair_release(bp);
-                return;
-        bad_map:
-                printk("md/raid10:%s: make_request bug: can't convert block across chunks"
-                       " or bigger than %dk %llu %d\n", mdname(mddev), chunk_sects/2,
-                       (unsigned long long)bio->bi_iter.bi_sector,
-                       bio_sectors(bio) / 2);
-                bio_io_error(bio);
-                return;
-        }
-        md_write_start(mddev, bio);
-        /*
-         * Register the new request and wait if the reconstruction
-         * thread has put up a bar for new requests.
-         * Continue immediately if no resync is active currently.
-         */
-        wait_barrier(conf);
        sectors = bio_sectors(bio);
        while (test_bit(MD_RECOVERY_RESHAPE, &mddev->recovery) &&
            bio->bi_iter.bi_sector < conf->reshape_progress &&
@@ -1600,6 +1535,52 @@ retry_write:
                goto retry_write;
        }
        one_write_done(r10_bio);
+}
+static void make_request(struct mddev *mddev, struct bio *bio)
+{
+        struct r10conf *conf = mddev->private;
+        sector_t chunk_mask = (conf->geo.chunk_mask & conf->prev.chunk_mask);
+        int chunk_sects = chunk_mask + 1;
+        struct bio *split;
+        if (unlikely(bio->bi_rw & REQ_FLUSH)) {
+                md_flush_request(mddev, bio);
+                return;
+        }
+        md_write_start(mddev, bio);
+        /*
+         * Register the new request and wait if the reconstruction
+         * thread has put up a bar for new requests.
+         * Continue immediately if no resync is active currently.
+         */
+        wait_barrier(conf);
+        do {
+                /*
+                 * If this request crosses a chunk boundary, we need to split
+                 * it.
+                 */
+                if (unlikely((bio->bi_iter.bi_sector & chunk_mask) +
+                             bio_sectors(bio) > chunk_sects
+                             && (conf->geo.near_copies < conf->geo.raid_disks
+                                 || conf->prev.near_copies <
+                                 conf->prev.raid_disks))) {
+                        split = bio_split(bio, chunk_sects -
+                                          (bio->bi_iter.bi_sector &
+                                           (chunk_sects - 1)),
+                                          GFP_NOIO, fs_bio_set);
+                        bio_chain(split, bio);
+                } else {
+                        split = bio;
+                }
+                __make_request(mddev, split);
+        } while (split != bio);
        /* In case raid10d snuck in to freeze_array */
        wake_up(&conf->wait_barrier);
author	Kent Overstreet <kmo@daterainc.com>	2013-11-23 21:21:01 -0500
committer	Kent Overstreet <kmo@daterainc.com>	2013-11-24 01:33:57 -0500
commit	20d0189b1012a37d2533a87fb451f7852f2418d1 (patch)
tree	5ceaa6cfc0e1f1cec423c6c9f5de72d49f2d63a1 /drivers/md
parent	ee67891bf132612feb7b999ee1f3350b40867cb4 (diff)

diff --git a/drivers/md/bcache/bcache.h b/drivers/md/bcache/bcache.h index 6b6fe935be73..964353c5329d 100644 --- a/drivers/md/bcache/bcache.h +++ b/drivers/md/bcache/bcache.h
@@ -901,7 +901,6 @@ void bch_bbio_endio(struct cache_set , struct bio , int, const char *);
901	void bch_bbio_free(struct bio , struct cache_set );	901	void bch_bbio_free(struct bio , struct cache_set );
902	struct bio bch_bbio_alloc(struct cache_set );	902	struct bio bch_bbio_alloc(struct cache_set );
903		903
904	struct bio bch_bio_split(struct bio , int, gfp_t, struct bio_set *);
905	void bch_generic_make_request(struct bio , struct bio_split_pool );	904	void bch_generic_make_request(struct bio , struct bio_split_pool );
906	void __bch_submit_bbio(struct bio , struct cache_set );	905	void __bch_submit_bbio(struct bio , struct cache_set );
907	void bch_submit_bbio(struct bio , struct cache_set , struct bkey *, unsigned);	906	void bch_submit_bbio(struct bio , struct cache_set , struct bkey *, unsigned);


diff --git a/drivers/md/bcache/io.c b/drivers/md/bcache/io.c index 522f95778443..fa028fa82df4 100644 --- a/drivers/md/bcache/io.c +++ b/drivers/md/bcache/io.c
@@ -11,84 +11,6 @@
11		11
12	#include <linux/blkdev.h>	12	#include <linux/blkdev.h>
13		13
14	/**
15	* bch_bio_split - split a bio
16	* @bio: bio to split
17	* @sectors: number of sectors to split from the front of @bio
18	* @gfp: gfp mask
19	* @bs: bio set to allocate from
20	*
21	* Allocates and returns a new bio which represents @sectors from the start of
22	* @bio, and updates @bio to represent the remaining sectors.
23	*
24	* If bio_sectors(@bio) was less than or equal to @sectors, returns @bio
25	* unchanged.
26	*
27	* The newly allocated bio will point to @bio's bi_io_vec, if the split was on a
28	* bvec boundry; it is the caller's responsibility to ensure that @bio is not
29	* freed before the split.
30	*/
31	struct bio bch_bio_split(struct bio bio, int sectors,
32	gfp_t gfp, struct bio_set *bs)
33	{
34	unsigned vcnt = 0, nbytes = sectors << 9;
35	struct bio_vec bv;
36	struct bvec_iter iter;
37	struct bio *ret = NULL;
38
39	BUG_ON(sectors <= 0);
40
41	if (sectors >= bio_sectors(bio))
42	return bio;
43
44	if (bio->bi_rw & REQ_DISCARD) {
45	ret = bio_alloc_bioset(gfp, 1, bs);
46	if (!ret)
47	return NULL;
48	goto out;
49	}
50
51	bio_for_each_segment(bv, bio, iter) {
52	vcnt++;
53
54	if (nbytes <= bv.bv_len)
55	break;
56
57	nbytes -= bv.bv_len;
58	}
59
60	ret = bio_alloc_bioset(gfp, vcnt, bs);
61	if (!ret)
62	return NULL;
63
64	bio_for_each_segment(bv, bio, iter) {
65	ret->bi_io_vec[ret->bi_vcnt++] = bv;
66
67	if (ret->bi_vcnt == vcnt)
68	break;
69	}
70
71	ret->bi_io_vec[ret->bi_vcnt - 1].bv_len = nbytes;
72	out:
73	ret->bi_bdev = bio->bi_bdev;
74	ret->bi_iter.bi_sector = bio->bi_iter.bi_sector;
75	ret->bi_iter.bi_size = sectors << 9;
76	ret->bi_rw = bio->bi_rw;
77
78	if (bio_integrity(bio)) {
79	if (bio_integrity_clone(ret, bio, gfp)) {
80	bio_put(ret);
81	return NULL;
82	}
83
84	bio_integrity_trim(ret, 0, bio_sectors(ret));
85	}
86
87	bio_advance(bio, ret->bi_iter.bi_size);
88
89	return ret;
90	}
91
92	static unsigned bch_bio_max_sectors(struct bio *bio)	14	static unsigned bch_bio_max_sectors(struct bio *bio)
93	{	15	{
94	struct request_queue *q = bdev_get_queue(bio->bi_bdev);	16	struct request_queue *q = bdev_get_queue(bio->bi_bdev);
@@ -172,8 +94,8 @@ void bch_generic_make_request(struct bio bio, struct bio_split_pool p)
172	bio_get(bio);	94	bio_get(bio);
173		95
174	do {	96	do {
175	n = bch_bio_split(bio, bch_bio_max_sectors(bio),	97	n = bio_next_split(bio, bch_bio_max_sectors(bio),
176	GFP_NOIO, s->p->bio_split);	98	GFP_NOIO, s->p->bio_split);
177		99
178	n->bi_end_io = bch_bio_submit_split_endio;	100	n->bi_end_io = bch_bio_submit_split_endio;
179	n->bi_private = &s->cl;	101	n->bi_private = &s->cl;


diff --git a/drivers/md/bcache/request.c b/drivers/md/bcache/request.c index 63451c724781..5878cdb39529 100644 --- a/drivers/md/bcache/request.c +++ b/drivers/md/bcache/request.c
@@ -371,7 +371,7 @@ static void bch_data_insert_start(struct closure *cl)
371	op->writeback))	371	op->writeback))
372	goto err;	372	goto err;
373		373
374	n = bch_bio_split(bio, KEY_SIZE(k), GFP_NOIO, split);	374	n = bio_next_split(bio, KEY_SIZE(k), GFP_NOIO, split);
375		375
376	n->bi_end_io = bch_data_insert_endio;	376	n->bi_end_io = bch_data_insert_endio;
377	n->bi_private = cl;	377	n->bi_private = cl;
@@ -679,9 +679,9 @@ static int cache_lookup_fn(struct btree_op op, struct btree b, struct bkey *k)
679	if (KEY_DIRTY(k))	679	if (KEY_DIRTY(k))
680	s->read_dirty_data = true;	680	s->read_dirty_data = true;
681		681
682	n = bch_bio_split(bio, min_t(uint64_t, INT_MAX,	682	n = bio_next_split(bio, min_t(uint64_t, INT_MAX,
683	KEY_OFFSET(k) - bio->bi_iter.bi_sector),	683	KEY_OFFSET(k) - bio->bi_iter.bi_sector),
684	GFP_NOIO, s->d->bio_split);	684	GFP_NOIO, s->d->bio_split);
685		685
686	bio_key = &container_of(n, struct bbio, bio)->key;	686	bio_key = &container_of(n, struct bbio, bio)->key;
687	bch_bkey_copy_single_ptr(bio_key, k, ptr);	687	bch_bkey_copy_single_ptr(bio_key, k, ptr);
@@ -920,7 +920,7 @@ static int cached_dev_cache_miss(struct btree b, struct search s,
920	struct bio miss, cache_bio;	920	struct bio miss, cache_bio;
921		921
922	if (s->cache_miss \|\| s->iop.bypass) {	922	if (s->cache_miss \|\| s->iop.bypass) {
923	miss = bch_bio_split(bio, sectors, GFP_NOIO, s->d->bio_split);	923	miss = bio_next_split(bio, sectors, GFP_NOIO, s->d->bio_split);
924	ret = miss == bio ? MAP_DONE : MAP_CONTINUE;	924	ret = miss == bio ? MAP_DONE : MAP_CONTINUE;
925	goto out_submit;	925	goto out_submit;
926	}	926	}
@@ -943,7 +943,7 @@ static int cached_dev_cache_miss(struct btree b, struct search s,
943		943
944	s->iop.replace = true;	944	s->iop.replace = true;
945		945
946	miss = bch_bio_split(bio, sectors, GFP_NOIO, s->d->bio_split);	946	miss = bio_next_split(bio, sectors, GFP_NOIO, s->d->bio_split);
947		947
948	/* btree_search_recurse()'s btree iterator is no good anymore */	948	/* btree_search_recurse()'s btree iterator is no good anymore */
949	ret = miss == bio ? MAP_DONE : -EINTR;	949	ret = miss == bio ? MAP_DONE : -EINTR;


diff --git a/drivers/md/linear.c b/drivers/md/linear.c index e9b53e9793bf..56f534b4a2d2 100644 --- a/drivers/md/linear.c +++ b/drivers/md/linear.c
@@ -288,65 +288,65 @@ static int linear_stop (struct mddev *mddev)
288		288
289	static void linear_make_request(struct mddev mddev, struct bio bio)	289	static void linear_make_request(struct mddev mddev, struct bio bio)
290	{	290	{
		291	char b[BDEVNAME_SIZE];
291	struct dev_info *tmp_dev;	292	struct dev_info *tmp_dev;
292	sector_t start_sector;	293	struct bio *split;
		294	sector_t start_sector, end_sector, data_offset;
293		295
294	if (unlikely(bio->bi_rw & REQ_FLUSH)) {	296	if (unlikely(bio->bi_rw & REQ_FLUSH)) {
295	md_flush_request(mddev, bio);	297	md_flush_request(mddev, bio);
296	return;	298	return;
297	}	299	}
298		300
299	rcu_read_lock();	301	do {
300	tmp_dev = which_dev(mddev, bio->bi_iter.bi_sector);	302	rcu_read_lock();
301	start_sector = tmp_dev->end_sector - tmp_dev->rdev->sectors;
302
303
304	if (unlikely(bio->bi_iter.bi_sector >= (tmp_dev->end_sector)
305	\|\| (bio->bi_iter.bi_sector < start_sector))) {
306	char b[BDEVNAME_SIZE];
307
308	printk(KERN_ERR
309	"md/linear:%s: make_request: Sector %llu out of bounds on "
310	"dev %s: %llu sectors, offset %llu\n",
311	mdname(mddev),
312	(unsigned long long)bio->bi_iter.bi_sector,
313	bdevname(tmp_dev->rdev->bdev, b),
314	(unsigned long long)tmp_dev->rdev->sectors,
315	(unsigned long long)start_sector);
316	rcu_read_unlock();
317	bio_io_error(bio);
318	return;
319	}
320	if (unlikely(bio_end_sector(bio) > tmp_dev->end_sector)) {
321	/* This bio crosses a device boundary, so we have to
322	* split it.
323	*/
324	struct bio_pair *bp;
325	sector_t end_sector = tmp_dev->end_sector;
326		303
327	rcu_read_unlock();	304	tmp_dev = which_dev(mddev, bio->bi_iter.bi_sector);
328		305	start_sector = tmp_dev->end_sector - tmp_dev->rdev->sectors;
329	bp = bio_pair_split(bio, end_sector - bio->bi_iter.bi_sector);	306	end_sector = tmp_dev->end_sector;
		307	data_offset = tmp_dev->rdev->data_offset;
		308	bio->bi_bdev = tmp_dev->rdev->bdev;
330		309
331	linear_make_request(mddev, &bp->bio1);	310	rcu_read_unlock();
332	linear_make_request(mddev, &bp->bio2);
333	bio_pair_release(bp);
334	return;
335	}
336
337	bio->bi_bdev = tmp_dev->rdev->bdev;
338	bio->bi_iter.bi_sector = bio->bi_iter.bi_sector - start_sector
339	+ tmp_dev->rdev->data_offset;
340	rcu_read_unlock();
341		311
342	if (unlikely((bio->bi_rw & REQ_DISCARD) &&	312	if (unlikely(bio->bi_iter.bi_sector >= end_sector \|\|
343	!blk_queue_discard(bdev_get_queue(bio->bi_bdev)))) {	313	bio->bi_iter.bi_sector < start_sector))
344	/* Just ignore it */	314	goto out_of_bounds;
345	bio_endio(bio, 0);	315
346	return;	316	if (unlikely(bio_end_sector(bio) > end_sector)) {
347	}	317	/* This bio crosses a device boundary, so we have to
		318	* split it.
		319	*/
		320	split = bio_split(bio, end_sector -
		321	bio->bi_iter.bi_sector,
		322	GFP_NOIO, fs_bio_set);
		323	bio_chain(split, bio);
		324	} else {
		325	split = bio;
		326	}
348		327
349	generic_make_request(bio);	328	split->bi_iter.bi_sector = split->bi_iter.bi_sector -
		329	start_sector + data_offset;
		330
		331	if (unlikely((split->bi_rw & REQ_DISCARD) &&
		332	!blk_queue_discard(bdev_get_queue(split->bi_bdev)))) {
		333	/* Just ignore it */
		334	bio_endio(split, 0);
		335	} else
		336	generic_make_request(split);
		337	} while (split != bio);
		338	return;
		339
		340	out_of_bounds:
		341	printk(KERN_ERR
		342	"md/linear:%s: make_request: Sector %llu out of bounds on "
		343	"dev %s: %llu sectors, offset %llu\n",
		344	mdname(mddev),
		345	(unsigned long long)bio->bi_iter.bi_sector,
		346	bdevname(tmp_dev->rdev->bdev, b),
		347	(unsigned long long)tmp_dev->rdev->sectors,
		348	(unsigned long long)start_sector);
		349	bio_io_error(bio);
350	}	350	}
351		351
352	static void linear_status (struct seq_file seq, struct mddev mddev)	352	static void linear_status (struct seq_file seq, struct mddev mddev)


diff --git a/drivers/md/raid0.c b/drivers/md/raid0.c index ea754dd1a5f5..407a99e46f69 100644 --- a/drivers/md/raid0.c +++ b/drivers/md/raid0.c
@@ -513,65 +513,44 @@ static inline int is_io_in_chunk_boundary(struct mddev *mddev,
513		513
514	static void raid0_make_request(struct mddev mddev, struct bio bio)	514	static void raid0_make_request(struct mddev mddev, struct bio bio)
515	{	515	{
516	unsigned int chunk_sects;
517	sector_t sector_offset;
518	struct strip_zone *zone;	516	struct strip_zone *zone;
519	struct md_rdev *tmp_dev;	517	struct md_rdev *tmp_dev;
		518	struct bio *split;
520		519
521	if (unlikely(bio->bi_rw & REQ_FLUSH)) {	520	if (unlikely(bio->bi_rw & REQ_FLUSH)) {
522	md_flush_request(mddev, bio);	521	md_flush_request(mddev, bio);
523	return;	522	return;
524	}	523	}
525		524
526	chunk_sects = mddev->chunk_sectors;	525	do {
527	if (unlikely(!is_io_in_chunk_boundary(mddev, chunk_sects, bio))) {
528	sector_t sector = bio->bi_iter.bi_sector;	526	sector_t sector = bio->bi_iter.bi_sector;
529	struct bio_pair *bp;	527	unsigned chunk_sects = mddev->chunk_sectors;
530	/* Sanity check -- queue functions should prevent this happening */	528
531	if (bio_multiple_segments(bio))	529	unsigned sectors = chunk_sects -
532	goto bad_map;	530	(likely(is_power_of_2(chunk_sects))
533	/* This is a one page bio that upper layers	531	? (sector & (chunk_sects-1))
534	* refuse to split for us, so we need to split it.	532	: sector_div(sector, chunk_sects));
535	*/	533
536	if (likely(is_power_of_2(chunk_sects)))	534	if (sectors < bio_sectors(bio)) {
537	bp = bio_pair_split(bio, chunk_sects - (sector &	535	split = bio_split(bio, sectors, GFP_NOIO, fs_bio_set);
538	(chunk_sects-1)));	536	bio_chain(split, bio);
539	else	537	} else {
540	bp = bio_pair_split(bio, chunk_sects -	538	split = bio;
541	sector_div(sector, chunk_sects));	539	}
542	raid0_make_request(mddev, &bp->bio1);
543	raid0_make_request(mddev, &bp->bio2);
544	bio_pair_release(bp);
545	return;
546	}
547
548	sector_offset = bio->bi_iter.bi_sector;
549	zone = find_zone(mddev->private, &sector_offset);
550	tmp_dev = map_sector(mddev, zone, bio->bi_iter.bi_sector,
551	&sector_offset);
552	bio->bi_bdev = tmp_dev->bdev;
553	bio->bi_iter.bi_sector = sector_offset + zone->dev_start +
554	tmp_dev->data_offset;
555
556	if (unlikely((bio->bi_rw & REQ_DISCARD) &&
557	!blk_queue_discard(bdev_get_queue(bio->bi_bdev)))) {
558	/* Just ignore it */
559	bio_endio(bio, 0);
560	return;
561	}
562
563	generic_make_request(bio);
564	return;
565
566	bad_map:
567	printk("md/raid0:%s: make_request bug: can't convert block across chunks"
568	" or bigger than %dk %llu %d\n",
569	mdname(mddev), chunk_sects / 2,
570	(unsigned long long)bio->bi_iter.bi_sector,
571	bio_sectors(bio) / 2);
572		540
573	bio_io_error(bio);	541	zone = find_zone(mddev->private, &sector);
574	return;	542	tmp_dev = map_sector(mddev, zone, sector, &sector);
		543	split->bi_bdev = tmp_dev->bdev;
		544	split->bi_iter.bi_sector = sector + zone->dev_start +
		545	tmp_dev->data_offset;
		546
		547	if (unlikely((split->bi_rw & REQ_DISCARD) &&
		548	!blk_queue_discard(bdev_get_queue(split->bi_bdev)))) {
		549	/* Just ignore it */
		550	bio_endio(split, 0);
		551	} else
		552	generic_make_request(split);
		553	} while (split != bio);
575	}	554	}
576		555
577	static void raid0_status(struct seq_file seq, struct mddev mddev)	556	static void raid0_status(struct seq_file seq, struct mddev mddev)


diff --git a/drivers/md/raid10.c b/drivers/md/raid10.c index 69c1bc8da88f..6d43d88657aa 100644 --- a/drivers/md/raid10.c +++ b/drivers/md/raid10.c
@@ -1152,14 +1152,12 @@ static void raid10_unplug(struct blk_plug_cb *cb, bool from_schedule)
1152	kfree(plug);	1152	kfree(plug);
1153	}	1153	}
1154		1154
1155	static void make_request(struct mddev mddev, struct bio bio)	1155	static void __make_request(struct mddev mddev, struct bio bio)
1156	{	1156	{
1157	struct r10conf *conf = mddev->private;	1157	struct r10conf *conf = mddev->private;
1158	struct r10bio *r10_bio;	1158	struct r10bio *r10_bio;
1159	struct bio *read_bio;	1159	struct bio *read_bio;
1160	int i;	1160	int i;
1161	sector_t chunk_mask = (conf->geo.chunk_mask & conf->prev.chunk_mask);
1162	int chunk_sects = chunk_mask + 1;
1163	const int rw = bio_data_dir(bio);	1161	const int rw = bio_data_dir(bio);
1164	const unsigned long do_sync = (bio->bi_rw & REQ_SYNC);	1162	const unsigned long do_sync = (bio->bi_rw & REQ_SYNC);
1165	const unsigned long do_fua = (bio->bi_rw & REQ_FUA);	1163	const unsigned long do_fua = (bio->bi_rw & REQ_FUA);
@@ -1174,69 +1172,6 @@ static void make_request(struct mddev mddev, struct bio bio)
1174	int max_sectors;	1172	int max_sectors;
1175	int sectors;	1173	int sectors;
1176		1174
1177	if (unlikely(bio->bi_rw & REQ_FLUSH)) {
1178	md_flush_request(mddev, bio);
1179	return;
1180	}
1181
1182	/* If this request crosses a chunk boundary, we need to
1183	* split it. This will only happen for 1 PAGE (or less) requests.
1184	*/
1185	if (unlikely((bio->bi_iter.bi_sector & chunk_mask) + bio_sectors(bio)
1186	> chunk_sects
1187	&& (conf->geo.near_copies < conf->geo.raid_disks
1188	\|\| conf->prev.near_copies < conf->prev.raid_disks))) {
1189	struct bio_pair *bp;
1190	/* Sanity check -- queue functions should prevent this happening */
1191	if (bio_multiple_segments(bio))
1192	goto bad_map;
1193	/* This is a one page bio that upper layers
1194	* refuse to split for us, so we need to split it.
1195	*/
1196	bp = bio_pair_split(bio, chunk_sects -
1197	(bio->bi_iter.bi_sector & (chunk_sects - 1)));
1198
1199	/* Each of these 'make_request' calls will call 'wait_barrier'.
1200	* If the first succeeds but the second blocks due to the resync
1201	* thread raising the barrier, we will deadlock because the
1202	* IO to the underlying device will be queued in generic_make_request
1203	* and will never complete, so will never reduce nr_pending.
1204	* So increment nr_waiting here so no new raise_barriers will
1205	* succeed, and so the second wait_barrier cannot block.
1206	*/
1207	spin_lock_irq(&conf->resync_lock);
1208	conf->nr_waiting++;
1209	spin_unlock_irq(&conf->resync_lock);
1210
1211	make_request(mddev, &bp->bio1);
1212	make_request(mddev, &bp->bio2);
1213
1214	spin_lock_irq(&conf->resync_lock);
1215	conf->nr_waiting--;
1216	wake_up(&conf->wait_barrier);
1217	spin_unlock_irq(&conf->resync_lock);
1218
1219	bio_pair_release(bp);
1220	return;
1221	bad_map:
1222	printk("md/raid10:%s: make_request bug: can't convert block across chunks"
1223	" or bigger than %dk %llu %d\n", mdname(mddev), chunk_sects/2,
1224	(unsigned long long)bio->bi_iter.bi_sector,
1225	bio_sectors(bio) / 2);
1226
1227	bio_io_error(bio);
1228	return;
1229	}
1230
1231	md_write_start(mddev, bio);
1232
1233	/*
1234	* Register the new request and wait if the reconstruction
1235	* thread has put up a bar for new requests.
1236	* Continue immediately if no resync is active currently.
1237	*/
1238	wait_barrier(conf);
1239
1240	sectors = bio_sectors(bio);	1175	sectors = bio_sectors(bio);
1241	while (test_bit(MD_RECOVERY_RESHAPE, &mddev->recovery) &&	1176	while (test_bit(MD_RECOVERY_RESHAPE, &mddev->recovery) &&
1242	bio->bi_iter.bi_sector < conf->reshape_progress &&	1177	bio->bi_iter.bi_sector < conf->reshape_progress &&
@@ -1600,6 +1535,52 @@ retry_write:
1600	goto retry_write;	1535	goto retry_write;
1601	}	1536	}
1602	one_write_done(r10_bio);	1537	one_write_done(r10_bio);
		1538	}
		1539
		1540	static void make_request(struct mddev mddev, struct bio bio)
		1541	{
		1542	struct r10conf *conf = mddev->private;
		1543	sector_t chunk_mask = (conf->geo.chunk_mask & conf->prev.chunk_mask);
		1544	int chunk_sects = chunk_mask + 1;
		1545
		1546	struct bio *split;
		1547
		1548	if (unlikely(bio->bi_rw & REQ_FLUSH)) {
		1549	md_flush_request(mddev, bio);
		1550	return;
		1551	}
		1552
		1553	md_write_start(mddev, bio);
		1554
		1555	/*
		1556	* Register the new request and wait if the reconstruction
		1557	* thread has put up a bar for new requests.
		1558	* Continue immediately if no resync is active currently.
		1559	*/
		1560	wait_barrier(conf);
		1561
		1562	do {
		1563
		1564	/*
		1565	* If this request crosses a chunk boundary, we need to split
		1566	* it.
		1567	*/
		1568	if (unlikely((bio->bi_iter.bi_sector & chunk_mask) +
		1569	bio_sectors(bio) > chunk_sects
		1570	&& (conf->geo.near_copies < conf->geo.raid_disks
		1571	\|\| conf->prev.near_copies <
		1572	conf->prev.raid_disks))) {
		1573	split = bio_split(bio, chunk_sects -
		1574	(bio->bi_iter.bi_sector &
		1575	(chunk_sects - 1)),
		1576	GFP_NOIO, fs_bio_set);
		1577	bio_chain(split, bio);
		1578	} else {
		1579	split = bio;
		1580	}
		1581
		1582	__make_request(mddev, split);
		1583	} while (split != bio);
1603		1584
1604	/* In case raid10d snuck in to freeze_array */	1585	/* In case raid10d snuck in to freeze_array */
1605	wake_up(&conf->wait_barrier);	1586	wake_up(&conf->wait_barrier);