xprtrdma: Explicitly resetting MRs is no longer necessary (61da886b) · Commits · 戴 / test

include/trace/events/rpcrdma.h

+1 −1

Original line number	Diff line number	Diff line
		@@ -655,7 +655,7 @@ DEFINE_MR_EVENT(xprtrdma_localinv);
		DEFINE_MR_EVENT(xprtrdma_dma_map);
		DEFINE_MR_EVENT(xprtrdma_dma_unmap);
		DEFINE_MR_EVENT(xprtrdma_remoteinv);
		DEFINE_MR_EVENT(xprtrdma_recover_mr);
		DEFINE_MR_EVENT(xprtrdma_mr_recycle);

		/**
		** Reply events

net/sunrpc/xprtrdma/fmr_ops.c

+56 −68

Original line number	Diff line number	Diff line
		@@ -49,46 +49,7 @@ fmr_is_supported(struct rpcrdma_ia *ia)
		return true;
		}

		static int
		fmr_op_init_mr(struct rpcrdma_ia ia, struct rpcrdma_mr mr)
		{
		static struct ib_fmr_attr fmr_attr = {
		.max_pages = RPCRDMA_MAX_FMR_SGES,
		.max_maps = 1,
		.page_shift = PAGE_SHIFT
		};

		mr->fmr.fm_physaddrs = kcalloc(RPCRDMA_MAX_FMR_SGES,
		sizeof(u64), GFP_KERNEL);
		if (!mr->fmr.fm_physaddrs)
		goto out_free;

		mr->mr_sg = kcalloc(RPCRDMA_MAX_FMR_SGES,
		sizeof(*mr->mr_sg), GFP_KERNEL);
		if (!mr->mr_sg)
		goto out_free;

		sg_init_table(mr->mr_sg, RPCRDMA_MAX_FMR_SGES);

		mr->fmr.fm_mr = ib_alloc_fmr(ia->ri_pd, RPCRDMA_FMR_ACCESS_FLAGS,
		&fmr_attr);
		if (IS_ERR(mr->fmr.fm_mr))
		goto out_fmr_err;

		INIT_LIST_HEAD(&mr->mr_list);
		return 0;

		out_fmr_err:
		dprintk("RPC: %s: ib_alloc_fmr returned %ld\n", __func__,
		PTR_ERR(mr->fmr.fm_mr));

		out_free:
		kfree(mr->mr_sg);
		kfree(mr->fmr.fm_physaddrs);
		return -ENOMEM;
		}

		static int
		static void
		__fmr_unmap(struct rpcrdma_mr *mr)
		{
		LIST_HEAD(l);
		@@ -97,13 +58,16 @@ __fmr_unmap(struct rpcrdma_mr *mr)
		list_add(&mr->fmr.fm_mr->list, &l);
		rc = ib_unmap_fmr(&l);
		list_del(&mr->fmr.fm_mr->list);
		return rc;
		if (rc)
		pr_err("rpcrdma: final ib_unmap_fmr for %p failed %i\n",
		mr, rc);
		}

		/* Release an MR.
		*/
		static void
		fmr_op_release_mr(struct rpcrdma_mr *mr)
		{
		LIST_HEAD(unmap_list);
		int rc;

		kfree(mr->fmr.fm_physaddrs);
		@@ -112,10 +76,7 @@ fmr_op_release_mr(struct rpcrdma_mr *mr)
		/* In case this one was left mapped, try to unmap it
		* to prevent dealloc_fmr from failing with EBUSY
		*/
		rc = __fmr_unmap(mr);
		if (rc)
		pr_err("rpcrdma: final ib_unmap_fmr for %p failed %i\n",
		mr, rc);
		__fmr_unmap(mr);

		rc = ib_dealloc_fmr(mr->fmr.fm_mr);
		if (rc)
		@@ -125,28 +86,16 @@ fmr_op_release_mr(struct rpcrdma_mr *mr)
		kfree(mr);
		}

		/* Reset of a single FMR.
		/* MRs are dynamically allocated, so simply clean up and release the MR.
		* A replacement MR will subsequently be allocated on demand.
		*/
		static void
		fmr_op_recover_mr(struct rpcrdma_mr *mr)
		fmr_mr_recycle_worker(struct work_struct *work)
		{
		struct rpcrdma_mr *mr = container_of(work, struct rpcrdma_mr, mr_recycle);
		struct rpcrdma_xprt *r_xprt = mr->mr_xprt;
		int rc;

		/* ORDER: invalidate first */
		rc = __fmr_unmap(mr);
		if (rc)
		goto out_release;

		/* ORDER: then DMA unmap */
		rpcrdma_mr_unmap_and_put(mr);

		r_xprt->rx_stats.mrs_recovered++;
		return;

		out_release:
		pr_err("rpcrdma: FMR reset failed (%d), %p released\n", rc, mr);
		r_xprt->rx_stats.mrs_orphaned++;
		trace_xprtrdma_mr_recycle(mr);

		trace_xprtrdma_dma_unmap(mr);
		ib_dma_unmap_sg(r_xprt->rx_ia.ri_device,
		@@ -154,11 +103,51 @@ out_release:

		spin_lock(&r_xprt->rx_buf.rb_mrlock);
		list_del(&mr->mr_all);
		r_xprt->rx_stats.mrs_recycled++;
		spin_unlock(&r_xprt->rx_buf.rb_mrlock);

		fmr_op_release_mr(mr);
		}

		static int
		fmr_op_init_mr(struct rpcrdma_ia ia, struct rpcrdma_mr mr)
		{
		static struct ib_fmr_attr fmr_attr = {
		.max_pages = RPCRDMA_MAX_FMR_SGES,
		.max_maps = 1,
		.page_shift = PAGE_SHIFT
		};

		mr->fmr.fm_physaddrs = kcalloc(RPCRDMA_MAX_FMR_SGES,
		sizeof(u64), GFP_KERNEL);
		if (!mr->fmr.fm_physaddrs)
		goto out_free;

		mr->mr_sg = kcalloc(RPCRDMA_MAX_FMR_SGES,
		sizeof(*mr->mr_sg), GFP_KERNEL);
		if (!mr->mr_sg)
		goto out_free;

		sg_init_table(mr->mr_sg, RPCRDMA_MAX_FMR_SGES);

		mr->fmr.fm_mr = ib_alloc_fmr(ia->ri_pd, RPCRDMA_FMR_ACCESS_FLAGS,
		&fmr_attr);
		if (IS_ERR(mr->fmr.fm_mr))
		goto out_fmr_err;

		INIT_LIST_HEAD(&mr->mr_list);
		INIT_WORK(&mr->mr_recycle, fmr_mr_recycle_worker);
		return 0;

		out_fmr_err:
		dprintk("RPC: %s: ib_alloc_fmr returned %ld\n", __func__,
		PTR_ERR(mr->fmr.fm_mr));

		out_free:
		kfree(mr->mr_sg);
		kfree(mr->fmr.fm_physaddrs);
		return -ENOMEM;
		}

		/* On success, sets:
		* ep->rep_attr.cap.max_send_wr
		* ep->rep_attr.cap.max_recv_wr
		@@ -312,7 +301,7 @@ fmr_op_unmap_sync(struct rpcrdma_xprt r_xprt, struct list_head mrs)
		r_xprt->rx_stats.local_inv_needed++;
		rc = ib_unmap_fmr(&unmap_list);
		if (rc)
		goto out_reset;
		goto out_release;

		/* ORDER: Now DMA unmap all of the req's MRs, and return
		* them to the free MW list.
		@@ -325,13 +314,13 @@ fmr_op_unmap_sync(struct rpcrdma_xprt r_xprt, struct list_head mrs)

		return;

		out_reset:
		out_release:
		pr_err("rpcrdma: ib_unmap_fmr failed (%i)\n", rc);

		while (!list_empty(mrs)) {
		mr = rpcrdma_mr_pop(mrs);
		list_del(&mr->fmr.fm_mr->list);
		fmr_op_recover_mr(mr);
		rpcrdma_mr_recycle(mr);
		}
		}

		@@ -339,7 +328,6 @@ const struct rpcrdma_memreg_ops rpcrdma_fmr_memreg_ops = {
		.ro_map = fmr_op_map,
		.ro_send = fmr_op_send,
		.ro_unmap_sync = fmr_op_unmap_sync,
		.ro_recover_mr = fmr_op_recover_mr,
		.ro_open = fmr_op_open,
		.ro_maxpages = fmr_op_maxpages,
		.ro_init_mr = fmr_op_init_mr,

net/sunrpc/xprtrdma/frwr_ops.c

+47 −83

Original line number	Diff line number	Diff line
		@@ -97,6 +97,44 @@ out_not_supported:
		return false;
		}

		static void
		frwr_op_release_mr(struct rpcrdma_mr *mr)
		{
		int rc;

		rc = ib_dereg_mr(mr->frwr.fr_mr);
		if (rc)
		pr_err("rpcrdma: final ib_dereg_mr for %p returned %i\n",
		mr, rc);
		kfree(mr->mr_sg);
		kfree(mr);
		}

		/* MRs are dynamically allocated, so simply clean up and release the MR.
		* A replacement MR will subsequently be allocated on demand.
		*/
		static void
		frwr_mr_recycle_worker(struct work_struct *work)
		{
		struct rpcrdma_mr *mr = container_of(work, struct rpcrdma_mr, mr_recycle);
		enum rpcrdma_frwr_state state = mr->frwr.fr_state;
		struct rpcrdma_xprt *r_xprt = mr->mr_xprt;

		trace_xprtrdma_mr_recycle(mr);

		if (state != FRWR_FLUSHED_LI) {
		trace_xprtrdma_dma_unmap(mr);
		ib_dma_unmap_sg(r_xprt->rx_ia.ri_device,
		mr->mr_sg, mr->mr_nents, mr->mr_dir);
		}

		spin_lock(&r_xprt->rx_buf.rb_mrlock);
		list_del(&mr->mr_all);
		r_xprt->rx_stats.mrs_recycled++;
		spin_unlock(&r_xprt->rx_buf.rb_mrlock);
		frwr_op_release_mr(mr);
		}

		static int
		frwr_op_init_mr(struct rpcrdma_ia ia, struct rpcrdma_mr mr)
		{
		@@ -113,6 +151,7 @@ frwr_op_init_mr(struct rpcrdma_ia ia, struct rpcrdma_mr mr)
		goto out_list_err;

		INIT_LIST_HEAD(&mr->mr_list);
		INIT_WORK(&mr->mr_recycle, frwr_mr_recycle_worker);
		sg_init_table(mr->mr_sg, depth);
		init_completion(&frwr->fr_linv_done);
		return 0;
		@@ -131,79 +170,6 @@ out_list_err:
		return rc;
		}

		static void
		frwr_op_release_mr(struct rpcrdma_mr *mr)
		{
		int rc;

		rc = ib_dereg_mr(mr->frwr.fr_mr);
		if (rc)
		pr_err("rpcrdma: final ib_dereg_mr for %p returned %i\n",
		mr, rc);
		kfree(mr->mr_sg);
		kfree(mr);
		}

		static int
		__frwr_mr_reset(struct rpcrdma_ia ia, struct rpcrdma_mr mr)
		{
		struct rpcrdma_frwr *frwr = &mr->frwr;
		int rc;

		rc = ib_dereg_mr(frwr->fr_mr);
		if (rc) {
		pr_warn("rpcrdma: ib_dereg_mr status %d, frwr %p orphaned\n",
		rc, mr);
		return rc;
		}

		frwr->fr_mr = ib_alloc_mr(ia->ri_pd, ia->ri_mrtype,
		ia->ri_max_frwr_depth);
		if (IS_ERR(frwr->fr_mr)) {
		pr_warn("rpcrdma: ib_alloc_mr status %ld, frwr %p orphaned\n",
		PTR_ERR(frwr->fr_mr), mr);
		return PTR_ERR(frwr->fr_mr);
		}

		dprintk("RPC: %s: recovered FRWR %p\n", __func__, frwr);
		frwr->fr_state = FRWR_IS_INVALID;
		return 0;
		}

		/* Reset of a single FRWR. Generate a fresh rkey by replacing the MR.
		*/
		static void
		frwr_op_recover_mr(struct rpcrdma_mr *mr)
		{
		enum rpcrdma_frwr_state state = mr->frwr.fr_state;
		struct rpcrdma_xprt *r_xprt = mr->mr_xprt;
		struct rpcrdma_ia *ia = &r_xprt->rx_ia;
		int rc;

		rc = __frwr_mr_reset(ia, mr);
		if (state != FRWR_FLUSHED_LI) {
		trace_xprtrdma_dma_unmap(mr);
		ib_dma_unmap_sg(ia->ri_device,
		mr->mr_sg, mr->mr_nents, mr->mr_dir);
		}
		if (rc)
		goto out_release;

		rpcrdma_mr_put(mr);
		r_xprt->rx_stats.mrs_recovered++;
		return;

		out_release:
		pr_err("rpcrdma: FRWR reset failed %d, %p released\n", rc, mr);
		r_xprt->rx_stats.mrs_orphaned++;

		spin_lock(&r_xprt->rx_buf.rb_mrlock);
		list_del(&mr->mr_all);
		spin_unlock(&r_xprt->rx_buf.rb_mrlock);

		frwr_op_release_mr(mr);
		}

		/* On success, sets:
		* ep->rep_attr.cap.max_send_wr
		* ep->rep_attr.cap.max_recv_wr
		@@ -385,7 +351,7 @@ frwr_op_map(struct rpcrdma_xprt r_xprt, struct rpcrdma_mr_seg seg,
		mr = NULL;
		do {
		if (mr)
		rpcrdma_mr_defer_recovery(mr);
		rpcrdma_mr_recycle(mr);
		mr = rpcrdma_mr_get(r_xprt);
		if (!mr)
		return ERR_PTR(-EAGAIN);
		@@ -452,7 +418,7 @@ out_dmamap_err:
		out_mapmr_err:
		pr_err("rpcrdma: failed to map mr %p (%d/%d)\n",
		frwr->fr_mr, n, mr->mr_nents);
		rpcrdma_mr_defer_recovery(mr);
		rpcrdma_mr_recycle(mr);
		return ERR_PTR(-EIO);
		}

		@@ -571,7 +537,7 @@ frwr_op_unmap_sync(struct rpcrdma_xprt r_xprt, struct list_head mrs)
		if (bad_wr != first)
		wait_for_completion(&frwr->fr_linv_done);
		if (rc)
		goto reset_mrs;
		goto out_release;

		/* ORDER: Now DMA unmap all of the MRs, and return
		* them to the free MR list.
		@@ -583,22 +549,21 @@ unmap:
		}
		return;

		reset_mrs:
		out_release:
		pr_err("rpcrdma: FRWR invalidate ib_post_send returned %i\n", rc);

		/* Find and reset the MRs in the LOCAL_INV WRs that did not
		/* Unmap and release the MRs in the LOCAL_INV WRs that did not
		* get posted.
		*/
		while (bad_wr) {
		frwr = container_of(bad_wr, struct rpcrdma_frwr,
		fr_invwr);
		mr = container_of(frwr, struct rpcrdma_mr, frwr);

		__frwr_mr_reset(ia, mr);

		bad_wr = bad_wr->next;

		list_del(&mr->mr_list);
		frwr_op_release_mr(mr);
		}
		goto unmap;
		}

		const struct rpcrdma_memreg_ops rpcrdma_frwr_memreg_ops = {
		@@ -606,7 +571,6 @@ const struct rpcrdma_memreg_ops rpcrdma_frwr_memreg_ops = {
		.ro_send = frwr_op_send,
		.ro_reminv = frwr_op_reminv,
		.ro_unmap_sync = frwr_op_unmap_sync,
		.ro_recover_mr = frwr_op_recover_mr,
		.ro_open = frwr_op_open,
		.ro_maxpages = frwr_op_maxpages,
		.ro_init_mr = frwr_op_init_mr,

net/sunrpc/xprtrdma/rpc_rdma.c

+1 −1

Original line number	Diff line number	Diff line
		@@ -803,7 +803,7 @@ rpcrdma_marshal_req(struct rpcrdma_xprt r_xprt, struct rpc_rqst rqst)
		struct rpcrdma_mr *mr;

		mr = rpcrdma_mr_pop(&req->rl_registered);
		rpcrdma_mr_defer_recovery(mr);
		rpcrdma_mr_recycle(mr);
		}

		/* This implementation supports the following combinations

net/sunrpc/xprtrdma/transport.c

+1 −1

Original line number	Diff line number	Diff line
		@@ -792,7 +792,7 @@ void xprt_rdma_print_stats(struct rpc_xprt xprt, struct seq_file seq)
		r_xprt->rx_stats.bad_reply_count,
		r_xprt->rx_stats.nomsg_call_count);
		seq_printf(seq, "%lu %lu %lu %lu %lu %lu\n",
		r_xprt->rx_stats.mrs_recovered,
		r_xprt->rx_stats.mrs_recycled,
		r_xprt->rx_stats.mrs_orphaned,
		r_xprt->rx_stats.mrs_allocated,
		r_xprt->rx_stats.local_inv_needed,

Admin message