Merge tag 'mlx5-updates-2018-03-30' of git://git.kernel.org/pub/scm/linux/kernel/git/saeed/linux (8bde261e) · Commits · 戴 / test

drivers/net/ethernet/mellanox/mlx5/core/en.h

+54 −61

Original line number	Diff line number	Diff line
		@@ -57,24 +57,12 @@

		#define MLX5E_ETH_HARD_MTU (ETH_HLEN + VLAN_HLEN + ETH_FCS_LEN)

		#define MLX5E_HW2SW_MTU(priv, hwmtu) ((hwmtu) - ((priv)->hard_mtu))
		#define MLX5E_SW2HW_MTU(priv, swmtu) ((swmtu) + ((priv)->hard_mtu))
		#define MLX5E_HW2SW_MTU(params, hwmtu) ((hwmtu) - ((params)->hard_mtu))
		#define MLX5E_SW2HW_MTU(params, swmtu) ((swmtu) + ((params)->hard_mtu))

		#define MLX5E_MAX_DSCP 64
		#define MLX5E_MAX_NUM_TC 8

		#define MLX5E_PARAMS_MINIMUM_LOG_SQ_SIZE 0x6
		#define MLX5E_PARAMS_DEFAULT_LOG_SQ_SIZE 0xa
		#define MLX5E_PARAMS_MAXIMUM_LOG_SQ_SIZE 0xd

		#define MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE 0x1
		#define MLX5E_PARAMS_DEFAULT_LOG_RQ_SIZE 0xa
		#define MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE 0xd

		#define MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE_MPW 0x2
		#define MLX5E_PARAMS_DEFAULT_LOG_RQ_SIZE_MPW 0x3
		#define MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE_MPW 0x6

		#define MLX5_RX_HEADROOM NET_SKB_PAD
		#define MLX5_SKB_FRAG_SZ(len) (SKB_DATA_ALIGN(len) + \
		SKB_DATA_ALIGN(sizeof(struct skb_shared_info)))
		@@ -95,11 +83,29 @@
		#define MLX5_MPWRQ_PAGES_PER_WQE BIT(MLX5_MPWRQ_WQE_PAGE_ORDER)

		#define MLX5_MTT_OCTW(npages) (ALIGN(npages, 8) / 2)
		#define MLX5E_REQUIRED_MTTS(wqes) \
		(wqes * ALIGN(MLX5_MPWRQ_PAGES_PER_WQE, 8))
		#define MLX5E_VALID_NUM_MTTS(num_mtts) (MLX5_MTT_OCTW(num_mtts) - 1 <= U16_MAX)
		#define MLX5E_REQUIRED_WQE_MTTS (ALIGN(MLX5_MPWRQ_PAGES_PER_WQE, 8))
		#define MLX5E_LOG_ALIGNED_MPWQE_PPW (ilog2(MLX5E_REQUIRED_WQE_MTTS))
		#define MLX5E_REQUIRED_MTTS(wqes) (wqes * MLX5E_REQUIRED_WQE_MTTS)
		#define MLX5E_MAX_RQ_NUM_MTTS \
		((1 << 16) * 2) /* So that MLX5_MTT_OCTW(num_mtts) fits into u16 */
		#define MLX5E_ORDER2_MAX_PACKET_MTU (order_base_2(10 * 1024))
		#define MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE_MPW \
		(ilog2(MLX5E_MAX_RQ_NUM_MTTS / MLX5E_REQUIRED_WQE_MTTS))
		#define MLX5E_LOG_MAX_RQ_NUM_PACKETS_MPW \
		(MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE_MPW + \
		(MLX5_MPWRQ_LOG_WQE_SZ - MLX5E_ORDER2_MAX_PACKET_MTU))

		#define MLX5E_PARAMS_MINIMUM_LOG_SQ_SIZE 0x6
		#define MLX5E_PARAMS_DEFAULT_LOG_SQ_SIZE 0xa
		#define MLX5E_PARAMS_MAXIMUM_LOG_SQ_SIZE 0xd

		#define MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE 0x1
		#define MLX5E_PARAMS_DEFAULT_LOG_RQ_SIZE 0xa
		#define MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE min_t(u8, 0xd, \
		MLX5E_LOG_MAX_RQ_NUM_PACKETS_MPW)

		#define MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE_MPW 0x2

		#define MLX5_UMR_ALIGN (2048)
		#define MLX5_MPWRQ_SMALL_PACKET_THRESHOLD (256)

		#define MLX5E_PARAMS_DEFAULT_LRO_WQE_SZ (64 * 1024)
		@@ -124,8 +130,13 @@
		#define MLX5E_UPDATE_STATS_INTERVAL 200 /* msecs */
		#define MLX5E_SQ_RECOVER_MIN_INTERVAL 500 /* msecs */

		#define MLX5E_ICOSQ_MAX_WQEBBS \
		(DIV_ROUND_UP(sizeof(struct mlx5e_umr_wqe), MLX5_SEND_WQE_BB))
		#define MLX5E_UMR_WQE_INLINE_SZ \
		(sizeof(struct mlx5e_umr_wqe) + \
		ALIGN(MLX5_MPWRQ_PAGES_PER_WQE * sizeof(struct mlx5_mtt), \
		MLX5_UMR_MTT_ALIGNMENT))
		#define MLX5E_UMR_WQEBBS \
		(DIV_ROUND_UP(MLX5E_UMR_WQE_INLINE_SZ, MLX5_SEND_WQE_BB))
		#define MLX5E_ICOSQ_MAX_WQEBBS MLX5E_UMR_WQEBBS

		#define MLX5E_XDP_MIN_INLINE (ETH_HLEN + VLAN_HLEN)
		#define MLX5E_XDP_TX_DS_COUNT \
		@@ -155,26 +166,6 @@ static inline u16 mlx5_min_rx_wqes(int wq_type, u32 wq_size)
		}
		}

		static inline int mlx5_min_log_rq_size(int wq_type)
		{
		switch (wq_type) {
		case MLX5_WQ_TYPE_LINKED_LIST_STRIDING_RQ:
		return MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE_MPW;
		default:
		return MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE;
		}
		}

		static inline int mlx5_max_log_rq_size(int wq_type)
		{
		switch (wq_type) {
		case MLX5_WQ_TYPE_LINKED_LIST_STRIDING_RQ:
		return MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE_MPW;
		default:
		return MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE;
		}
		}

		static inline int mlx5e_get_max_num_channels(struct mlx5_core_dev *mdev)
		{
		return is_kdump_kernel() ?
		@@ -197,7 +188,7 @@ struct mlx5e_umr_wqe {
		struct mlx5_wqe_ctrl_seg ctrl;
		struct mlx5_wqe_umr_ctrl_seg uctrl;
		struct mlx5_mkey_seg mkc;
		struct mlx5_wqe_data_seg data;
		struct mlx5_mtt inline_mtts[0];
		};

		extern const char mlx5e_self_tests[][ETH_GSTRING_LEN];
		@@ -233,7 +224,7 @@ enum mlx5e_priv_flag {
		struct mlx5e_params {
		u8 log_sq_size;
		u8 rq_wq_type;
		u8 log_rq_size;
		u8 log_rq_mtu_frames;
		u16 num_channels;
		u8 num_tc;
		bool rx_cqe_compress_def;
		@@ -251,6 +242,8 @@ struct mlx5e_params {
		u32 lro_timeout;
		u32 pflags;
		struct bpf_prog *xdp_prog;
		unsigned int sw_mtu;
		int hard_mtu;
		};

		#ifdef CONFIG_MLX5_CORE_EN_DCB
		@@ -433,7 +426,6 @@ struct mlx5e_icosq {
		void __iomem *uar_map;
		u32 sqn;
		u16 edge;
		__be32 mkey_be;
		unsigned long state;

		/* control path */
		@@ -458,16 +450,13 @@ struct mlx5e_wqe_frag_info {
		};

		struct mlx5e_umr_dma_info {
		__be64 *mtt;
		dma_addr_t mtt_addr;
		struct mlx5e_dma_info dma_info[MLX5_MPWRQ_PAGES_PER_WQE];
		struct mlx5e_umr_wqe wqe;
		};

		struct mlx5e_mpw_info {
		struct mlx5e_umr_dma_info umr;
		u16 consumed_strides;
		u16 skbs_frags[MLX5_MPWRQ_PAGES_PER_WQE];
		DECLARE_BITMAP(xdp_xmit_bitmap, MLX5_MPWRQ_PAGES_PER_WQE);
		};

		/* a single cache unit is capable to serve one napi call (for non-striding rq)
		@@ -484,9 +473,16 @@ struct mlx5e_page_cache {

		struct mlx5e_rq;
		typedef void (mlx5e_fp_handle_rx_cqe)(struct mlx5e_rq, struct mlx5_cqe64*);
		typedef struct sk_buff *
		(mlx5e_fp_skb_from_cqe_mpwrq)(struct mlx5e_rq rq, struct mlx5e_mpw_info *wi,
		u16 cqe_bcnt, u32 head_offset, u32 page_idx);
		typedef bool (mlx5e_fp_post_rx_wqes)(struct mlx5e_rq rq);
		typedef void (mlx5e_fp_dealloc_wqe)(struct mlx5e_rq, u16);

		enum mlx5e_rq_flag {
		MLX5E_RQ_FLAG_XDP_XMIT = BIT(0),
		};

		struct mlx5e_rq {
		/* data path */
		struct mlx5_wq_ll wq;
		@@ -497,12 +493,12 @@ struct mlx5e_rq {
		u32 frag_sz; /* max possible skb frag_sz */
		union {
		bool page_reuse;
		bool xdp_xmit;
		};
		} wqe;
		struct {
		struct mlx5e_umr_wqe umr_wqe;
		struct mlx5e_mpw_info *info;
		void *mtt_no_align;
		mlx5e_fp_skb_from_cqe_mpwrq skb_from_cqe_mpwrq;
		u16 num_strides;
		u8 log_stride_sz;
		bool umr_in_progress;
		@@ -534,7 +530,9 @@ struct mlx5e_rq {

		/* XDP */
		struct bpf_prog *xdp_prog;
		unsigned int hw_mtu;
		struct mlx5e_xdpsq xdpsq;
		DECLARE_BITMAP(flags, 8);

		/* control */
		struct mlx5_wq_ctrl wq_ctrl;
		@@ -767,7 +765,6 @@ struct mlx5e_priv {
		struct mlx5e_tir inner_indir_tir[MLX5E_NUM_INDIR_TIRS];
		struct mlx5e_tir direct_tir[MLX5E_MAX_NUM_CHANNELS];
		u32 tx_rates[MLX5E_MAX_NUM_SQS];
		int hard_mtu;

		struct mlx5e_flow_steering fs;
		struct mlx5e_vxlan_db vxlan;
		@@ -846,11 +843,12 @@ bool mlx5e_post_rx_mpwqes(struct mlx5e_rq *rq);
		void mlx5e_dealloc_rx_wqe(struct mlx5e_rq *rq, u16 ix);
		void mlx5e_dealloc_rx_mpwqe(struct mlx5e_rq *rq, u16 ix);
		void mlx5e_free_rx_mpwqe(struct mlx5e_rq rq, struct mlx5e_mpw_info wi);

		u8 mlx5e_mpwqe_get_log_stride_size(struct mlx5_core_dev *mdev,
		struct mlx5e_params *params);
		u8 mlx5e_mpwqe_get_log_num_strides(struct mlx5_core_dev *mdev,
		struct mlx5e_params *params);
		struct sk_buff *
		mlx5e_skb_from_cqe_mpwrq_linear(struct mlx5e_rq rq, struct mlx5e_mpw_info wi,
		u16 cqe_bcnt, u32 head_offset, u32 page_idx);
		struct sk_buff *
		mlx5e_skb_from_cqe_mpwrq_nonlinear(struct mlx5e_rq rq, struct mlx5e_mpw_info wi,
		u16 cqe_bcnt, u32 head_offset, u32 page_idx);

		void mlx5e_update_stats(struct mlx5e_priv *priv);

		@@ -981,11 +979,6 @@ static inline void mlx5e_cq_arm(struct mlx5e_cq *cq)
		mlx5_cq_arm(mcq, MLX5_CQ_DB_REQ_NOT, mcq->uar->map, cq->wq.cc);
		}

		static inline u32 mlx5e_get_wqe_mtt_offset(struct mlx5e_rq *rq, u16 wqe_ix)
		{
		return wqe_ix * ALIGN(MLX5_MPWRQ_PAGES_PER_WQE, 8);
		}

		extern const struct ethtool_ops mlx5e_ethtool_ops;
		#ifdef CONFIG_MLX5_CORE_EN_DCB
		extern const struct dcbnl_rtnl_ops mlx5e_dcbnl_ops;
		@@ -1111,7 +1104,7 @@ void mlx5e_detach_netdev(struct mlx5e_priv *priv);
		void mlx5e_destroy_netdev(struct mlx5e_priv *priv);
		void mlx5e_build_nic_params(struct mlx5_core_dev *mdev,
		struct mlx5e_params *params,
		u16 max_channels);
		u16 max_channels, u16 mtu);
		u8 mlx5e_params_calculate_tx_min_inline(struct mlx5_core_dev *mdev);
		void mlx5e_rx_dim_work(struct work_struct *work);
		#endif /* __MLX5_EN_H__ */

drivers/net/ethernet/mellanox/mlx5/core/en_ethtool.c

+7 −72

Original line number	Diff line number	Diff line
		@@ -220,60 +220,12 @@ static void mlx5e_get_ethtool_stats(struct net_device *dev,
		mlx5e_ethtool_get_ethtool_stats(priv, stats, data);
		}

		static u32 mlx5e_rx_wqes_to_packets(struct mlx5e_priv *priv, int rq_wq_type,
		int num_wqe)
		{
		int packets_per_wqe;
		int stride_size;
		int num_strides;
		int wqe_size;

		if (rq_wq_type != MLX5_WQ_TYPE_LINKED_LIST_STRIDING_RQ)
		return num_wqe;

		stride_size = 1 << mlx5e_mpwqe_get_log_stride_size(priv->mdev, &priv->channels.params);
		num_strides = 1 << mlx5e_mpwqe_get_log_num_strides(priv->mdev, &priv->channels.params);
		wqe_size = stride_size * num_strides;

		packets_per_wqe = wqe_size /
		ALIGN(ETH_DATA_LEN, stride_size);
		return (1 << (order_base_2(num_wqe * packets_per_wqe) - 1));
		}

		static u32 mlx5e_packets_to_rx_wqes(struct mlx5e_priv *priv, int rq_wq_type,
		int num_packets)
		{
		int packets_per_wqe;
		int stride_size;
		int num_strides;
		int wqe_size;
		int num_wqes;

		if (rq_wq_type != MLX5_WQ_TYPE_LINKED_LIST_STRIDING_RQ)
		return num_packets;

		stride_size = 1 << mlx5e_mpwqe_get_log_stride_size(priv->mdev, &priv->channels.params);
		num_strides = 1 << mlx5e_mpwqe_get_log_num_strides(priv->mdev, &priv->channels.params);
		wqe_size = stride_size * num_strides;

		num_packets = (1 << order_base_2(num_packets));

		packets_per_wqe = wqe_size /
		ALIGN(ETH_DATA_LEN, stride_size);
		num_wqes = DIV_ROUND_UP(num_packets, packets_per_wqe);
		return 1 << (order_base_2(num_wqes));
		}

		void mlx5e_ethtool_get_ringparam(struct mlx5e_priv *priv,
		struct ethtool_ringparam *param)
		{
		int rq_wq_type = priv->channels.params.rq_wq_type;

		param->rx_max_pending = mlx5e_rx_wqes_to_packets(priv, rq_wq_type,
		1 << mlx5_max_log_rq_size(rq_wq_type));
		param->rx_max_pending = 1 << MLX5E_PARAMS_MAXIMUM_LOG_RQ_SIZE;
		param->tx_max_pending = 1 << MLX5E_PARAMS_MAXIMUM_LOG_SQ_SIZE;
		param->rx_pending = mlx5e_rx_wqes_to_packets(priv, rq_wq_type,
		1 << priv->channels.params.log_rq_size);
		param->rx_pending = 1 << priv->channels.params.log_rq_mtu_frames;
		param->tx_pending = 1 << priv->channels.params.log_sq_size;
		}

		@@ -288,13 +240,9 @@ static void mlx5e_get_ringparam(struct net_device *dev,
		int mlx5e_ethtool_set_ringparam(struct mlx5e_priv *priv,
		struct ethtool_ringparam *param)
		{
		int rq_wq_type = priv->channels.params.rq_wq_type;
		struct mlx5e_channels new_channels = {};
		u32 rx_pending_wqes;
		u32 min_rq_size;
		u8 log_rq_size;
		u8 log_sq_size;
		u32 num_mtts;
		int err = 0;

		if (param->rx_jumbo_pending) {
		@@ -308,23 +256,10 @@ int mlx5e_ethtool_set_ringparam(struct mlx5e_priv *priv,
		return -EINVAL;
		}

		min_rq_size = mlx5e_rx_wqes_to_packets(priv, rq_wq_type,
		1 << mlx5_min_log_rq_size(rq_wq_type));
		rx_pending_wqes = mlx5e_packets_to_rx_wqes(priv, rq_wq_type,
		param->rx_pending);

		if (param->rx_pending < min_rq_size) {
		if (param->rx_pending < (1 << MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE)) {
		netdev_info(priv->netdev, "%s: rx_pending (%d) < min (%d)\n",
		__func__, param->rx_pending,
		min_rq_size);
		return -EINVAL;
		}

		num_mtts = MLX5E_REQUIRED_MTTS(rx_pending_wqes);
		if (priv->channels.params.rq_wq_type == MLX5_WQ_TYPE_LINKED_LIST_STRIDING_RQ &&
		!MLX5E_VALID_NUM_MTTS(num_mtts)) {
		netdev_info(priv->netdev, "%s: rx_pending (%d) request can't be satisfied, try to reduce.\n",
		__func__, param->rx_pending);
		1 << MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE);
		return -EINVAL;
		}

		@@ -335,17 +270,17 @@ int mlx5e_ethtool_set_ringparam(struct mlx5e_priv *priv,
		return -EINVAL;
		}

		log_rq_size = order_base_2(rx_pending_wqes);
		log_rq_size = order_base_2(param->rx_pending);
		log_sq_size = order_base_2(param->tx_pending);

		if (log_rq_size == priv->channels.params.log_rq_size &&
		if (log_rq_size == priv->channels.params.log_rq_mtu_frames &&
		log_sq_size == priv->channels.params.log_sq_size)
		return 0;

		mutex_lock(&priv->state_lock);

		new_channels.params = priv->channels.params;
		new_channels.params.log_rq_size = log_rq_size;
		new_channels.params.log_rq_mtu_frames = log_rq_size;
		new_channels.params.log_sq_size = log_sq_size;

		if (!test_bit(MLX5E_STATE_OPENED, &priv->state)) {

drivers/net/ethernet/mellanox/mlx5/core/en_main.c

+162 −148

File changed.

Preview size limit exceeded, changes collapsed.

drivers/net/ethernet/mellanox/mlx5/core/en_rep.c

+2 −3

Original line number	Diff line number	Diff line
		@@ -877,9 +877,10 @@ static void mlx5e_build_rep_params(struct mlx5_core_dev *mdev,
		MLX5_CQ_PERIOD_MODE_START_FROM_CQE :
		MLX5_CQ_PERIOD_MODE_START_FROM_EQE;

		params->hard_mtu = MLX5E_ETH_HARD_MTU;
		params->log_sq_size = MLX5E_PARAMS_MINIMUM_LOG_SQ_SIZE;
		params->rq_wq_type = MLX5_WQ_TYPE_LINKED_LIST;
		params->log_rq_size = MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE;
		params->log_rq_mtu_frames = MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE;

		params->rx_dim_enabled = MLX5_CAP_GEN(mdev, cq_moderation);
		mlx5e_set_rx_cq_mode_params(params, cq_period_mode);
		@@ -926,8 +927,6 @@ static void mlx5e_init_rep(struct mlx5_core_dev *mdev,

		priv->channels.params.num_channels = profile->max_nch(mdev);

		priv->hard_mtu = MLX5E_ETH_HARD_MTU;

		mlx5e_build_rep_params(mdev, &priv->channels.params);
		mlx5e_build_rep_netdev(netdev);

drivers/net/ethernet/mellanox/mlx5/core/en_rx.c

+160 −124

Original line number	Diff line number	Diff line
		@@ -296,37 +296,28 @@ void mlx5e_dealloc_rx_wqe(struct mlx5e_rq *rq, u16 ix)
		mlx5e_free_rx_wqe(rq, wi);
		}

		static inline int mlx5e_mpwqe_strides_per_page(struct mlx5e_rq *rq)
		{
		return rq->mpwqe.num_strides >> MLX5_MPWRQ_WQE_PAGE_ORDER;
		}

		static inline void mlx5e_add_skb_frag_mpwqe(struct mlx5e_rq *rq,
		struct sk_buff *skb,
		struct mlx5e_mpw_info *wi,
		u32 page_idx, u32 frag_offset,
		u32 len)
		struct mlx5e_dma_info *di,
		u32 frag_offset, u32 len)
		{
		unsigned int truesize = ALIGN(len, BIT(rq->mpwqe.log_stride_sz));

		dma_sync_single_for_cpu(rq->pdev,
		wi->umr.dma_info[page_idx].addr + frag_offset,
		di->addr + frag_offset,
		len, DMA_FROM_DEVICE);
		wi->skbs_frags[page_idx]++;
		page_ref_inc(di->page);
		skb_add_rx_frag(skb, skb_shinfo(skb)->nr_frags,
		wi->umr.dma_info[page_idx].page, frag_offset,
		len, truesize);
		di->page, frag_offset, len, truesize);
		}

		static inline void
		mlx5e_copy_skb_header_mpwqe(struct device *pdev,
		struct sk_buff *skb,
		struct mlx5e_mpw_info *wi,
		u32 page_idx, u32 offset,
		u32 headlen)
		struct mlx5e_dma_info *dma_info,
		u32 offset, u32 headlen)
		{
		u16 headlen_pg = min_t(u32, headlen, PAGE_SIZE - offset);
		struct mlx5e_dma_info *dma_info = &wi->umr.dma_info[page_idx];
		unsigned int len;

		/* Aligning len to sizeof(long) optimizes memcpy performance */
		@@ -347,104 +338,93 @@ mlx5e_copy_skb_header_mpwqe(struct device *pdev,
		}
		}

		static inline void mlx5e_post_umr_wqe(struct mlx5e_rq *rq, u16 ix)
		void mlx5e_free_rx_mpwqe(struct mlx5e_rq rq, struct mlx5e_mpw_info wi)
		{
		struct mlx5e_mpw_info *wi = &rq->mpwqe.info[ix];
		struct mlx5e_icosq *sq = &rq->channel->icosq;
		struct mlx5_wq_cyc *wq = &sq->wq;
		struct mlx5e_umr_wqe *wqe;
		u8 num_wqebbs = DIV_ROUND_UP(sizeof(*wqe), MLX5_SEND_WQE_BB);
		u16 pi;
		const bool no_xdp_xmit =
		bitmap_empty(wi->xdp_xmit_bitmap, MLX5_MPWRQ_PAGES_PER_WQE);
		struct mlx5e_dma_info *dma_info = wi->umr.dma_info;
		int i;

		/* fill sq edge with nops to avoid wqe wrap around */
		while ((pi = (sq->pc & wq->sz_m1)) > sq->edge) {
		sq->db.ico_wqe[pi].opcode = MLX5_OPCODE_NOP;
		mlx5e_post_nop(wq, sq->sqn, &sq->pc);
		for (i = 0; i < MLX5_MPWRQ_PAGES_PER_WQE; i++)
		if (no_xdp_xmit \|\| !test_bit(i, wi->xdp_xmit_bitmap))
		mlx5e_page_release(rq, &dma_info[i], true);
		}

		wqe = mlx5_wq_cyc_get_wqe(wq, pi);
		memcpy(wqe, &wi->umr.wqe, sizeof(*wqe));
		wqe->ctrl.opmod_idx_opcode =
		cpu_to_be32((sq->pc << MLX5_WQE_CTRL_WQE_INDEX_SHIFT) \|
		MLX5_OPCODE_UMR);
		static void mlx5e_post_rx_mpwqe(struct mlx5e_rq *rq)
		{
		struct mlx5_wq_ll *wq = &rq->wq;
		struct mlx5e_rx_wqe *wqe = mlx5_wq_ll_get_wqe(wq, wq->head);

		sq->db.ico_wqe[pi].opcode = MLX5_OPCODE_UMR;
		sq->pc += num_wqebbs;
		mlx5e_notify_hw(&sq->wq, sq->pc, sq->uar_map, &wqe->ctrl);
		rq->mpwqe.umr_in_progress = false;

		mlx5_wq_ll_push(wq, be16_to_cpu(wqe->next.next_wqe_index));

		/* ensure wqes are visible to device before updating doorbell record */
		dma_wmb();

		mlx5_wq_ll_update_db_record(wq);
		}

		static int mlx5e_alloc_rx_umr_mpwqe(struct mlx5e_rq *rq,
		u16 ix)
		static inline u16 mlx5e_icosq_wrap_cnt(struct mlx5e_icosq *sq)
		{
		return sq->pc >> MLX5E_PARAMS_MINIMUM_LOG_SQ_SIZE;
		}

		static int mlx5e_alloc_rx_mpwqe(struct mlx5e_rq *rq, u16 ix)
		{
		struct mlx5e_mpw_info *wi = &rq->mpwqe.info[ix];
		int pg_strides = mlx5e_mpwqe_strides_per_page(rq);
		struct mlx5e_dma_info *dma_info = &wi->umr.dma_info[0];
		struct mlx5e_icosq *sq = &rq->channel->icosq;
		struct mlx5_wq_cyc *wq = &sq->wq;
		struct mlx5e_umr_wqe *umr_wqe;
		u16 xlt_offset = ix << (MLX5E_LOG_ALIGNED_MPWQE_PPW - 1);
		int err;
		u16 pi;
		int i;

		/* fill sq edge with nops to avoid wqe wrap around */
		while ((pi = (sq->pc & wq->sz_m1)) > sq->edge) {
		sq->db.ico_wqe[pi].opcode = MLX5_OPCODE_NOP;
		mlx5e_post_nop(wq, sq->sqn, &sq->pc);
		}

		umr_wqe = mlx5_wq_cyc_get_wqe(wq, pi);
		if (unlikely(mlx5e_icosq_wrap_cnt(sq) < 2))
		memcpy(umr_wqe, &rq->mpwqe.umr_wqe,
		offsetof(struct mlx5e_umr_wqe, inline_mtts));

		for (i = 0; i < MLX5_MPWRQ_PAGES_PER_WQE; i++, dma_info++) {
		err = mlx5e_page_alloc_mapped(rq, dma_info);
		if (unlikely(err))
		goto err_unmap;
		wi->umr.mtt[i] = cpu_to_be64(dma_info->addr \| MLX5_EN_WR);
		page_ref_add(dma_info->page, pg_strides);
		umr_wqe->inline_mtts[i].ptag = cpu_to_be64(dma_info->addr \| MLX5_EN_WR);
		}

		memset(wi->skbs_frags, 0, sizeof(wi->skbs_frags) MLX5_MPWRQ_PAGES_PER_WQE);
		bitmap_zero(wi->xdp_xmit_bitmap, MLX5_MPWRQ_PAGES_PER_WQE);
		wi->consumed_strides = 0;

		rq->mpwqe.umr_in_progress = true;

		umr_wqe->ctrl.opmod_idx_opcode =
		cpu_to_be32((sq->pc << MLX5_WQE_CTRL_WQE_INDEX_SHIFT) \|
		MLX5_OPCODE_UMR);
		umr_wqe->uctrl.xlt_offset = cpu_to_be16(xlt_offset);

		sq->db.ico_wqe[pi].opcode = MLX5_OPCODE_UMR;
		sq->pc += MLX5E_UMR_WQEBBS;
		mlx5e_notify_hw(&sq->wq, sq->pc, sq->uar_map, &umr_wqe->ctrl);

		return 0;

		err_unmap:
		while (--i >= 0) {
		dma_info--;
		page_ref_sub(dma_info->page, pg_strides);
		mlx5e_page_release(rq, dma_info, true);
		}

		return err;
		}

		void mlx5e_free_rx_mpwqe(struct mlx5e_rq rq, struct mlx5e_mpw_info wi)
		{
		int pg_strides = mlx5e_mpwqe_strides_per_page(rq);
		struct mlx5e_dma_info *dma_info = &wi->umr.dma_info[0];
		int i;

		for (i = 0; i < MLX5_MPWRQ_PAGES_PER_WQE; i++, dma_info++) {
		page_ref_sub(dma_info->page, pg_strides - wi->skbs_frags[i]);
		mlx5e_page_release(rq, dma_info, true);
		}
		}

		static void mlx5e_post_rx_mpwqe(struct mlx5e_rq *rq)
		{
		struct mlx5_wq_ll *wq = &rq->wq;
		struct mlx5e_rx_wqe *wqe = mlx5_wq_ll_get_wqe(wq, wq->head);

		rq->mpwqe.umr_in_progress = false;

		mlx5_wq_ll_push(wq, be16_to_cpu(wqe->next.next_wqe_index));

		/* ensure wqes are visible to device before updating doorbell record */
		dma_wmb();

		mlx5_wq_ll_update_db_record(wq);
		}

		static int mlx5e_alloc_rx_mpwqe(struct mlx5e_rq *rq, u16 ix)
		{
		int err;

		err = mlx5e_alloc_rx_umr_mpwqe(rq, ix);
		if (unlikely(err)) {
		rq->stats.buff_alloc_err++;

		return err;
		}
		rq->mpwqe.umr_in_progress = true;
		mlx5e_post_umr_wqe(rq, ix);
		return 0;
		}

		void mlx5e_dealloc_rx_mpwqe(struct mlx5e_rq *rq, u16 ix)
		{
		@@ -544,7 +524,7 @@ bool mlx5e_post_rx_mpwqes(struct mlx5e_rq *rq)
		if (!rq->mpwqe.umr_in_progress)
		mlx5e_alloc_rx_mpwqe(rq, wq->head);

		return true;
		return false;
		}

		static void mlx5e_lro_update_tcp_hdr(struct mlx5_cqe64 cqe, struct tcphdr tcp)
		@@ -766,8 +746,7 @@ static inline bool mlx5e_xmit_xdp_frame(struct mlx5e_rq *rq,

		prefetchw(wqe);

		if (unlikely(dma_len < MLX5E_XDP_MIN_INLINE \|\|
		MLX5E_SW2HW_MTU(rq->channel->priv, rq->netdev->mtu) < dma_len)) {
		if (unlikely(dma_len < MLX5E_XDP_MIN_INLINE \|\| rq->hw_mtu < dma_len)) {
		rq->stats.xdp_drop++;
		return false;
		}
		@@ -806,7 +785,7 @@ static inline bool mlx5e_xmit_xdp_frame(struct mlx5e_rq *rq,
		/* move page to reference to sq responsibility,
		* and mark so it's not put back in page-cache.
		*/
		rq->wqe.xdp_xmit = true;
		__set_bit(MLX5E_RQ_FLAG_XDP_XMIT, rq->flags); /* non-atomic */
		sq->db.di[pi] = *di;
		sq->pc++;

		@@ -854,6 +833,24 @@ static inline int mlx5e_xdp_handle(struct mlx5e_rq *rq,
		}
		}

		static inline
		struct sk_buff mlx5e_build_linear_skb(struct mlx5e_rq rq, void *va,
		u32 frag_size, u16 headroom,
		u32 cqe_bcnt)
		{
		struct sk_buff *skb = build_skb(va, frag_size);

		if (unlikely(!skb)) {
		rq->stats.buff_alloc_err++;
		return NULL;
		}

		skb_reserve(skb, headroom);
		skb_put(skb, cqe_bcnt);

		return skb;
		}

		static inline
		struct sk_buff skb_from_cqe(struct mlx5e_rq rq, struct mlx5_cqe64 *cqe,
		struct mlx5e_wqe_frag_info *wi, u32 cqe_bcnt)
		@@ -885,18 +882,13 @@ struct sk_buff skb_from_cqe(struct mlx5e_rq rq, struct mlx5_cqe64 *cqe,
		if (consumed)
		return NULL; /* page/packet was consumed by XDP */

		skb = build_skb(va, frag_size);
		if (unlikely(!skb)) {
		rq->stats.buff_alloc_err++;
		skb = mlx5e_build_linear_skb(rq, va, frag_size, rx_headroom, cqe_bcnt);
		if (unlikely(!skb))
		return NULL;
		}

		/* queue up for recycling/reuse */
		page_ref_inc(di->page);

		skb_reserve(skb, rx_headroom);
		skb_put(skb, cqe_bcnt);

		return skb;
		}

		@@ -918,9 +910,8 @@ void mlx5e_handle_rx_cqe(struct mlx5e_rq rq, struct mlx5_cqe64 cqe)
		skb = skb_from_cqe(rq, cqe, wi, cqe_bcnt);
		if (!skb) {
		/* probably for XDP */
		if (rq->wqe.xdp_xmit) {
		if (__test_and_clear_bit(MLX5E_RQ_FLAG_XDP_XMIT, rq->flags)) {
		wi->di.page = NULL;
		rq->wqe.xdp_xmit = false;
		/* do not return page to cache, it will be returned on XDP_TX completion */
		goto wq_ll_pop;
		}
		@@ -960,9 +951,8 @@ void mlx5e_handle_rx_cqe_rep(struct mlx5e_rq rq, struct mlx5_cqe64 cqe)

		skb = skb_from_cqe(rq, cqe, wi, cqe_bcnt);
		if (!skb) {
		if (rq->wqe.xdp_xmit) {
		if (__test_and_clear_bit(MLX5E_RQ_FLAG_XDP_XMIT, rq->flags)) {
		wi->di.page = NULL;
		rq->wqe.xdp_xmit = false;
		/* do not return page to cache, it will be returned on XDP_TX completion */
		goto wq_ll_pop;
		}
		@@ -985,23 +975,28 @@ wq_ll_pop:
		}
		#endif

		static inline void mlx5e_mpwqe_fill_rx_skb(struct mlx5e_rq *rq,
		struct mlx5_cqe64 *cqe,
		struct mlx5e_mpw_info *wi,
		u32 cqe_bcnt,
		struct sk_buff *skb)
		struct sk_buff *
		mlx5e_skb_from_cqe_mpwrq_nonlinear(struct mlx5e_rq rq, struct mlx5e_mpw_info wi,
		u16 cqe_bcnt, u32 head_offset, u32 page_idx)
		{
		u16 stride_ix = mpwrq_get_cqe_stride_index(cqe);
		u32 wqe_offset = stride_ix << rq->mpwqe.log_stride_sz;
		u32 head_offset = wqe_offset & (PAGE_SIZE - 1);
		u32 page_idx = wqe_offset >> PAGE_SHIFT;
		u32 head_page_idx = page_idx;
		u16 headlen = min_t(u16, MLX5_MPWRQ_SMALL_PACKET_THRESHOLD, cqe_bcnt);
		struct mlx5e_dma_info *di = &wi->umr.dma_info[page_idx];
		u32 frag_offset = head_offset + headlen;
		u16 byte_cnt = cqe_bcnt - headlen;
		u32 byte_cnt = cqe_bcnt - headlen;
		struct mlx5e_dma_info *head_di = di;
		struct sk_buff *skb;

		skb = napi_alloc_skb(rq->cq.napi,
		ALIGN(MLX5_MPWRQ_SMALL_PACKET_THRESHOLD, sizeof(long)));
		if (unlikely(!skb)) {
		rq->stats.buff_alloc_err++;
		return NULL;
		}

		prefetchw(skb->data);

		if (unlikely(frag_offset >= PAGE_SIZE)) {
		page_idx++;
		di++;
		frag_offset -= PAGE_SIZE;
		}

		@@ -1009,18 +1004,59 @@ static inline void mlx5e_mpwqe_fill_rx_skb(struct mlx5e_rq *rq,
		u32 pg_consumed_bytes =
		min_t(u32, PAGE_SIZE - frag_offset, byte_cnt);

		mlx5e_add_skb_frag_mpwqe(rq, skb, wi, page_idx, frag_offset,
		mlx5e_add_skb_frag_mpwqe(rq, skb, di, frag_offset,
		pg_consumed_bytes);
		byte_cnt -= pg_consumed_bytes;
		frag_offset = 0;
		page_idx++;
		di++;
		}
		/* copy header */
		mlx5e_copy_skb_header_mpwqe(rq->pdev, skb, wi, head_page_idx,
		mlx5e_copy_skb_header_mpwqe(rq->pdev, skb, head_di,
		head_offset, headlen);
		/* skb linear part was allocated with headlen and aligned to long */
		skb->tail += headlen;
		skb->len += headlen;

		return skb;
		}

		struct sk_buff *
		mlx5e_skb_from_cqe_mpwrq_linear(struct mlx5e_rq rq, struct mlx5e_mpw_info wi,
		u16 cqe_bcnt, u32 head_offset, u32 page_idx)
		{
		struct mlx5e_dma_info *di = &wi->umr.dma_info[page_idx];
		u16 rx_headroom = rq->buff.headroom;
		u32 cqe_bcnt32 = cqe_bcnt;
		struct sk_buff *skb;
		void va, data;
		u32 frag_size;
		bool consumed;

		va = page_address(di->page) + head_offset;
		data = va + rx_headroom;
		frag_size = MLX5_SKB_FRAG_SZ(rx_headroom + cqe_bcnt32);

		dma_sync_single_range_for_cpu(rq->pdev, di->addr, head_offset,
		frag_size, DMA_FROM_DEVICE);
		prefetch(data);

		rcu_read_lock();
		consumed = mlx5e_xdp_handle(rq, di, va, &rx_headroom, &cqe_bcnt32);
		rcu_read_unlock();
		if (consumed) {
		if (__test_and_clear_bit(MLX5E_RQ_FLAG_XDP_XMIT, rq->flags))
		__set_bit(page_idx, wi->xdp_xmit_bitmap); /* non-atomic */
		return NULL; /* page/packet was consumed by XDP */
		}

		skb = mlx5e_build_linear_skb(rq, va, frag_size, rx_headroom, cqe_bcnt32);
		if (unlikely(!skb))
		return NULL;

		/* queue up for recycling/reuse */
		page_ref_inc(di->page);

		return skb;
		}

		void mlx5e_handle_rx_cqe_mpwrq(struct mlx5e_rq rq, struct mlx5_cqe64 cqe)
		@@ -1028,7 +1064,11 @@ void mlx5e_handle_rx_cqe_mpwrq(struct mlx5e_rq rq, struct mlx5_cqe64 cqe)
		u16 cstrides = mpwrq_get_cqe_consumed_strides(cqe);
		u16 wqe_id = be16_to_cpu(cqe->wqe_id);
		struct mlx5e_mpw_info *wi = &rq->mpwqe.info[wqe_id];
		struct mlx5e_rx_wqe *wqe = mlx5_wq_ll_get_wqe(&rq->wq, wqe_id);
		u16 stride_ix = mpwrq_get_cqe_stride_index(cqe);
		u32 wqe_offset = stride_ix << rq->mpwqe.log_stride_sz;
		u32 head_offset = wqe_offset & (PAGE_SIZE - 1);
		u32 page_idx = wqe_offset >> PAGE_SHIFT;
		struct mlx5e_rx_wqe *wqe;
		struct sk_buff *skb;
		u16 cqe_bcnt;

		@@ -1044,18 +1084,13 @@ void mlx5e_handle_rx_cqe_mpwrq(struct mlx5e_rq rq, struct mlx5_cqe64 cqe)
		goto mpwrq_cqe_out;
		}

		skb = napi_alloc_skb(rq->cq.napi,
		ALIGN(MLX5_MPWRQ_SMALL_PACKET_THRESHOLD,
		sizeof(long)));
		if (unlikely(!skb)) {
		rq->stats.buff_alloc_err++;
		goto mpwrq_cqe_out;
		}

		prefetchw(skb->data);
		cqe_bcnt = mpwrq_get_cqe_byte_cnt(cqe);

		mlx5e_mpwqe_fill_rx_skb(rq, cqe, wi, cqe_bcnt, skb);
		skb = rq->mpwqe.skb_from_cqe_mpwrq(rq, wi, cqe_bcnt, head_offset,
		page_idx);
		if (!skb)
		goto mpwrq_cqe_out;

		mlx5e_complete_rx_cqe(rq, cqe, cqe_bcnt, skb);
		napi_gro_receive(rq->cq.napi, skb);

		@@ -1063,6 +1098,7 @@ mpwrq_cqe_out:
		if (likely(wi->consumed_strides < rq->mpwqe.num_strides))
		return;

		wqe = mlx5_wq_ll_get_wqe(&rq->wq, wqe_id);
		mlx5e_free_rx_mpwqe(rq, wi);
		mlx5_wq_ll_pop(&rq->wq, cqe->wqe_id, &wqe->next.next_wqe_index);
		}

Admin message