解决多队列块设备，在使用 mq-deadline 调度器的场景下，机器卡死的问题

【标题描述】
解决多队列块设备，在使用 mq-deadline 调度器的场景下，机器卡死的问题。
主要原因在于 mq-deadline 是针对 multi queue 的，这种做法会造成 blk_mq_run_hw_queues 中实际会针对每个 hctx 进行唤醒，导致在某些设备的中断上下文中耗时很久。我们在 PM8222 raid 卡上实测的调用路径如下：

```
pqi_irq_handler
    scsi_io_completion # 这里会做io 聚合，一次 irq 可能会处理多个 scsi cmd，调用多次该函数
        scsi_run_queue_async
            blk_mq_run_hw_queues
                blk_mq_run_hw_queue
                    need_run = xxxx && blk_mq_hctx_has_pending(hctx)
                    if need_run
                        __blk_mq_delay_run_hw_queue(hctx, async, 0); # 由于此处 async = 0，所以会向 hctx 对应的 cpu 的 workqueue 加入 work，并通过 ipi 唤醒对应的  CPU 等一系列操作。

```
上述代码中通过调用 blk_mq_hctx_has_pending 判定是否 need_run。 该函数的调用流程如下：

```
blk_mq_hctx_has_pending 
    blk_mq_sched_has_work(hctx);
        e->type->ops.mq.has_work(hctx);
```
当调度器为 mq—deadline 时，会调用该调度器的回调函数 `dd_has_work`。由于 mq_deadline 并非面向 multiqueue的，`dd_has_work` 实际并不关系 hctx 是谁，大概率都会返回 true。
上述的代码会造成一个问题，`pqi_irq_handler` 中每次完成一个 scsi cmd，都会把该块设备的每个 hctx 都唤醒一遍，在 PM8222 raid 卡上，每个块设备有 64 个 hctx，在实际的浪费了大量的 CPU 资源，造成性能过差。

【环境信息】
硬件信息：
1）	多队列块设备，比如浪潮的 PM8222 raid 卡
软件信息：
1）	fio 版本任意
2）	fio 配置如下
```
[global]
name=fiotest
ioengine=libaio
direct=1
iodepth=128
group_reporting
runtime=1000

[random-rw-test1]
rw=randread
bs=4k
size=100Gb
numjobs=1
filename=/dev/sdd # 该设备挂载于 pm8222 raid 卡上
```
【预期结果】
ssd 性能能达到正常水平，大约 80k iops
【实际结果】
7k iops，且内核会产生 softlockup

GVP openEuler/kernel
关闭

内容风险标识

评论 (2)

GVPopenEuler/kernel关闭

内容风险标识