KotlinFlow背壓和線程切換竟然如此相似-創新互聯

前言

上篇分析了Kotlin Flow原理，大部分操作符實現比較簡單，相較而言背壓和線程切換比較復雜，遺憾的是，縱觀網上大部分文章，關于Flow背壓和協程切換這塊的原理說得比較少，語焉不詳，鑒于此，本篇重點分析兩者的原理及使用。
通過本篇文章，你將了解到：

創新互聯公司長期為千余家客戶提供的網站建設服務，團隊從業經驗10年，關注不同地域、不同群體，并針對不同對象提供差異化的產品和服務；打造開放共贏平臺，與合作伙伴共同營造健康的互聯網生態環境。為溫宿企業提供專業的網站建設、成都網站建設，溫宿網站改版等技術服務。擁有10多年豐富建站經驗和眾多成功案例,為您定制開發。

什么是背壓？
如何處理背壓？
Flow buffer的原理
Flow 線程切換的使用
Flow 線程切換的原理

1. 什么是背壓？

先看自然界的水流：

為了充分利用水資源，人類建立了大壩，以大壩為分界點將水流分為上游和下游。

當上游的流速大于下游的流速，日積月累，最終導致大壩溢出，此種現象稱為背壓的出現

而對于Kotlin里的Flow，也有上游（生產者）、下游（消費者）的概念，如：

suspend fun testBuffer1() {var flow = flow {//生產者
            (1..3).forEach {println("emit $it")
                emit(it)
            }
        }

        flow.collect {//消費者
            println("collect:$it")
        }
    }

通過collect操作符觸發了流，從生產者生產數據(flow閉包)，到消費者接收并處理數據(collect閉包），這就完成了流從上游到下游的一次流動過程。

2. 如何處理背壓？

模擬一個生產者消費者速度不一致的場景：

suspend fun testBuffer3() {var flow = flow {(1..3).forEach {delay(1000)
                println("emit $it")
                emit(it)
            }
        }

        var time = measureTimeMillis {flow.collect {delay(2000)
                println("collect:$it")
            }
        }
        println("use time:${time} ms")
    }

計算流從生產到消費的整個時間：

生產者的速度比消費者的速度快，而它倆都是在同一個線程里順序執行的，生產者必須等待消費者消費完畢后才會進行下一次生產。
因此，整個流的耗時=生產者耗時(3 * 1000ms)+消費者耗時(3 * 2000ms)=9s。

顯而易見，消費者影響了生產者的速度，這種情況下該怎么優化呢？
最簡單的解決方案：

生產者和消費者分別在不同的線程執行

如：

suspend fun testBuffer4() {var flow = flow {(1..3).forEach {delay(1000)
                println("emit $it in thread:${Thread.currentThread()}")
                emit(it)
            }
        }.flowOn(Dispatchers.IO)

        var time = measureTimeMillis {flow.collect {delay(2000)
                println("collect:$it in thread:${Thread.currentThread()}")
            }
        }
        println("use time:${time} ms")
    }

添加了flowOn()函數，它的存在使得它前面的代碼在指定的線程里執行，如flow閉包了的代碼都在IO線程執行，也就是生產者在IO線程執行。
而消費者在當前線程執行，因此兩者無需相互等待，節省了總時間：

確實是減少了時間，提升了效率。但我們知道開啟線程代價還是挺大的，既然都在協程里運行了，能否借助協程的特性：協程掛起不阻塞線程來完成此事呢？
此時，Buffer出場了，先看看它是如何表演的：

suspend fun testBuffer5() {var flow = flow {(1..3).forEach {delay(1000)
                println("emit $it in thread:${Thread.currentThread()}")
                emit(it)
            }
        }.buffer(5)

        var time = measureTimeMillis {flow.collect {delay(2000)
                println("collect:$it in thread:${Thread.currentThread()}")
            }
        }
        println("use time:${time} ms")
    }

這次沒有使用flowOn，取而代之的是buffer。
運行結果如下：

可以看出，生產者消費者都是在同一線程執行，但總耗時卻和不在同一線程運行時相差無幾。
那么它是如何做到的呢?這就得從buffer的源碼說起。

3. Flow buffer的原理無buffer

先看看沒有buffer時的耗時：

suspend fun testBuffer3() {var flow = flow {(1..3).forEach {delay(1000)
                println("emit $it")
                emit(it)
            }
        }

        var time = measureTimeMillis {flow.collect {delay(2000)
                println("collect:$it")
            }
        }
        println("use time:${time} ms")
    }

從collect開始，依次執行flow閉包，通過emit調用到collect閉包，因為flow閉包里包含了幾次emit，因此整個流程會有幾次發射。
如上圖，從步驟1到步驟8，因為是在同一個線程里，因此是串行執行的，整個流的耗時即為生產者到消費者(步驟1~步驟8）的耗時。

有buffer

在沒看源碼之前，我們先猜測一下它的流程：

每次emit都發送到buffer里，然后立刻回來繼續發送，如此一來生產者沒有被消費者的速度拖累。
而消費者會檢測Buffer里是否有數據，有則取出來。

根據之前的經驗我們知道：collect調用到emit最后到buffer是線性調用的，放入buffer后繼續循環emit，那么問題來了：

是誰觸發了collect閉包的調用呢？

接下來深入源碼，探究答案。

buffer源碼流程分析

創建Flow

public funFlow.buffer(capacity: Int = Channel.BUFFERED, onBufferOverflow: BufferOverflow = BufferOverflow.SUSPEND): Flow{var capacity = capacity//buffer容量
    var onBufferOverflow = onBufferOverflow//buffer滿之后的處理策略
    if (capacity == Channel.CONFLATED) {capacity = 0
        onBufferOverflow = BufferOverflow.DROP_OLDEST
    }
    // create a flow
    return when (this) {is FusibleFlow ->fuse(capacity = capacity, onBufferOverflow = onBufferOverflow)
        //走else 分支，構造ChannelFlowOperatorImpl
        else ->ChannelFlowOperatorImpl(this, capacity = capacity, onBufferOverflow = onBufferOverflow)
    }
}

buffer 返回Flow實例，其間涉及幾個重要的類和函數：

調用collect
當調用Flow.collect時：

public suspend inline funFlow.collect(crossinline action: suspend (value: T) ->Unit): Unit =
    collect(object : FlowCollector{override suspend fun emit(value: T) = action(value)
    })

構造了匿名內部類FlowCollector，并實現了emit方法，它的實現為collect的閉包。

調用ChannelFlowOperatorImpl.collect最終會調用ChannelFlow.collect：

override suspend fun collect(collector: FlowCollector): Unit =
        coroutineScope {collector.emitAll(produceImpl(this))
        }

    public open fun produceImpl(scope: CoroutineScope): ReceiveChannel=
        scope.produce(context, produceCapacity, onBufferOverflow, start = CoroutineStart.ATOMIC, block = collectToFun)

produceImpl 創建了Channel，內部開啟了協程，返回ReceiveChannel。

再來看emitAll函數：

private suspend funFlowCollector.emitAllImpl(channel: ReceiveChannel, consume: Boolean) {ensureActive()
    var cause: Throwable? = null
    try {while (true) {//掛起等待Channel數據
            val result = run {channel.receiveCatching() }
            if (result.isClosed) {//Channel關閉后才會退出循環
                result.exceptionOrNull()?.let {throw it }
                break // returns normally when result.closeCause == null
            }
            //發送數據
            emit(result.getOrThrow())
        }
    } catch (e: Throwable) {cause = e
        throw e
    } finally {if (consume) channel.cancelConsumed(cause)
    }
}

Channel此時并沒有數據，因此協程會掛起等待。

Channel發送
Channel什么時候有數據呢？當然是在調用了Channel.send()函數后。
前面提到過collect之后開啟了協程：

public open fun produceImpl(scope: CoroutineScope): ReceiveChannel=
        scope.produce(context, produceCapacity, onBufferOverflow, start = CoroutineStart.ATOMIC, block = collectToFun)

  internal val collectToFun: suspend (ProducerScope) ->Unit
        get() = {collectTo(it) }

  protected override suspend fun collectTo(scope: ProducerScope) =
        flowCollect(SendingCollector(scope))

此時傳入的參數為：collectToFun，最后構造了：

public class SendingCollector(
    private val channel: SendChannel) : FlowCollector{override suspend fun emit(value: T): Unit = channel.send(value)
}

當協程得到執行時，會調用collectToFun–>collectTo(it)–>flowCollect(SendingCollector(scope))，最終調用到：

#ChannelFlowOperatorImpl
    override suspend fun flowCollect(collector: FlowCollector) =
        flow.collect(collector)

而該flow為最開始的flow，collector為SendingCollector。
flow.collect后會調用到flow的閉包，進而調用到emit函數：

private fun emit(uCont: Continuation, value: T): Any? {val currentContext = uCont.context
        currentContext.ensureActive()
        //...
        completion = uCont
        return emitFun(collector as FlowCollector, value, this as Continuation)
    }

emitFun本質上會調用collector里的emit函數，而此時的collector即為SendingCollector，最后調用channel.send(value)

如此一來，Channel就將數據發送出去了，此時channel.receiveCatching()被喚醒，接下來執行emit(result.getOrThrow())，這函數最后會流轉到最初始的collect的閉包里。
上面的分析即為生產者到消費者的流轉過程，單看源碼可能比較亂，看圖解惑：

紅色部分和綠色部分分別為不同的協程，它倆的關聯點即是藍色部分。

Flow buffer的本質上是利用了Channel進行數據的發送和接收

buffer為啥能提升效率

前面分析過無buffer時生產者消費者的流程圖，作為對比，我們也將加入buffer后生產者消費者的流程圖。

還是以相同的demo，闡述其流程：

生產者掛起1s，當1s結束后調用emit發射數據，此時數據放入buffer里，生產者調用delay繼續掛起
此時消費者被喚醒，然后掛起 2s等待
第2s到來之時，生產者調用emit發送數據到buffer里，繼續掛起
第2s到來之時，消費者結束掛起，消費數據，然后繼續掛起2s
第3s到來之時，生產者繼續生產數據，而后生產者退出生產
第5s到來之時，消費者掛起結束，消費數據，然后繼續掛起2s
第7s到來之時，消費者掛起結束，消費結束，此時因為channel里已經沒有數據了，退出循環，最終消費者退出

由此可見，總共花費了7s。

ps：協程調度時機不同，打印順序可能略有差異，但總體耗時不變。

至此，我們找到了buffer能夠提高效率的原因：

生產者、消費者運行在不同的協程，掛起操作不阻塞對方

拋出一個比較有意思的問題：以下代碼加buffer之后效率會有提升嗎？

suspend fun testBuffer6() {var flow = flow {(1..3).forEach {println("emit $it")
                emit(it)
            }
        }
        var time = measureTimeMillis {flow.collect {delay(2000)
                println("collect:$it")
            }
        }
        println("use time:${time} ms")
    }

在未實驗之前，如果你已經有答案，恭喜你已經弄懂了buffer的本質。

4. Flow 線程切換的使用

suspend fun testBuffer4() {var flow = flow {(1..3).forEach {delay(1000)
                println("emit $it in thread:${Thread.currentThread()}")
                emit(it)
            }
        }.flowOn(Dispatchers.IO)

        var time = measureTimeMillis {flow.collect {delay(2000)
                println("collect:$it in thread:${Thread.currentThread()}")
            }
        }
        println("use time:${time} ms")
    }

flowOn(Dispatchers.IO)表示其之前的操作符(函數)都在IO線程執行，如這里的意思是flow閉包里的代碼在IO線程執行。
而其之后的操作符(函數)在當前的線程執行。
通常用在子線程里獲取網絡數據(flow閉包)，然后再collect閉包里(主線程)更新UI。

5. Flow 線程切換的原理

public funFlow.flowOn(context: CoroutineContext): Flow{checkFlowContext(context)
    return when {context == EmptyCoroutineContext ->this
        this is FusibleFlow ->fuse(context = context)
        else ->ChannelFlowOperatorImpl(this, context = context)
    }
}

看到這你可能已經有答案了：這不就和buffer一樣的方式嗎？
但仔細看，此處多了個上下文：CoroutineContext。
CoroutineContext的作用就是用來決定協程運行在哪個線程。

前面分析的buffer時，我們的協程的作用域是runBlocking，即使生產者、消費者在不同的協程，但是它們始終在同一個線程里執行。
而使用了flowOn指定線程，此時生產者、消費者在不同的線程運行協程。
因此，只要弄懂了buffer原理，flowOn原理自然而然就懂了。

以上為Flow背壓和線程切換的全部內容，下篇將分析Flow的熱流。
本文基于Kotlin 1.5.3，文中完整Demo請點擊

您若喜歡，請點贊、關注、收藏，您的鼓勵是我前進的動力持續更新中，和我一起步步為營系統、深入學習Android/Kotlin

1、Android各種Context的前世今生
2、Android DecorView 必知必會
3、Window/WindowManager 不可不知之事
4、View Measure/Layout/Draw 真明白了
5、Android事件分發全套服務
6、Android invalidate/postInvalidate/requestLayout 徹底厘清
7、Android Window 如何確定大小/onMeasure()多次執行原因
8、Android事件驅動Handler-Message-Looper解析
9、Android 鍵盤一招搞定
10、Android 各種坐標徹底明了
11、Android Activity/Window/View 的background
12、Android Activity創建到View的顯示過
13、Android IPC 系列
14、Android 存儲系列
15、Java 并發系列不再疑惑
16、Java 線程池系列
17、Android Jetpack 前置基礎系列
18、Android Jetpack 易學易懂系列
19、Kotlin 輕松入門系列
20、Kotlin 協程系列全面解讀

你是否還在尋找穩定的海外服務器提供商？創新互聯www.cdcxhl.cn海外機房具備T級流量清洗系統配攻擊溯源，準確流量調度確保服務器高可用性，企業級服務器適合批量采購，新人活動首月15元起，快前往官網查看詳情吧

名稱欄目：KotlinFlow背壓和線程切換竟然如此相似-創新互聯
當前路徑：http://vcdvsql.cn/article42/ceooec.html

成都網站建設公司_創新互聯，為您提供手機網站建設、網頁設計公司、小程序開發、網站內鏈、企業建站、外貿建站

聲明：本網站發布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網站立場，如需處理請聯系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經允許不得轉載，或轉載時需注明來源：創新互聯

猜你還喜歡下面的內容

bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

KotlinFlow背壓和線程切換竟然如此相似-創新互聯