基于OpenCV進行文本分塊切割-創新互聯

假設有如下一張圖，如何把其中的文本分塊切割出來，比如“華普超市朝陽門店”、“2015-07-26”就是兩個文本塊。

為濟寧等地區用戶提供了全套網頁設計制作服務，及濟寧網站建設行業解決方案。主營業務為網站設計、網站制作、濟寧網站設計，以傳統方式定制建設網站，并提供域名空間備案等一條龍服務，秉承以專業、用心的態度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求，就會得到認可，從而選擇與我們長期合作。這樣，我們也可以走得更遠！

基于OpenCV進行文本分塊切割

做圖像切割有很多種方法，本文描述一種最直觀的投影檢測法。先來看看什么是投影，簡單來說，投影就是在一定方向上有效像素的數量。來看個直觀的圖像：

基于OpenCV進行文本分塊切割

這是一張水平投影圖與原圖的對比，從投影圖上能看到多個波峰，文字多的地方，投影就長，行間的空白處，投影為0。上個示例代碼：

public void HorizontalProjection()
{
    //以灰度圖方式讀入源文件
    string filename = "source.jpg";
    var src = IplImage.FromFile(filename, LoadMode.GrayScale);

    //二值化，采用閾值分割法
    Cv.Threshold(src, src, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu);

    //存儲投影值的數組
    var h = new int[src.Height];

    //對每一行計算投影值
    for(int y = 0;y < src.Height;++y)
    {
        //遍歷這一行的每一個像素，如果是有效的，累加投影值
        for(int x = 0;x < src.Width;++x)
        {
            var s = Cv.Get2D(src, y, x);
            if(s.Val0 == 255)
                h[y]++;
        }
    }

    //準備一個圖像用于畫投影圖
    var paintY = Cv.CreateImage(src.Size, BitDepth.U8, 1);
    Cv.Zero(paintY);

    //畫圖
    var t = new CvScalar(255);
    for(int y = 0;y < src.Height;++y)
    {
        for(int x = 0;x < h[y];++x)
            Cv.Set2D(paintY, y, x, t);
    }

    //顯示
    using(var window = new CvWindow("Source"))
    {
        window.Image = src;
        using(var win2 = new CvWindow("Projection"))
        {
            win2.Image = paintY;
            Cv.WaitKey();
        }
    }
}

顯然找出波峰對應的y值，就能把行切割開了。得到一行以后，可以采用類似的思想進行垂直投影，挑了一行測試一下，效果如下：

基于OpenCV進行文本分塊切割

可以看到效果不是特別好，左右結構的漢字有可能被切開，一個完整的數值也有可能分成多個數字，這種情況需要做一下處理，比如識別的時候要判斷如果間距較小就認為仍是同一文本塊，或者對圖像進行一下橫向膨脹處理：

var kernal = Cv.CreateStructuringElementEx(3, 1, 1, 0, ElementShape.Rect);
Cv.Dilate(src, src, kernal, 4);

再計算投影，得到的效果就好多了：

基于OpenCV進行文本分塊切割

最后上完整代碼以及切割效果展示：

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;

using OpenCvSharp;
using OpenCvSharp.Extensions;
using OpenCvSharp.Utilities;

namespace OpenCvTest
{
    class Program
    {
        static void Main(string[] args)
        {
            //打開源文件
            string filename = "source.jpg";
            var src = IplImage.FromFile(filename);

            //轉成灰度圖
            var gray = Cv.CreateImage(src.Size, BitDepth.U8, 1);
            Cv.CvtColor(src, gray, ColorConversion.BgrToGray);

            //二值化，閾值分割算法
            Cv.Threshold(gray, gray, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu);

            //分行
            var rows = GetRowRects(gray);

            //針對每一行再分塊
            var items = new List<CvRect>();
            foreach (var row in rows)
            {
                var cols = GetBlockRects(gray.Clone(row), row.Y);
                items.AddRange(cols);
            }

            //把識別出的每一塊畫到原圖上去
            var color = new CvScalar(255, 0, 0);
            foreach (var rect in items)
            {
                Cv.DrawRect(src, rect, color, 1);
            }

            //顯示
            using (var window = new CvWindow("Image"))
            {
                window.Image = src;
                Cv.WaitKey();
            }
        }

        /// <summary>
        /// 識別行
        /// </summary>
        /// <param name="source"></param>
        /// <returns></returns>
        private static List<CvRect> GetRowRects(IplImage source)
        {
            var rows = new List<CvRect>();

            //用于存儲投影值
            var projection = new int[source.Height];

            //遍歷每一行計算投影值
            for (int y = 0; y < source.Height; ++y)
            {
                for (int x = 0; x < source.Width; ++x)
                {
                    var s = Cv.Get2D(source, y, x);
                    if (s.Val0 == 255)
                        projection[y]++;
                }
            }

            bool inLine = false;
            int start = 0;

            //開始根據投影值識別分割點
            for (int i = 0; i < projection.Length; ++i)
            {
                if (!inLine && projection[i] > 10)
                {
                    //由空白進入字符區域了，記錄標記
                    inLine = true;
                    start = i;
                }
                else if ((i - start > 5) && projection[i] < 10 && inLine)
                {
                    //由字符區域進入空白區域了
                    inLine = false;

                    //忽略高度太小的行，比如分隔線
                    if (i - start > 10)
                    {
                        //記錄下位置
                        var rect = new CvRect(0, start - 1 , source.Width, i - start + 2);
                        rows.Add(rect);
                    }
                }
            }
            
            return rows;
        }

        /// <summary>
        /// 識別塊
        /// </summary>
        /// <param name="source"></param>
        /// <param name="rowY"></param>
        /// <returns></returns>
        private static List<CvRect> GetBlockRects(IplImage source, int rowY)
        {
            var blocks = new List<CvRect>();

            //用于存儲投影值
            var projection = new int[source.Width];
            
            //先進行橫向膨脹
            var kernal = Cv.CreateStructuringElementEx(3, 1, 1, 0, ElementShape.Rect);
            Cv.Dilate(source, source, kernal, 4);

            //遍歷每一列計算投影值
            for (int x = 0; x < source.Width; ++x)
            {
                for (int y = 0; y < source.Height; ++y)
                {
                    var s = Cv.Get2D(source, y, x);
                    if (s.Val0 == 255)
                        projection[x]++;
                }
            }

            bool inBlock = false;
            int start = 0;

            //開始根據投影值識別分割點
            for (int i = 0; i < projection.Length; ++i)
            {
                if (!inBlock && projection[i] >= 2)
                {
                    //由空白區域進入字符區域了
                    inBlock = true;
                    start = i;
                }
                else if ((i - start > 10) && inBlock && projection[i] < 2)
                {
					//由字符區域進入空白區域了
					inBlock = false;

					//記錄位置，注意由于傳入的是source只是一行，因此最終的位置信息要+rowY
					if(blocks.Count > 0)
					{
						//跟上一個比一下，如果距離過近，認為是同一個文本塊，合并
						var last = blocks[blocks.Count - 1];

						if (start - last.X - last.Width <= 5)
						{
							blocks.RemoveAt(blocks.Count - 1);
							var rect = new CvRect(last.X, rowY, i - last.X, source.Height);
							blocks.Add(rect);
						}
						else
						{
							var rect = new CvRect(start, rowY, i - start, source.Height);
							blocks.Add(rect);
						}
					}
					else
					{
						var rect = new CvRect(start, rowY, i - start, source.Height);
						blocks.Add(rect);
					}                }
            }

            return blocks;
        }
    }
}

得到的圖像如下，效果還行，將來繼續優化吧：

基于OpenCV進行文本分塊切割

未經許可嚴禁轉載。

另外有需要云服務器可以了解下創新互聯scvps.cn，海內外云服務器15元起步，三天無理由+7*72小時售后在線，公司持有idc許可證，提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案，具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢，專為企業上云打造定制，能夠滿足用戶豐富、多元化的應用場景需求。

名稱欄目：基于OpenCV進行文本分塊切割-創新互聯
文章起源：http://vcdvsql.cn/article42/ppeec.html

成都網站建設公司_創新互聯，為您提供外貿網站建設、企業建站、網站排名、搜索引擎優化、營銷型網站建設、手機網站建設

聲明：本網站發布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網站立場，如需處理請聯系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經允許不得轉載，或轉載時需注明來源：創新互聯

猜你還喜歡下面的內容

bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

基于OpenCV進行文本分塊切割-創新互聯