2024年优秀研究生开题报告(第30页)
本文共计59156个字,预计阅读时长198分钟。【 字体:大 中 小 】
三、国内外研究现状和发展趋势:
数字图像的识别最早可以追溯到60年代。1966年,ibm公司的casey和nagy发表了第一篇关于数字图像识别的论文,在这篇论文中他们利用简单的模板匹配法识别了1,000个数字图像。70年代以来,日本学者做了许多工作,其中有代表性的系统有1977年东芝综合研究所研制的可以识别XX个汉字的单体印刷体识别系统;80年代初期,日本武藏野电气研究所研制的可以识别2300个多体汉字的数字图像识别系统,代表了当时汉字识别的最高水平。此外,日本的太平洋、松下、理光和富士等公司也有其研制的汉字识别系统。这些系统在方法上,大都采用基于k-l数字变换的匹配方案,使用了大量专用硬件,其设备有的相当于小型机甚至大型机,价格极其昂贵,没有得到广泛应用。
我国对数字图像识别的研究始于70年代末、80年代初,大致可以分为三大阶段:
第一阶段从70年代末期到80年代末期,主要是算法和方案探索。研究人员提出了用于汉字识别的各种方法和特征,如特征点法、汉字周边特征、汉字的结构元特征等,并在此基础上研究成功一批汉字识别系统。这一阶段是数字图像识别成果倍出的时期。但是,这些成果还仅仅停留在实验室阶段,没有转化为产品来实际解决数字图像的自动输入问题。
第二阶段是90年代初期,中文ocr由实验室走向市场,初步实用,在实际的汉字识别输入应用条件下,检验和考查这些研究成果。这一阶段形成了一些初步实用的印刷汉字识别系统开始进入市场。
第三阶段也就是目前,主要是印刷体识别技术和系统性能的提高,包括汉英双语混排识别率的提高和稳健性的增强。
其中,从1986年初到1988年是数字图像识别和联机数字图像识别研究的丰收期。数字图像识别是汉字识别研究的主要内容。自1986年以来,各种识别软件和系统纷纷涌现,某些识别装置可以初步使用,它们的主机全部采用微机。主要的性能指标为:1.识别字数;2.识别率:对中等质量印刷问题达到95%-99%;3.识别速度;4.识别字体、字号等等。这些系统都配备了方便的`用户界面,从版面分析、文本识别到识别结果的处理,形成了一个完整的识别输入系统。印刷体印刷汉字识别的研究,也在进行中,自x年以来,己有若干个软件与系统成功研制并参与鉴定。
同国外相比,我国的数字图像识别研究起步较晚。但由于我国政府从80年代开始对汉字自动识别输人的研究给予了充分的重视和支持,经过科研人员于多年的辛勤努力,数字图像识别技术的发展和应用有了长足进步,从简单的单体识别发展到多种字体混排的多体识别,从中文印刷材料的识别发展到中英文混排印刷材料的双语识别。各个系统可以支持简、繁体汉字的识别,解决了多体多字号混排文本的识别问题,对于简单的版面可以进行有效的定量分析,同时汉字识别率已达到了98%以上。
当前,数字图像识别研究的主要目的是提高识别系统的品质和效率,增强系统对不同文本的适应性,扩大使用面。在加强版面分析、识别结果上下文匹配后处理和各种实用化技术的研制的同时,进行对识别方法的进一步研究,促使更实用的产品出现。 2024年优秀研究生开题报告(第30页) 篇25
第一条
学位论文开题报名是研究生写作论文的必经过程,所有研究生(含:博士生、硕士生)在修完学位课程,写作学位论文之前都必须作开题报告。
第二条
开题报告主要检验研究生对专业知识的独立驾驭能力和研究能力,考察写作论文准备工作是否深入细致,包括选题是否恰当,资料占有是否翔实、全面,对国内外的研究现状是否了解,本人的研究是否具有开拓性、创新性等。
第三条
学位论文开题报告前,研究生必须根据专业培养目标,结合导师、教研室(或研究室)所承担的国家、省部委等有关部门下达的研究项目或课题以及本人的研究特长,与导师协商,确定选题,广泛查阅文献,深入调研,收集资料,制定学术研究方案,在此基础上撰写开题报名。
第四条
研究生进行开题报名,必须提交"开题报告"的书面材料,内容包括:
(1)论文选题的理由或意义;
(2)国内外关于该课题的研究现状及趋势;
(3)本人的研究计划,包括研究目标、内容、拟突破的难题或攻克的难关、自己的创新或特色、实验方案或写作计划等;

