OCR技术的黄金时代

2008-03-17 15:32  出处:PConline原创  作者:佚名   责任编辑:mayue 

据国外媒体报道,搜索谷歌就一项针对图片和视频中所含文字内容的识别技术提交了专利申请。据悉该软件于2007年开发成功,它可识别图像、视频中内置的文本内容。谷歌在该专利申请的简要技术说明中表示,这种文字识别使用了计算机辅助技术,其中包括对图像中的文字进行抽取,以前谷歌申请的专利技术多与文本搜索有关。业内人士预计,谷歌未来将在视频、图片搜索服务中向大家提供以OCR图片文字识别技术为核心的搜索服务。这个新闻,让一直默默耕耘着的OCR技术成为世人瞩目的明星。     业界人士称,谷歌所提交的图像和视频文本识别技术属于“光学字符识别(Optical Character Recognition,OCR)”范围。OCR技术已有30多年历史,主要应用于办公室自动化中的文本输人、邮件自动处理等领域。现在,文通信息以TH-OCR为核心技术的文档影像行业解决方案,已经在金融、通信、电力、OA等众多领域广泛应用。可以看出,OCR在个人市场与行业市场都有极大的应用潜力,“无所不能”的OCR技术迎来了它的黄金时代。     个人应用铁三角     在个人应用领域,以前OCR主要应用于批量的文档录入方面,与扫描仪搭配,曾在办公领域独领风骚。近期,随着办公自动化水平不断提升,OCR在个人桌面应用方面有了更多的发展,如:文档管理、网络搜索等等。继谷歌新产品之后,文档录入、文档搜索、文档管理,OCR在个人办公系统中的作用越来越大,已然形成了一个个人应用的铁三角。     尽管是因为DV/DC等移动数码设备的普及,让大家知道并了解文通信息的慧视软件,但不可否认作为一款独立的输入软件,慧视的优势是独一无二的。慧视对图像源的要求降低,使得DV/DC等拍到的图像资料可以被轻松识别,甚至是户外的广告牌、石碑等。自此,OCR受到人们的广泛关注。 谷歌于07年开始进入OCR研究领域,将OCR与传统的搜索技术结合在一起,获得了双赢的效果,可以说谷歌让OCR更亲民,而OCR则让谷歌更强大。通过OCR技术,谷歌可提供更准确、更人性化的搜索服务。只需输入文字,即可准确地搜索到视频、图片等资料里嵌入的文字信息,这项应用不仅仅方便了网民,更会为谷歌带来丰厚利润。      北京文通信息技术有限公司从92年开始就进入OCR领域,经过十五年不断发展,TH-OCR已经将其他OCR技术远远抛在了后面。从技术的可靠性、稳定性和实用性等多个角度来说,TH-OCR是目前最优秀的OCR技术,这可从PaperPort一窥端倪。TH-OCR纸质资料自动录入系统与文档管理软件的结合,彻底革新了个人文档管理工作。纸质资料高速录入电脑后,在通过文档管理软件PaperPort,即可将电子文档转换成PDF等多种格式的电子文档。此外,还可通过一键上传、一键发送等功能,将所得的电子文档快速上传网络和发送邮件。正是这种与多应用软件的结合,给了大家更多的思考,让OCR焕发勃勃生机,走进春天。      文档影像盛世来到      TH-OCR是“863计划”重点项目,由清华大学电子工程系智能图文实验室研发,现在代表我国OCR技术水平的TH-OCR多次获得国际奖项。处于世界领先位置的TH-OCR技术,不仅仅在我国传统的汉字识别上达到了99.8%的识别率,而且已经实现了中英文混排图片文字的识别,同时日、韩等亚洲常见语言文字的识别更是让其他OCR技术望尘莫及。文通在2007年实现了我国少数民族语言识别,这是世界首个蒙藏维哈柯朝多民族语言识别技术。      OCR技术的不断成熟,带动了文档影像市场的整体发展。目前市场上已有很多以OCR为核心的文档影像整体解决方案,文通的整体解决方案就涉及了从金融、政府、图书馆到电力、企事业单位等多个行业,随着OCR技术的不断成熟,它的应用范围也越来越大。      中国人民银行于2007年6月25日建成全国支票影像交换系统,实现了支票在全国范围的互通使用,企事业单位和个人持任何一家银行的支票均可在境内所有地区办理支付。在金融系统,支票的异地使用具有深刻的历史意义和社会意义,而这一过程的实现则是由文档影像技术来保障。通过对支票、证件等凭证影像文档的原式原样保存,电子文档影像文件具有了法律效力,从而实现支票的异地支付,提高了银行工作效率,方便了人们的生活,从长远看更利于我国经济的发展。文通信息首先提出了表格识别的文档影像概念,全力保障金融行业高速可靠地运转。      个人应用与行业应用的全面发展,将OCR技术推上了前台,越来越多的人们开始知道、了解OCR,并时刻感受着OCR技术带来的便利。