“2003年度中国科学院杰出科技成就奖”颁奖仪式3月19日在北京举行,汉王科技总裁兼中科院自动化研究所文字识别中心主任的刘迎建榜上有名。
“中科院杰出科技成就奖”是中国科学院根据近5年内所做出的重大创新成果来评定的,刘迎建在“863”等国家计划的支持下,在联机与脱机手写体汉字识别等文字识别技术领域均取得了国际领先的研究成果,解决了手写汉字识别问题和印刷体汉字识别问题,并获得了多项国家发明专利,而且还非常注重成果产业化工作,推出了解决PC汉字输入问题的汉王笔系列及汉王OCR系列产品,占有国内70%以上的零售市场。据悉,由手写汉字识别技术带动的GDP超过100个亿,产生了显著的经济效益和社会效益。刘迎建堪称汉字识别王国的领袖,获此殊荣,当之无愧。
核心技术打造核心能力
在很多时候,一提起汉字输入,人们马上反应到的往往是键盘。事实上对于全社会的日益信息化,键盘输入有着许多的缺陷:由于汉字是方块字,而作为“舶来品”的键盘又全是英文字符,因此要操作键盘输入汉字就需要较高的教育水平,而对于全民教育水准相对还比较低的中国来讲,相当多的一部分人被排斥在键盘输入之外,这就意味着他们几乎与全社会的信息化“绝缘”;刘迎建就是在这个背景下,十分执著地开始了汉字识别王国(OCR)的征程。汉王的发展并非一帆风顺,但有着坚韧的军人意志的刘迎建就是不言放弃,经历风雨,终见彩虹。
OCR识别、手写识别是目前汉字识别输入的两大主导技术,也是两项核心技术,作为一家有着中科院背景的技术型企业,汉王科技在这些核心技术上的优势是显而易见的,而这也正是汉王的核心能力所在。
OC的中文意思就是通过光学技术对字符进行识别,在文字识别输入领域,OCR技术主要用于文字和表格自动识别和输入,替代人工键入汉字和表格的工作。OCR技术应用于计算机的输入端,无疑给使用者带来极大的方便。在信息化进程加快的今天,OCR技术已经成为一种极为重要的非键盘输入技术,在各行各业以至普通人的学习工作中都具有重要的意义。
汉王在中文OCR技术上居于国内外的领先地位。目前汉王OCR技术对于印刷体汉字的识别率最高达到99%以上,可识别宋体、黑体、楷体、仿宋体、繁体等多种字体,并且可以对多种字体、不同字号、表格混合排版等复杂版式进行识别,在此技术基础上的一系列票据识别系统、表格识别系统等等都已经获得了应用。目前,汉王仍在坚持不懈地进行OCR技术水平的提高和应用的深入,以使得国内的中文OCR技术水平获得进一步的深入发展。
汉字的手写识别技术通过手写笔等轨迹捕获设备获得书写者的书写信息,然后进行识别,将手写字转换输入计算机。作为手写汉字识别的开创者,汉王在软硬件手写识别技术上都处于国际领先水平。在硬件上,汉王已经突破了无线无源技术,达到了国际一流水平;在软件上,汉王不仅摆脱了手写识别对笔顺的依赖,并且实现了汉字工整字识别———连笔字识别———行草字识别的跨越。
经过前赴后继十多年的持续攻关,汉王科技已经在识别OCR、手写识别两项核心技术上积累了足够的优势,而且这也正是汉王科技开拓汉字识别产业的核心能力所在。
软硬结合的“识别王国”
“汉王工业园”的前身是汉王制造有限公司,该公司1998年成立时,主要任务就是承担汉王手写笔的生产任务,随着汉王科技业务的迅速扩展,很快成为世界上规模最大的手写板生产基地,并在2000年1月被国家科技部确立为首批《国家高技术研究发展计划成果产业化基地》。记者采访得知,占地面积达3万平方米,总投资1.2亿元的“汉王工业园”目前正在燕郊经济技术开发区建设。“汉王工业园”预计将在明年下半年完工。作为老牌的软件企业的汉王科技,开创了软件企业建硬件生产基地的先河。
刘迎建告诉记者,汉王投入那么大的财力建设工业园,主要出于两个原因,一是满足汉王目前的产品和市场扩展需要,因为近年来,汉王手写笔、名片通、文本王等产品的市场需求急剧增长,比如去年汉王的销售额比上年同期增长了56%,现有的生产能力已经逐渐满足不了需求。第二个原因就是因为目前汉王的手写识别、光学字符识别、指纹识别、车牌识别、智能通讯等技术都已经十分成熟,下一步主要任务就是致力于实现产业化。按照刘迎建的观点,技术是1,产品是10,而市场是100。建设生产基地就可以自行解决生产问题。“汉王工业园”建成后,将成为名副其实的国内最大的文字识别产品生产基地。
在以汉王为代表的一批厂商的努力下,目前汉字的各种文字识别技术已经逐渐成熟,相应的产品和应用市场也逐渐成了气候。中国的文字识别产业也将进入一个新的快速发展阶段。
|