全国咨询热线
400-810-8816 (免长话费)
95105918 (免长话费)
或直拨 010-82825656

技术授权咨询电话
汉王手写识别技术
010-82786830 / 82786832
汉王OCR识别技术
010-82786810 / 82786815
行业应用产品咨询电话
汉王证照王
010-82786814 / 82786810
汉王税控收款机
010-82786628
汉王高速扫描仪
010-82786660
汉王视频智能监控系统
010-82786805 / 82786605
汉王“易识”全能图文识别
010-82786810
汉王数据加工
010-82786815
汉王人像识别
010-82786500-8148
     汉王数据加工
 
 
一、汉王数据加工业务介绍

1. 业务范围

  主要针对报纸、书刊、杂志、图册、表单、公文等形式的纸介数据,通过汉王独特的专业化解决方案,加工成PDF、Html、Txt、Doc、Xls等多种可编辑的电子文件格式。我们的服务对象包括报社、图书馆、出版社、杂志社、档案馆、银行、保险、财会、大型企事业单位等。

2. 数据加工流程


  数据加工可以划分成以下几道工序(较详细的系统说明见附录):


3. 汉王数据加工的特点

  · 提高了字符集的范围,将GB2312-80字库升级到GBK字库和BIG5字符集,使得识别的范围更加广泛,同时输出及校对使用国际通用Unicode码。加强了对老资料的处理能力。

  · 改变加工的处理方式,加入以“篇”的处理的方式,可以使得资料中的文章具有逻辑特性,满足文章在不同版面的上接下转的应用。

  · 丰富及改进了标引结构,使得加入标引更加快捷与方便,提高了工作效率,大大提高了资料的处理速度。

  · 高效的OCR识别录入、完善的校对整理
  采用国际领先的汉王OCR识别技术,识别率高、速度快;快捷精确的横校、纵校、对比校对;支持多种电子文档存储格式:PDF、HTML、RTF、TXT、XLS,方便地实现全文检索,并将逐步与国际标准电子文档格式接轨。

  · 完善的员工管理功能
  综合了考勤管理、岗位管理、工资管理三大功能,系统自动记录员工出勤情况,自动为各岗位分配工作并记录分配情况及工作量,通过强大的管理功能,保证数据加工的高效,准确。

  · 自动进行各工序环节的监督和调度协调
  服务器给各岗位分配任务,并进行任务协调,使各客户端的任务既相互独立又形成完整的生产流程,提高工作效率,使得文字处理速度可达到每人班10-12万字,比手工录入的效率提高5-8倍。系统自动进行员工工作量计算、差错量监控,可将整体差错量控制在万分之二以内,从而达到了出版质量要求。

  · 严格的质量控制
  汉王的数据加工系统包含了对质量的控制程序,通过参沙、抽检设计等办法使得管理员能够及时掌握员工的质量情况。

  · 军工生产企业的保密资质
  汉王公司拥有军工生产企业资质,资料的保存与保密工作是军工生产企业一项重要工作,汉王制造近年积累的保密经验与标准可以保证客户交由我们处理的资料得以完整的保存,并可保证资料信息的不外泄。我们可以在保质、保量、保密状态下完成数据加工任务。

二、与汉王技术结伴而行的客户


  图书馆:
  家图书馆、中科院图书馆、上海图书馆、苏州图书馆…

  军政机关:
  中华人民共和国总装备部、国家专利局….

  出版社:
  新华出版社、…

  金融保险:
  建行、工行、浦发、交通、华夏、兴业、台州、湘潭…

  企事业单位:
  万方数据、同方数据、点通数据、书生公司、超星数据、重庆维普、方正阿帕比、东方飞扬、世纪科怡、清华紫光、新华书店…

三、汉王近年来所获得的资质与荣誉


  汉王资质:

  ·国家文字识别工程中心
  ·“八五”、“九五”、“863”、自然科学基金等重点项目
  ·国家863计划成果产业化基地
  ·被科技部第一批认定为“国家高技术研究发展计划成果产业化基地”
  ·被国家科技部认定为“国家火炬计划重点高新技术企业”?
  ·被信息产业部认定为“中国软件业最大规模前100家企业软件企业”?
  ·“汉王”被评为2003年度北京市著名商标
   ……

  汉王荣誉:

  ·国家科技进步二等奖(2006)--汉王OCR技术应用
  ·北京市科技进步一等奖(2005)--汉王OCR技术应用
  ·信息产业部重大技术发明奖(2002 2006)
  ·中科院杰出科技成就奖
  ·北京市质量管理优秀奖
   ……

四、我们的承诺

  依靠我们的技术和理念为您提供最精致的服务!
  及时、保质、保量、保密的完成客户交与的任务!


五、汉王OCR介绍

  OCR是英文(Optical Character Recognition)的缩写,意为光学字符识别。通过光学扫描仪和计算机的配合,OCR软件将图像数据进行运算分类后,将图像数据转化为计算机内码。它可以极大地减轻数据录入工作的强度、提高数据录入的速度。

  在现今这个信息化的社会中,数字化信息资源的建设与管理对现有印刷品数字化的需求越来越强,通过OCR技术处理的电子文档将广泛应用于各种电子出版物、网络资源、各种大型文献资料管理数据库、数字化图书馆等多种领域。OCR技术应用是信息资源建设中的最重要阶段,OCR技术同时是数据加工的核心技术.

  北京汉王科技有限公司自1985年起就开始从事OCR技术的研究工作,曾受到国家863计划、国家自然科学基金委员会、中国科学院的支持,研究内容涉及到中文、英文、日文、韩文的印刷体识别,中文的手写体识别,手写数字识别,表格识别与还原,版面分析与还原,中文OCR系统。

  汉王在处理各类资料方面积累了大量的经验,特别是汉王的录入工厂广泛应用于包括图书馆,档案馆,国家专利局,各类数据加工商如清华同方,万方数据等企、事业单位.在各行业中作为他们的有效工具,极大的提高了数据的处理效率.

  目前汉王OCR核心各项关键技术均位于国际领先水平,具体参数如下:

  · 汉王OCR技术的适应性与学习功能:
  汉王OCR技术具有很强的学习功能,可以对所识别文字进行适应性的训练,从而极大的提高识别正确率。此功能尤其适用于对古文字的识别,如对解放前后常用的繁体字进行识别性训练后,可以极大提高老报纸的处理速度与准确率。

  · 汉字多字体识别:
  多字体识别全面支持宋体、仿宋、楷体、黑体圆体、隶书、隶变、魏碑、行楷及各种变体。

  · 大字符集识别技术:
  大字符集简繁混排识别支持GBK字库,可识别2万多简繁体汉字,满足了古籍识别的需求,对于一些古文字需要进行

  · 多识别引擎:
  采用了3个以上识别核心来提高识别率,降低误识率。并可准确定位可疑字。

  · 中英文混排识别技术:
  目前已达到国际领先水平。

  · 手写体数字识别:
  具有3个以上独立的识别引擎,集成识别率达99%以上。

  · 印刷体数字识别:
  具有4个以上独立的识别引擎,识别率为99.5%。

  · 表格识别技术:
  可以识别复杂表格,包括开口表,无线表等表格.
联系方式:

联 系 人:万小军 武雪娟
电 话:010-82786815 / 82786699-8200 / 13801001807
传 真:010-82786862
E-mail:wanxiaojun@hanwang.com.cn / Wuxuejuan@hanwang.com.cn
 
Copyright © 1999 - 2008 汉王科技股份有限公司版权所有 咨询及技术服务:95105918(免区号) | 渠道专区
北京市海淀区东北旺西路8号中关村软件园5号楼汉王大厦3层 邮编:100193 总机:010-82786699 京ICP备05039526