聚焦藏博会:用信息技术架起西藏文化发展的天路(西藏大学副校长、博士生导师欧珠)

14.10.2014  15:53
>

      为适应现代信息社会,在信息技术的推动下,古老的西藏文化也迈开了自身更新、创新的大步伐,正加快与全球文化的交流和互动,藏文信息技术应运而生。

      在党中央、国务院的关怀下,国内以西藏大学为代表的科研单位自上世纪80年代开始开展藏文信息技术工作,经过30多年的发展,我国藏文信息化建设成绩斐然,突破了多项关键技术,取得了多项国际国内领先的技术成果,率先占领了藏文信息技术制高点。建立起了完备的藏文信息处理交换标准体系;藏文信息技术工程化整体进度取得突破;建立起了藏文信息技术人才培养的完整体系;搭建起了国内高水平藏文信息技术科研平台;藏文信息技术产品推广应用成效显著。

      目前,最成功的推广应用案例是西藏自治区“十一五”规划项目——“藏文软件推广应用”。2010年3月18日,西藏自治区人民政府与工业和信息化部在人民大会堂隆重召开了藏文软件研发与推广应用工作总结报告会,会议对本项目的圆满完成及产生的良好的社会效果给予了高度评价和肯定。

      语音是人类沟通和信息获取最自然、最便捷的方式。藏语语音技术的研究顺应了信息技术的发展趋势,在国家发展和改革委员会、科技部项目的支持下,我们研究藏语语音合成技术和藏语语音识别技术已有多年,特别是藏语语音合成技术方面,我们已突破相关关键技术,形成了整体解决方案,研发出藏语语音合成测试系统。经测试,合成效果在自然度、可懂度方面可达3分以上。

      在藏语语音识别技术研究方面,我们通过973前期研究专项课题《藏语语音识别技术研究》,完成了藏语语音信号预处理、端点检测、特征提取等基础研究工作,形成了识别藏文14644个单音节和常用词语(短语)的解决方案。目前,我们已经采集了1000人合计200小时的藏语语音数据,并对其进行了转写,正采用最新的DNN语音识别技术框架,开展大规模连续藏语语音识别技术的研究。

      作为新兴产业,我们即将推出的藏语语音技术产品,必将在我国藏族地区双语教育、呼叫中心自助式语音服务、各类语音应用系统、互联网和手机增值服务等领域得到广泛应用。

      综观藏文信息技术30多年的发展,成就与压力并存。让我们自豪的是,藏文信息技术在藏文的输入、输出、存储等字符处理层面已有深入的研究,形成了完整的解决方案,达到了与汉文信息处理技术同步发展的水平。令我们倍感压力的是,在对藏文内容处理层面我们的研究较为滞后,与汉文信息处理技术还存在差距,必须奋起直追。

      未来我们将在藏文自然语言处理、藏文模式识别、藏文数字媒体、藏文信息安全、藏文嵌入式系统五个方向开展科研工作,争取在以下四个方面取得更进一步的突破。

      藏语言资源建设。藏文语料库建设包括文本语料库和语音语料库两方面。文本语料库包括纯文本语料、词性标记语料、平衡语料和藏汉平行语料等;语音语料库需要建设基于卫藏、康巴、安多三大藏语方言的面向语音识别和语音合成所需的语料。

      基础理论和技术研究。首先要深入进行藏语言理论学研究,发现其语言现象和规律。其次是解决在计算机中,藏文词语切分和词性标注等具有共性的重大科学问题。不仅要解决技术本身的问题,提高切分和标记的正确率,还需制定藏文分词规范和词性标记集的国家标准。再次是深入研究藏文的句法分析,前提是建立大规模的基于短语结构分析和依存分析的藏文宾州树库和依存树库。

      应用技术研究。中央提出,到2020年西藏将与全国一道建成小康社会,并提出西藏“六个重要”的发展战略定位。为满足西藏社会经济实现跨越式发展的迫切需要,我们将加强在藏汉机器翻译、藏文信息安全、藏文搜索引擎等应用领域的研发力度,尽快推出基于“云计算”的面向移动互联网的应用系统。

      产品的推广应用。藏文信息技术产品的推广应用不能仅靠政府行为,还需社会各界的鼎力支持。在此,我呼吁社会各界继续加大对藏文信息技术产品推广应用的支持力度。

(新闻来源:西藏日报)