
三、模型构建
模型研究是现代科学方法论中的一种重要手段,是通过一定程度的简化来表达研究对象本质特征的科学方法。少数民族地区政务大厅“多语言服务环境”构建的关键是通过某种形式的抽象和简化,获得对其构成要素和组合关系的全面认识,进而将其通过形式化方法进行表达,作为服务体系规划的基本依据。信息生态系统建模的基本方法是:确定系统涉及的要素实体;确定要素实体之间的整体关系;对要素实体进行细分,再根据细分后的复杂关系确定对其规划和管理的策略和方法。其中,最为关键的步骤就是系统顶层架构模型的设计。
1.信息生态系统的顶层模型
根据上述所做的要素分析,民族地区政务大厅多语言服务环境主要由生成信息的工作人员(IP)、提供多语言服务的工作人员(ID)和使用不同语言的用户群体(IU)、多语言信息资源(IR)、跨语言服务的中介体系(IM)和信息环境(IE)构成。用户可以访问熟悉的语言文字生成的信息资源,也可以与使用同种语言文字的工作人员直接交流。由于语言文字差异性的存在,用户需要访问不熟悉语言文字的信息资源或者与使用不同语言的其他用户进行交流的时候,就需要借助于多语言服务环境所提供的跨语言支持体系。跨语言中介支持模块是体系的核心部分,其建设的科学性、完备性决定了整个体系建设的成败。少数民族地区政务大厅多语言服务环境的顶层架构如图1所示。

图1 少数民族地区政务大厅多语言信息生态系统
图1当中,使用不同语言的公民群体,可以在政务大厅内直接阅读自己熟悉语言文字的信息(IU—IR),可以与使用同样语言的政府工作人员进行交流(IU—ID),也可以通过大厅的电子设备查询相关信息(IU—IM—IR)。如果公民群体使用的是另外一种语言文字,则可以通过人工中介方式进行咨询,也可以通过多语言信息检索或机器翻译技术自动获得帮助(IU—IM—IR)。政府业务处理人员在生成信息资源的时候,也应该考虑到不同语言文字应用能力公民群体的需要,对部分政务信息资源进行双语著录或双语对照保存(IP—IR)。
2.主要信息生态链分析
民族地区政务大厅多语言服务环境主要是通过各类跨语言交流的支持策略和手段,降低语言文字差异性对信息交流构成的障碍,使公民群体获得更好的信息服务体验。图1当中,IU—IR是直接访问和阅读用熟悉的语言文字记录的信息资源,IU—ID是公民直接与和自己使用同样语言的政府工作人员进行交流,这是信息交流的理想状态,此时信息交流的障碍程度最低。然而,现实环境当中,除了上述情况之外,还存在大量需要借助交流支持体系的情况,即IU—IM—IR和IU—IM—ID两种情况。
(1)信息生态链IU—IM—IR的支持方式
IU—IM—IR是指公民在跨语言支持体系的帮助之下访问和阅读自己不熟悉语言文字生成的信息资源。根据对多语言服务各类要素的分析,公民需要访问自己不熟悉的语言文字生成的信息资源,包括汉族人民访问少数民族语言信息资源,少数民族人民访问国家通用语言文字信息资源,少数民族人民访问其他民族语言文字信息等情况。国家通用语言和少数民族语言之间的跨语言支持是“多语言服务环境”的核心功能。例如,汉族用户需要检索和访问不熟悉语种的少数民族语言信息资源,多语言服务环境当中可能得到的支持途径主要有:①参加该少数民族语言文字的培训课程;②参加少数民族语言文字信息处理技术培训课程;③通过跨语言信息检索系统获得多语言信息资源的相关信息;④浏览该信息资源的国家通用语言文字版本元数据以了解其概要内容;⑤访问与该信息资源同时保存的国家通用语言文字版本;⑥通过查询政务大厅提供的跨语言文献索引进行信息查找;⑦通过查询政务大厅提供的双语词典自助阅读;⑧通过专职翻译人员进行翻译讲解;⑨通过跨语言检索系统进行信息查询;⑩将信息需求提交给计算机辅助跨语言阅读系统,根据系统自动生成的阅读建议进行取舍;11把少数民族语言信息资源的电子版本提交给机器翻译系统进行全文翻译;12通过自助查询系统帮助理解不熟悉的术语;13向专职咨询人员咨询不理解的术语;14通过双语环境提示信息获得相关帮助。反之,如果少数民族用户需要访问国家通用语言文字信息资源,同样可以获得上述支持,所不同的是阅读和咨询使用的本民族的语言文字,通过参加国家通用语言文字培训、阅读国家通用语言文字信息资源的少数民族语言版本著录信息和全文信息,求助于专职翻译人员和咨询人员,将信息资源提交到计算机辅助阅读系统或者机器翻译系统等等。总而言之,“多语言服务环境”就是要在用户跨语言信息访问过程中各个环节提供相应的支持服务,帮助用户克服语言障碍,进行信息资源跨语言检索、访问和阅读。
由于我国语言文字的丰富性,针对任意两种语言文字的跨语言交流进行直接支持则意味着极度庞大的服务支持体系和极端高昂的成本。如果用户希望访问另外一个少数民族的语言文字信息资源,则可以通过国家通用语言文字作为“中间语言”,实现两种语言文字之间的转换。在人工中介方式当中,可以通过主要翻译第一种少数民族语言的翻译人员将其翻译为国家通用语言文字版本,再由主要翻译第二种少数民族语言的翻译人员将其转换成为目标语言信息资源。在机器翻译支持方式当中,从源语言到目标语言的翻译分为两个独立的阶段进行:第一阶段由源语言转换为中间语言,第二阶段由中间语言转换为目标语言。上述两个阶段独立进行,第一阶段不用考虑目标语言,第二阶段不用考虑源语言。例如,要将藏语翻译为蒙古语,第一阶段可以使用“藏语、汉语双语对齐语料库”将藏语翻译为汉语,第二阶段使用“汉语、蒙古语双语对齐语料库”将由藏语翻译而来的汉语再次翻译成为蒙古语,实现了两者的互译,将蒙古语翻译成藏语的过程与之类似。
(2)信息生态链IU—IM—ID的支持方式
IU—IM—ID跨语言信息交流是指公民在跨语言支持体系帮助下与自己使用另外一种语言文字的政府工作人员进行信息交流。根据交流的时间范围,IU—IM—ID跨语言信息交流可以分为“同步交流”和“异步交流”两种情况:“同步交流”是指双方的交流处于同一时空,如面对面的沟通交流;“异步交流”是指双方的交流有一定的时间差,采用一先一后方式轮流发布信息完成交流。
IU—IM—ID异步交流可以获得的跨语言支持途径主要有:①参加对方语言文字的培训课程;②获得多语言邮箱账号,给对方发邮件,系统自动翻译;③登录用户交流平台发布信息,系统自动翻译;④在用户多语言留言板留下纸条,政务大厅专业翻译人员负责将其转换为目标语种信息等等。IU—IM—ID信息交流模式对机器翻译系统依赖较重,尽管机器翻译的质量难以令人满意,但是这种方式毕竟提供了一种跨语言交流的可能性,相对于彻底无法沟通交流的困境而言,也是一种优化和进步。与IU—IM—IR方式相比,IU—IM—ID的“同步交流”属于实时口语交流,后台工作人员没有足够的时间进行信息资源的双语著录,基于客体的支持策略基本上无法发挥作用,因而可能获得的支持途径相对较少。根据图1所示的政务大厅多语言服务环境的顶层架构,如果使用国家通用语言文字的用户需要和另外一位使用少数民族语言文字的用户进行交流,可能从多语言服务环境当中获取的支持方式主要有:①参加对方语言文字的培训课程;②得到人工翻译人员的口译服务;③以计算机为中介进行交流,机器翻译系统将用户输入的语言文字转换成为另外一种语言文字,供对方了解其概要思想。
与IU—IM—IR方式类似,如果两个使用不同少数民族语言的用户需要进行跨语言交流支持,同样需要以国家通用语言为中间语言,通过两个主攻语种不同的专业翻译人员之间的协作,或者通过机器翻译系统的两次翻译来实现,首先将第一种少数民族语言实时交流信息转换为国家通用语言文字信息,接着再将国家通用语言文字版本转换为第二种少数民族语言版本。