2024年第1期(总第41期)
基于教材语料库的《中国概况教学项目表》构建
李 欣 浙江财经大学国际学院
刘元满(通讯作者) 北京大学对外汉语教育学院
王亚敏 北京大学对外汉语教育学院
王 蕾 北京语言大学应用中文学院
摘 要 作为课程的中国概况早已成为来华留学生的必修课,作为教材的中国概况也已有不少编写成果。但由于没有统一的中国概况大纲,教材编写者理念不尽一致,内容选取繁杂多样,统计发现各类教材的知识点重合率过低,分布也极为分散,从而影响到课程教学质量。本研究基于自建的“中国概况教材语料库”,结合相关文化或话题大纲,构建了一个包含四级项目的《中国概况教学项目表》,可为中国概况教学大纲的研制提供客观依据,相关课程设计、教材编写、测试评估等也可以此作为参考。
关键词 中国概况 教学项目表 文化点 教材 语料库
DOI:
10.3969/j.issn.2095-798X.2024.01.004
一、引言
2017 年教育部、外交部、公安部联合制定的《学校招收和培养国际学生管理办法》规定“汉语和中国概况应当作为高等学历教育的必修课”。实际上,除了作为来华学历留学生的必修课程以外,中国概况还是来华语言进修生需学习的重要课程,以及海外大中小学、孔子学院(课堂)和一些汉语教学机构的必备课程。其教学内容有助于加强世界人民相互理解,促进文明交流互鉴。常规的语言课程都采用汉语目的语进行教学,但中国概况课程具有与语言课不同的特性,其教学媒介语一般是汉语,但也有高校针对不同对象用汉语和英语两种语言教授,如郑州大学、江南大学、中国石油大学等。
关于中国概况课程的性质和内容,学界有过很多讨论。早期有研究者认为应“全面而概括性地介绍中国的国情和文化背景知识”(祖晓梅、陆平舟,2006)。后来研究者们注意到中国概况课具有独特的双重性:一方面与文史哲类院系开设的通识课有共通性;另一方面又具有鲜明的“对外”特点,需要考虑学习者的汉语水平和文化背景(吴琼,2016;胡文华,2022)。刘元满(2023)通过比较,意图划清中国概况与中国国情及与中国相关的文化话题、知识点的共核与边界。近年来一些实证研究发现,中国概况课程的语言难度、教材内容、教学方法等不能完全满足留学生的学习需求(康洁,2015;黄卓明、吕兆格,2020)。还有一些研究者从教学叙事角度对中国概况教学进行了理论和实践探讨(郭鹏,2023)。这些研究都启示我们,现有中国概况课程的教学内容应该与留学生迫切想了解的内容相契合,对面向留学生的中国概况课也应该有更准确的认知。
随着中国概况课程地位的提高,相关的教材编写和教学研究也取得了长足进步。近年出版的中国概况教材是学界对中国概况教学和研究成果的集中表现和智慧结晶,同时也“为教学大纲、评估标准的建设提供了重要依据”(刘元满、李欣,2020)。但由于每一部教材都会有自己的编写理念及内容选择,我们很难了解这些教材从整体上提供了什么样的知识点,也很难了解同样的知识点在不同教材中又有着怎样的分布。中国概况的课程设计、教材编写、测试评估等方面都迫切需要以统一的教学大纲为依据,而大纲的研制有很多基础性工作要做,不仅需要对已有的相关大纲做细致梳理,而且需要对已有教材进行文本研究,了解教材中呈现的具体项目以及这些项目具有怎样的应用价值。
二、中国概况相关教学大纲和项目表
由于中国概况的教学内容属于文化大类之下,因此我们一般都需将已有的中国文化教学大纲或项目表作为参照,可资利用的资源主要如下。
2.1 中国文化教学大纲或项目表
目前,影响较大的中国文化教学大纲或项目表主要有以下 3 个:
(1) 《中国文化教学大纲》(由“乘风汉语”项目组编制,简称《大纲》)。该大纲是第一份正式出版的中国文化教学大纲,包含 3 个层次、10 个总类、31 个子类和 190 多个文化点(卢伟,2005)。
(2) 《国际汉语教学通用课程大纲》(简称《通用》)。该大纲由原孔子学院总部 / 国家汉办(2008)组织编写,附有《中国文化题材及文化任务举例表》,其中列举了 17 个文化教学项目,2014 年修订版更为强调综合性的“文化能力”,从文化知识、文化理解、跨文化能力、国际视界四个方面提出要求,其中的“文化知识”属于具体教学内容,主要包含 6 个级别的 11 类 145 个教学项目。
(3)《中华文化项目表》(简称《项目表》)。该项目表由周小兵等(2019)基于中山大学全球汉语教材库3212 册教材研制而成,包括 5 个一层项目、46 个二层项目、212 个三层项目,其研制方法和教学内容较以往有较大突破。
早期的《大纲》和《通用》具有开创意义,但由于所编内容只服务于各自教学所需,并不追求全面性和系统性,比如《大纲》缺少历史、政治、经济、文学、艺术等方面的内容;《通用》以汉语水平等级为划分标准,未顾及文化知识的内部层级关系和难易程度。由于出版时间较早,《大纲》和《通用》的研制缺少大规模语料库的支撑,研制方法和流程也都受时代限制。《项目表》基于全球汉语教材库的数据,构建了较为全面、系统的中国文化教学层级体系,弥补了以往同类大纲在系统性、覆盖面和辅助信息上的不足,研制手段也更为科学。这些大纲和项目表对中国文化相关的课程设计和教材编写起到了一定的规范作用。
尽管中国概况与中国文化在课程内容方面有很多共通性内容,但中国概况课程中的国情知识占有很大比重,而国情知识并不等于文化知识(胡文华,2022),因此这些以文化项目为中心的大纲和项目表与中国概况的教学目标和内容需求还有不少距离。
2.2 专门的中国概况大纲和参考框架
近年来,一些高校的专家学者根据课程需要,专门为中国概况编制了教学大纲,其中比较有代表性的是程爱民 2018 年编写的教材《中国概况》的前言中所述的三级指标教学大纲(简称“三级”)。该大纲精选了 200多个内容点,分为限定性、选修性和研究性三个级别。该大纲的面世是开发中国概况教学大纲的一次重要尝试,不过“三级”中也有一些内容选取和分类问题值得商榷,比如:把“语言文字”作为一级限定性文化项目,与语言类课程的教学内容产生了重叠;把“文学艺术”与“书法绘画”并列为一级,层级关系也不够清晰。
2022 年,教育部中外语言交流合作中心(简称“语合中心”)推出《国际中文教育用中国文化和国情教学参考框架》(简称《参考框架》),这是国际中文教育领域第一个权威性的文化与国情教学参考大纲,详细阐述了中国文化和国情教学的内容和目标。《参考框架》分为初级(小学)、中级(中学)、高级(大学及成人)三个层级,包含 3 个一级项目、31 个二级项目,例举了 726 个三级文化点。
《参考框架》作为国际中文教育领域首部文化教学的纲领性文件,具有开创性意义(马佳楠,2022;吴勇毅,2022)。然而,正是由于其纲领性、框架性较强,强调对社会科学和人文科学所定义并侧重的文化要素实现全面覆盖,因此其设置的一些文化项目并非中国概况课程的必要内容,比如其中的“社会生活”文化项目常常是语言教学的话题或素材(祖晓梅,2023),更适合在语言课堂中开展。同时,《参考框架》中的三级文化点是举例性的,在文化点的典型性、常用性及其选取依据和分级分类等方面的理解可能因人而异,个人发挥余地较大。因此,我们仍然需要研制专门的中国概况教学项目表和教学大纲,为中国概况课程的教学实践提供更有针对性和可操作性的依据和内容。
综上,中国概况作为课程,在教学内容方面已经有了丰富的积累,但我们也看到这些内容各有其适用范围,彼此之间还缺乏有机联系。中国概况教学内容和教学质量需要进行科学规范,中国概况课程急需一份针对性更强、更综合全面的指导性教学大纲。作为基础工作,首先应构建中国概况教材语料库,通过质化和量化相结合的方法,从中筛选编制《中国概况教学项目表》(简称《新项目表》),以弥补现有大纲的不足。
三、研制路径和流程
项目组在研制《新项目表》时参考已有的相关研究成果,结合本文的研究目标,制订了以下研制路径和流程。
3.1 构建“中国概况教材语料库”
20 世纪 90 年代,中国概况主要作为高年级语言生的文化课程,当时出版了两套教材,但均属于摸索时期,其时代属性早已无法满足当前中国概况课程的当代性和实用性要求。2000 年中国概况成为来华学历留学生的必修课后,学界对教材编写有了更为深入的思考,因此本研究语料库收录了 2000—2022 年出版的所有面向外国留学生且以“中国概况”命名的教材,共 12 本 。
本文采用“主题分析”(thematic analysis)这一质性研究方法,按照“开放式编码—主轴编码—重复编码”的研究程序,分析和标注教材内容的最小知识点;按照节点之间的逻辑关系构建树状结构,形成《中国概况教材文本编码手册》(简称《编码手册》)和《新项目表》(初稿);根据《参考框架》的指导意见和《新项目表》(初稿)教学内容的逻辑关系,对教学项目进行合并、拆分、删除、补充和修改,进而完成《中国概况教学项目表》(修改稿)。
3.2 标注辅助教学信息
我们按照教学项目在不同教材中重复出现的次数,标注所有项目的“频次”;根据《参考框架》,标注四级项目的“水平”,最终形成《新项目表》(终稿)。总之,这是一个先自下而上,再根据结果进行反复调整的循环过程,研制流程见图 1。
四、编码程序与步骤
本研究首先组建了一个编码小组,成员有 3 人,均为语言学及应用语言学博士,其中 2 人为教授过中国概况课程、教龄超过 10 年的熟手教师。编码小组按照“开放式编码—主轴编码—重复编码”的程序,对语料库中的 12 本教材进行内容分析和背对背编码,并进行编码结果信度检验,保证编码的一致性和可信性。
4.1 开放式编码
开放式编码(open coding)是编码程序的第一步,主要工作是对“中国概况教材语料库”中的原始语料进行微观分析,从中产生初始概念,建立初步类别。编码小组使用 NVivo12 软件的编码功能,对所有教材文本内容进行分析和标注,把教材中具体的句子或段落编码为若干最小知识点,生成《新项目表》的最小节点。
“知识点”是最小的教材内容单位,有时教材中会有明显的章节标记,但主要由语义的完整性而非形式来确立。编码小组从 12 本教材中提炼了教材最小知识点的 5 条确立标准,具体如下:
(1)在章节层级上,表现为具有明显章节标记的最小层级单位;
(2)没有章节标记,但有着重符号标记或有语义完整性的自然段落;
(3)没有自然段落,但在语言形式上表现为一个最小的独立语篇 ;
(4)蕴含关系的重复性内容 ,根据内容详略或篇幅大小编码为不同知识点;
(5)选文、图表、小贴士等不做内容切分,均只作为一个知识点。
根据上述标准,编码小组从教材语料库中共识别和编码出 4483 个最小节点,即最小知识点,平均每本教材为 373.58 个。以王顺洪版教材中的最小知识点“陶渊明”为例,其编码示例见表 1:
4.2 主轴编码
主轴编码(axial coding)是指,在开放式编码所获得的初始类别和最小节点基础上,根据类属关系和相关关系归纳和抽象出更高一级的上位概念或范畴。具体做法是将开放编码所得到的 4483 个自由节点进行对照,找出各节点内容之间的关联或重合的部分,将重合度较高、内容相近的节点进行合并,归纳出它们的上位概念。如我们把不同教材中关于黄河的发源地、入海口、长度、流域等自由节点归纳为一个知识点“黄河”,进而形成包含若干层级的主题树状结构。在此基础上,我们再建立编码索引体系,描述各一级主题和次级主题,并对编码进行界定和描述,形成《编码手册》(暂拟)。
《编码手册》(暂拟)自上而下归纳出四个层级:一级项目 12 项,二级项目 100 项,三级项目 314 项,四级项目 2493 项。一级项目为某知识点所涉及的思想或实践的最大范围,包括“地理、历史、人民、政治、经济、艺术、教育、科技、思想、生活、健康、交流”等。第二和第三级项目是根据历史分期或共有特征区分出来的一级项目的下位范畴,如:“地理”分为“自然环境”“行政区划”“著名城市”等若干二级项目,“自然环境”又分为“地理位置”“地形地貌”“地域划分”等若干三级项目。四级项目为经过归纳合并处理的知识点,如上文所述的“黄河”。
4.3 重复编码
在已有编码框架(主轴编码)的基础上,编码小组分三轮对教材语料进行重复编码,以保证编码的一致性。具体如下:
(1)第一轮编码:首先进行样本预编码,按照通用型、专用型以及内容当代型的标准分别选取代表性教材,共三册。根据《编码手册》(暂拟)编码规则,3 位编码员进行背对背预编码,然后编码小组计算内部一致性。若信度较低,则需要编码员对不一致的知识点进行讨论并重新标注,保证一致率达到 0.8 或以上,据此形成《编码手册》(修改版)。
(2)第二轮编码:根据《编码手册》(修改版),编码小组对全部 12 本教材进行重复编码,计算出 3位编码员的编码信度,并归纳确定中国概况教材内容知识点及其类属。本研究采用“霍尔斯提(Holsti)公 式” 对 教 材 内 容 编 码 结 果 进 行 信 度 检 验, 编 码 信 度 系 数(Holsti’s Coefficient Reliability)公式为:
其中相互同意度
(M 为编码员之间的编码一致数,N1、N2 是两位编码员的总编码数量,n为编码员个数, K 为相互同意度的平均值)。经计算,3位编码员的平均相互同意度为0.962,信度系数为 0.987,大于 0.8,说明 3 位编码员的教材编码结果一致性很高。
(3)第三轮编码:首先由教学和研究经验丰富、具有教授职称的专家对第二轮中不一致的知识点类型进行判断,3 位编码员再与专家讨论,最终确定教学项目的类属及其名称。其中,由于一级项目中的“艺术”内容过于繁杂且自由节点过多,故将其拆分为“文学”和“文化艺术”两项。同时,我们把“人民”“生活”“健康”等一级项目归并调整为“民生”“民俗”“社会结构”,把“思想”“交流”分别改为“思想信仰”和“国际交流”。
通过以上归类、合并和调整,本研究最终构建出一个包含 13 个一级项目、49 个二级项目、209 个三级项目、2114 个四级项目的《新项目表》。限于篇幅,我们将《新项目表》的第一、二级项目展示如下,见表 2。
五、项目表标注和示例
本研究还在《新项目表》中标注了“频次”和“水平”两项辅助信息,以便为教学内容选取、教材编写与分析,以及后续教学大纲研制等提供参考和依据。
5.1 频次
频次是指某一教学项目在语料库中出现的次数。我们首先标注了每一个四级项目的频次,如“国土面积”出现在全部 12 本教材中,则频次标注为 12。然后,我们把四级项目的频次累计相加,得出其上位三级项目的频次,再依次类推分别得到二级和一级项目的频次。教学项目频次的高低反映了现有中国概况教材教学项目的常用性和典型性,以及教材编写者在内容选取上的倾向性。
统计结果显示,重复频率为 50% 及以下(即频次为 1~5)的四级项目共有 1908 项,其中频次为 1 的有 1217 项(占总项目的 57.6%),如“包公、鸣天鼓、黄金部队、精准扶贫”等;重复频率为 50% 以上(即频次为 6~12)的四级项目仅有 206 项,其中频次为 12 的四级项目只有 15 项(占总项目的 0.7%),如“国土面积、人民代表大会、改革开放、人口数量”等。这说明不同教材的内容选取具有较大差异性,而不同的教材内容影响着学习者对中国的认知,因此研制和发布统一的中国概况教学大纲势在必行。
5.2 水平
水平是指《新项目表》四级项目在《参考框架》中所处的级别位置。《参考框架》根据教学对象的认知水平和教学方式划分了初、中、高三个级别,为了标注方便,我们分别用A、B、C指代初、中、高三种级别水平。
具体做法是:若《新项目表》中的四级项目与《参考框架》中的“文化点举例”基本相同,则直接进行标注;若项目未在“文化点举例”中出现,则按照《参考框架》的“教学内容和目标”进行分类和标注。比如,《新项目表》中的“孔子学院”在《参考框架》的“高级 / 当代中国 / 对外交流”中也有相同表述,则直接标注为 C。《新项目表》有与“华语流行音乐”有关的内容和要求,标注为 B,例如《新项目表》中的“周杰伦《青花瓷》”这一项目在《参考框架》的“文化点举例”中未出现,但在其“中级 / 当代中国 / 文学艺术”中出现了。
经统计,在《新项目表》的 2114 个四级项目中,A 类初级项目有 56 个,如“国旗、国歌、春节、故宫、天安门”等;B 类中级项目有 667 个,如“泰山、汉服、高考、孔子、乒乓球”等;C 类高级项目有 1391 个,如“诗经、甲骨文、丝绸之路、五四运动、量子卫星”等。上述说明,现有的中国概况教材主要以大学和成人阶段的汉语学习者为教学对象,而关注小学和未成年学生的认知特点及学习需求的中国概况教材还比较少。
通过标注,我们发现《参考框架》已较为详细和系统,但《新项目表》仍有帮助其修改完善的参考价值。一方面,《新项目表》收录了国防、人权、曲艺杂技、现代医学、国家行政机构、基层群众自治制度、公务员制度、华人华侨、城乡发展等方面内容,而《参考框架》尚未收录这些内容或仅在个别地方稍有提及。这些内容是根据“中国概况教材语料库”归纳出来的,反映了一线教师和教材编者的思考和认知,应该予以重视,并在《参考框架》中进行补充。另一方面,《参考框架》中把“语言交际”“非语言交际”“语言与文化”等设置为二级项目,但《新项目表》所依据的教材语料库中却较少出现这些内容。比如,《参考框架》中的“先生、老师、叔叔、阿姨、手势、姿势、面部表情、眼神交流”等项目可能属于世界各民族文化的通识性内容,而非中国概况课程的必要教学内容;再如“连(莲)年有余(鱼)、送钟(终)、喜酒喜糖、红娘、中庸”等项目都归入“语言与文化”虽有一定道理,但在中国概况教学背景下,可能将其归入“民间习俗”或“传统思想”的下位更为合适。
总之,《新项目表》基本符合《参考框架》的框架和要求,但同时也有自身的系统性和独创性,与《参考框架》形成互补互参的关系。
5.3 样例
本研究在“中国概况教材语料库”的基础上,先自下而上地编码,再自上而下地调整,然后对每个项目逐一标注。以《新项目表》的一级项目“教育”为例,具体标注形式如表 3 所示。
如表 3 所示,《新项目表》一级项目“教育”包含 3 个二级项目、8 个三级项目、219 个四级项目。这些项目的形成过程如下:首先,我们在教材语料库中自下而上地把与教育相关的项目提取出来,经过多轮编码和讨论,形成最小节点和四级项目名称;其次,根据四级项目的共有上位概念将其归纳为若干三级项目;再次,按照时代特征分为“古代”“近代”“现代”等二级项目;最后,由于这些项目都属于教育领域,于是形成最高层级节点,即一级项目“教育”。同时,根据这些项目的出现频次和其在《参考框架》中所处的级别位置,分别标注不同项目的“频次”“水平”等教学辅助信息。
六、结语
本研究在自建“中国概况教材语料库”基础上,构建了《新项目表》,包括 13 个一级项目、49 个二级项目、209 个三级项目、2114 个四级项目,附有具体教学项目的频次、水平等辅助信息。该项目表能够为相关教师和研究者提供教学科研的工具和资源,为选取教学内容、编写教材、研制教学大纲等提供支撑和参考。与已有的中国文化、中国概况教学大纲或项目表相比,该项目表构建的教学内容体系不仅全面,而且更具针对性和可操作性,标注的辅助教学信息也有利于教师或教材编写者更清晰地了解教学项目的常用性和适用性,可以更精确地选择教学内容。
《新项目表》也可以为教材对比、分析和研究提供材料和数据。刘元满、李欣(2020)发现,近 30 年来《中国概况》教材内容从简单到丰富,主观知识逐渐增多,内容编排上呈现出“单独主题式—单元系列式—层级式”的发展变化,培养学生对“中国概况”从“了解”到“理解”进而到能够“分析”,体现出从纯粹的知识介绍到引导学生主动思辨的趋势。本研究构建的语料库和《新项目表》还可以从历时演变、共时对比、内容分析等方面为中国概况的教材及课程研究提供较为可靠的研究基础和依据。
展望未来,《新项目表》可以作为研制“中国概况教学大纲”的基础,但同时后续还有大量工作要做。《新项目表》是开放的,需要不断修订补充,我们将在进一步严密论证的基础上最终形成一份科学的、具有总体指导意义的“中国概况教学大纲”。此外,本研究以教材语料库为基础,将质性研究与量化分析紧密结合。这一研究范式可为今后教材研究,特别是文化教材研究及专门用途教材研究提供参考。
★ 原文链接 ★
本文载于《国际汉语教学研究》2024年第1期(24~32页)。
著录格式:
李欣,刘元满,王亚敏,等. 基于教材语料库的《中国概况教学项目表》构建[J]. 国际汉语教学研究,2024(1):24-32.
★ 关于我们★
《国际汉语教学研究》由中华人民共和国教育部主管、北京语言大学主办、北京语言大学出版社承办,世界汉语教学学会给予学术支持,为季刊,国内统一连续出版物号CN 10-1203/H,国际标准连续出版物号ISSN 2095-798X。
本刊自2014年创刊以来,一直秉承汉语作为第二语言教学学科建设的优良传统,面向事业,面向教学,面向教师,实现专业化、特色化与差异化发展。以推进国际中文教育研究与事业发展为宗旨,以汉语教学研究为核心,依托海内外国际中文教育领域的专家、学者、教师、研究人员的学识与实践,搭建学术研究成果的交流平台,构筑学科人才与优秀教师的发展园地。
本刊入选国家新闻出版广电总局首批认定学术期刊,入选中国社会科学评价研究院发布的《中国人文社会科学期刊AMI综合评价报告(2022年)》语言学类扩展期刊,是世界汉语教学学会理事单位刊物、EBSCO学术数据库收录期刊、中国人文社会科学引文数据库(CHSSCD)收录期刊、《中国学术期刊网络出版总库》(CNKI)收录期刊、中国学术期刊综合评价数据库(CNKI)来源期刊、《中文科技期刊数据库》(VIP)收录期刊、《中国核心期刊(遴选)数据库》收录期刊、万方数据电子出版社入选期刊,入选《中国学术期刊影响因子年报(人文社会科学 • 2023年版)》。本刊共有42篇论文入选《学术精要数据库》2013—2023年高影响力论文榜单,其中,高下载论文20篇,高被引论文37篇,高PCSI论文11篇,4篇论文荣获“高被引、高下载、高PCSI”论文。
本刊现诚邀海内外专家、学者及所有热爱国际中文教育事业的人士赐稿,并对各位的支持致以诚挚的谢忱和崇高的敬意!
本刊联系方式
投稿网址:www.blcup.com/XSQK
咨询邮箱:gjhyjxyj@blcup.com
联 系 人:孟老师
联系电话:010-82300207
本刊订购方式
1. 扫描下方二维码,进入“北京语言大学出版社”微店,订购本刊纸质版。
2. 下载“国际汉语教学研究”App,注册会员并登录,可订购本刊电子版。
“国际汉语教学研究”App下载二维码
(注:App已在苹果应用商店上架,安卓系统请长按上图二维码至浏览器下载)
网页版地址:
http://app.readoor.cn/app/dt/pd/1564663415/1?s=1
国内订购:
联系人:杨凯
电话:010-82303650
QQ:370834996
海外订购:
★ 推荐阅读★
黄成龙 | 数智时代的语言学调查研究——纪录语言学最新进展
马瑞祾、徐娟 | 数智时代国际中文写作智慧教学资源创新研发
专栏阅读(十三)数智技术赋能国际中文教育研究
段鹏 | 加快数智技术赋能,推动语言研究与教育事业高质量发展