1.1 引言
我在评审一些博士生论文或者其它期刊论文时,时常发现一些选题不错,做得很努力,但是论文写作上却有比较草率的文章。如果一个研究金玉其中,却败絮其外,那很难卖一个好价钱。
本文为社科类的定量研究的文章的写作提出一个检查表(check-list)。如果你照顾到了其中的大部分项目,至少就写作而言,你的文章就可以在审稿人面前过关。当然文无定法,这个“党八股”算是你入门时的指导吧。
本文所列的检查表也包括在出版的《社会调查设计与数据分析:从立题到发表》一书中。我觉得有必要让跟多的读者了解这些基本知识。这种党八股式的写作格式对大部分中国人来讲是一个福音。毕竟写八股文还是比较容易的。一个论文的基本结构分以下几部分:
- Introduction
- Theoretical Development
- Methodology
- Data Analysis and Result
- Discussion and Implications
- Conclusion
在我们解释每一部分要写什么之前,有一点需要强调,那就是从粗到细 (top-down process) 的写作过程。从平时的材料积累到最后写成一篇论文的整个过程中,最好的写作方法就是从纲要开始,然后对每一点进行细化,得到更细的纲要,一直到成文。
1.2 写Introduction
Introduction中要写什么?以下的要点可以供你选择:
一个研究课题的所对应的现实现象的实践重要性。比如,对于一个研究网上广告的文章,其现象的实践重要性可以用电子商务的重要性来说明。研究者可以用最近几年电子商务的营业总额的增长与广告总额的增长来说明一个课题实践重要性。
提出业界所关心的问题。比如,如何通过搜索引擎做广告是很多公司所关心的问题。研究者可以用这业广告的营业总额来说明其受关心程度。对问题进行明确化,使之直接关联到本研究课题。业界所面临的问题是什么呢?比如,业界关心的是一个广告位置是否值一定的价格。
对以往的研究做一个高度概括的总结,并提出其不足。比如,以往研究可以研究了不同的广告表现方式 (比如使用动画,使用影视片断) 对用户注意力的影响,却没有研究广告位置对注意力的影响。
明确本文的科研主题。用一句很明确的话来表明科研主题:The research question of this study is to investigate the impact of advertisement position on consumers’ attention to it。一个科研议题中要明确包含因变量 (比如:attention),并尽可能包含主要的自变量。不要用含糊的话,比如:We think it is important to study the impact of advertisement position。也不要把科研主题写在一个从句中,比如:Past research has not paid enough attention to the impact of advertisement position on consumers’ attention, which will be the focus of this study.
解释本文的主要理论依据或方法,并指出其贡献。比如:We will use theories in order effect to explain the impact of advertisement position on consumer attention. From a psychological view, theories in order effect provide a mechanism to explain the distribution of consumer attention over a sequence of information items. Based on these theories, the impact of an advertisement’s position on its sales can be modeled. Our empirical findings show that there is a non-linear relationship between the position of an advertisement and its sales….
解释论文结构。比如: This paper is organized as follows: First, we review the literature related on to online advertisement. We then introduce the theories on order effect in Section 2. Section 3 proposes a model to explain order effect in online advertising. Three hypotheses are proposed. After that, we report on the methodology of an empirical study…
要注意的是,在Introduction,研究者要明确定义因变量。其实,研究的现实重要性与理论重要性都要围绕着这个因变量,科研主题更是如此。一个初学者常犯的错误是在文献回顾之后才说“本文的研究课题是什么什么”。这是一种错误的报告方式。开章明义,因变量要在Introduction就明确定义并解释。Introduction是吸引读者一个重要部分。可以不夸张的说,读完Introduction后,一个读者就可以决定一篇文章是否值得继续读。
Introduction大概在3-5页。写作检查表如下:
- 一个课题的实践重要性
- 有没有使用统计数据来说明实践重要性?
- 有没有使用行业报告来说明实践重要性?
- 有没有使用行业行业中重要人物的观点来说明实践重要性?
- 有没有使用主流媒体中的报告来说明实践重要性?
- 有没有数据说明行业的规模?
- 有没有数据说明课题中目标群体的规模?
- 有没有数据说明行业或目标群体的增长?
- 一个课题的理论研究现状
- 前人的研究的着重点是什么?是不是忽略了本文所研究的课题?
- 有没有回顾性的论文指出这方面研究的不足?
- 有没有学者的话或论文可以原文引用来说明本文课题的重要性或现有研究的不足?
- 明确本文的科研主题
- 有没有用一句问句来表明本文的研究主题 (research question)?
- 有没有在主题中包含因变量?
- 有没有对因变量给出明确的定义?
- 有没有界定研究的适用范围?
- 解释本文的理论依据
- 有没有点出本文的理论依据或视角?
- 有没有点出所依据理论对本课题独特的贡献?这部分要与文献研究中对现有文献的批判一致。
- 论文的结构
1.3 写Theoretical Development
这部分要包括什么内容?以下的要点可供选择。
文献回顾。对于本文的因变量,前人做了什么?比如,对于网上广告的注意,前人的研究可以分成几类?研究者此时要对前人的相关研究进行总结并分类。分类的标准往往没有一定的规律可偱。比如,你可以把以前的研究分成网上广告的注意力与网下广告的注意力研究;你也可以按不同的广告表现方式分 (静态、动态、有声、无声)。研究者也要报告各类有什么主要的发现?比如,在各类广告中,有哪些自变量被研究了,各有什么作用?前人研究所用的理论有哪些?
对前人研究进行总结,总结其强项,并指出其不足。你只需要指出其中与本文有关的不足,并且,本文是要回答并弥补这些不足。如果前人的研究中的不足并不是本文所能回答的,则不需要提这样的不足。
提出本文的理论视角。本文用什么理论或或理论组来研究这个因变量?这个理论与本文相关的主要观点是什么?
提出本文的理论模型,对其做一个综述。
对每个假设进行论证。在论证的过程中,把所用理论的基本观点与假设的关系解释明白。假设可以通过理论的基本观点推导而得。
Theoretical Development 大概要写6-10页。写作检查表如下:
- 文献回顾
- 有没有对包括所有相关学科的文献?尤其是对于交叉学科的课题,文献检索需要覆盖多个学科领域。
- 有没有对文献进行分类,并总结出几个不同的、但又相互补充的流派?每个流派的重点是什么?
- 对每个流派进行分析。它们回答了什么问题?它们代表性的文献是什么?它们的发展过程是什么?前人的研究之间是如何继承而又发展的?它们的贡献是什么?它们的缺陷是什么?
- 对这些流派进行总结,给你的论文一个定位。你的论文是如何基于前人的研究,又是如何回答他们所没有回答的问题?你是如何避免前人的缺陷?为什么你这么做是重要的?
- 有没有包括足够的新文献、特别是最近一两年的文献?一般来讲,十年以前的文献算是老的了。你的文献应该大部分是在十年之内。
- 理论的引入
- 如果引入了新的理论,首先介绍这个(或这些)理论与本文有关的要点。
- 为什么这个理论适用于本研究领域?如果理论是在另外一个学科或环境中提出来的,解释为什么这个理论仍可用作这里。
- 这个理论的优点于缺点是什么?它为什么可以弥补前人研究的不足?根据文献回顾的结果于本文的定位来回答这些问题。
- 介绍本文的模型
- 根据所基的理论,给出理论模型,用一个模型图来表示。
- 假设
- 定义假设中的每一个变量。
- 理论中所用的概念或变量与这个假设中的变量在定义上一致吗?如果有不同,那么对理论中概念的变化是不是太大,以至于牵强?
- 这个变量与其它同一层次的变量在概念上有没有明显的不同,具有区别效度?
- 这个变量与其它变量是不是在测量同一个调查对象,在分析单位上是不是一致?
- 如果使用了理论中的变量,有没有用理论来推出假设?
- 在理论之外,有没有其它推理可以论证这个假设?
- 如果引入理论中没有的变量,为什么要引入这个新的变量?
- 有没有理论或推理来论证这个假设不被支持?如果有,那么为什么要采取当前立场?
- 有没有第三变量来同时影响自变量与因变量,导致这个假设中的关系是相关关系而不是因果关系?
- 是不是这个假设是常识性的?如果是,那么为什么还需要在这里测试?
- 前人有没有提过这个假设?是不是被支持?如果有,那么为什么还需要在这里重复测试?如果没有,有没有间接的实证证据支持这个假设?
- 这个假设的新意是什么?这个变量是不是本文所研究的群体所特有的属性?这个变量是不是适用于更广的领域?在更广的领域中有没有研究已经对这个变量做了研究?
- 假设的陈述是不是明确?
1.4 写Methodology
这一部分,研究者报告数据是如何得到的,并做了什么数据预处理。需要报告:
测度工具的开发过程。测度项从哪里来?哪些方法被用来确保测度项的构件效度?有哪些控制变量也包括在调查中?为什么包括这些变量?如果有预调查或预测试,报告其具体过程。
调查的目标群体与调查过程。本研究的目标群体是什么?本研究的抽样方法与抽样过程是什么?有没有使用预定的抽样范围?具体描述抽样的过程,包括给抽样对象的指令,数据的记录方式,样本量,返回率等等。
数据的预处理。数据收集之后,有没有不完整的记录?如果有,这样的记录是被删除了还是做了一定的处理,比如补充缺值?
这部分一般会有4-6页。写作检查表如下:
- 研究方法的选择
- 本文的研究方法是什么?为什么要选用社会调查作为研究方法?
- 测度工具的开发
- 逐个介绍理论变量的测度工具。这个测度工具是源于哪个前人研究还是自创的?如果是基于前人的研究,它的可靠度是多少?如果是比较新的概念,是不是需要给出一些关键字或个别测度项,是读者更容易明白这个变量?
- 逐个介绍控制变量。一般来讲,人口统计特征(比如年龄于与性别)只有提一下就好了。对理论变量有影响的控制变量需要比较详细的介绍,但不要太详细以至于喧宾夺主。内容可以包括为什么它会影响一个理论变量与它的测度工具。
- 测度工具的内容效度、字面效度是如何保证的?如果使用了测度项分类法,报告实施过程与最终的分类结果。如果执行了预测试,报告预测试的参加对象。
- 报告测度工具,包括在预调查和主体调查中被去掉的测度项。
- 预调查
- 预调查的对象是谁?预调查的过程是怎么样的?样本量是多少?
- 预调查的结果如何?用了什么统计方法(比如主成分分析法与VARIMAX旋转)得到因子?根据聚合与区别效度,有没有舍弃一些测度项?为什么?有没有对测度项进行修改,保留到主体调查中?报告旋转后的载荷矩阵于必要的参数(比如特征根的阈值)。
- 主体调查的过程
- 本研究的目标群体是什么?本研究的抽样方法与抽样过程是什么?有没有使用预定的抽样范围?具体描述抽样的过程,包括时间、地点、场合、过程、激励机制(比如是否有偿?)、给调查对象的指令、数据的记录方式、样本量、返回率等。
- 报告缺值的处理。缺值是如何处理的?为什么?有多少记录被删除?为什么?
- 样本的代表性如何?做必要的统计分析比较样本与群体,回答他们有没有不同?这样的不同会不会对结果的普适性产生影响?
1.5 写 Data Analysis
在这一部分,一般地,研究者要报告测度模型与关系模型的分析过程。
对样本的描述。报告样本的人口统计学特征,比如性别组成、年龄组成、教育背景、职位组成等等。与适当的参照群体进行比较,估计不返回率对调查所产生的影响。
报告测度模型的分析过程与结果。比如,预调查的探索性因子分析的结果如何?哪些测度项被淘汰,为什么会被淘汰?正式调查的测度模型用了哪些指标来衡量聚合效度,哪些指标来衡量区别效度?本次研究的聚合效度与区别效度各如何?用合适的表格报告相应的指标与数据结果。如果个别测度项被淘汰,解释其原因。对于所剩的测度项,如果它们的聚合效度满足要求,可以按构件对它们进行平均,以得到一个构件的均值与方差。各构件的均值、方差、与各构件之间的相关系数要用表格报告出来。其中,各构件之间的相关系数可以从LISREL的输出中得到。
报告关系模型即假设检验的结果。用回归分析或结构模型对数据进行分析。报告分析的过程,并模型的拟合度。报告各回归系数或结构模型中关系系数的标准值与其显著程度,并由此得出一个假设是否被支持的结论。
这部分一般会有3-5页。
- 对样本的描述
- 对样本的描述性统计特征做一简单介绍,尤其是研究领略所特有的统计特征。比如,在电子商务研究中,调查对象的以前的网购频率是一种与课题之间相关的描述性统计特征。人口统计特征可以略略带过。
- 测度模型的检验
- 对测度项的正态性进行检验。是不是有的测度项违反正态性?解释所采取的补救措施。
- 略提测度模型所使用的统计方法与统计软件。介绍衡量测度模型所用的聚合效度与区别效度的各项标准。
- 拟合测度模型,鉴别违反聚合效度与区别效度的测度项。这些测度项是否被删除?为什么?
- 报告最终的测度模型,包括测度项载荷、AVE、可靠度、因子综合可靠度、因子的均值、方差、相关系数矩阵、测度模型的拟合指标。
- 是不是有的因子之间的相关系数比较大(比如大于0.6)?报告多重共线性的检验结果与处理方法。
- 是不是理论变量之间的相关系数普遍显著,且比较大?那么讨论数据是否受共同方法偏差的影响。
- 假设检验
- 拟合结构模型。用一个图来报告结构模型的拟合结果。报告模型的各个拟合指标。
- 简单描述哪些假设被支持、哪些没有被支持。
- 对结果进行稳定性检验。比如增加人口统计特征是否会改变假设的显著性?
- 后验分析
- 是否有其它没有被假设、但是在理论上又有一定意义的关系出现?对这样的关系进行测试,提出可能的理论解释。
- 对于理论变量之间的关系,是不是有其它理论提出与本文不同的看法?对这样的关系进行检验,看看是不是得到数据支持。
1.6 写Discussion and Implications
Discussion是对数据分析结果的一个简单总结。这往往分成几部分:
总结哪些假设得到了数据支持,哪些没有。
解释每一个没有被数据支持的假设,找出可能的原因。有的可能是因为理论上的原因,有的可能是因为实证研究中样本的特殊性。有没有证据,最好是本实证研究中的证据来支持这种解释?
如用研究者进行了额外的数据分析,可以在这里报告。这样的分析往往是在假设检验的要求之外,但可能读者会有兴趣,并有助于解释本文中的一些现象。
Implications是对本文的理论与实践意义的总结,分两部分。
本研究的理论意义。本研究在哪些方面拓展了前人的理论框架?这往往表现在一些新的假设在本文中得到了支持。这些假设是前人所未曾测试过的。本研究对不同的参考领域有什么贡献?比如,一个研究搜索引擎中广告排序的研究可能有以下贡献。对于心理学中order effect 的研究,这样的研究可能引入了多个信息对象的order effect。以往的order effect 研究往往只研究一个信息对象。对于广告学,这样的研究拓展了以往往对广告表现形式的研究,引入广告位置的研究。对于营销学,这样的研究可能解释了消费者在这种情形下的心理过程。
本研究的实践意义。业界人士如果读了这篇论文,他可以在实践中运用其中的哪些结论呢?比如,本研究还提出了一个广告效益的估算方法;企业可以用它来估算网上广告的价值,网站可以用它来计算投放这样一个广告的价格。消费者要明白这种次序效应对自己的影响等。
本文的局限性。一篇论文的局限性有理论方面的,也有实证方面的。在理论方面,一篇论文可以采用某个理论作为总纲,但其它的理论可能会提出类似的观点。是不是有一些其它的理论会提出一些不同的变量,而本文没有包括?在实证方面,本文的样本具有足够的代表性吗?是不是抽样的过程或测度项的设计不够好,以致于数据有质量问题,比如缺少区别效度?是不是有很强的共同方法偏差?最后,与本文相关,哪些未来的研究方向是有价值的?
这部分一般会有3-5页。
- 对实证研究结果的讨论
- 总结所支持的假设。
- 对于不被支持的假设,逐条解释不被支持的可能原因。是不是有数据、最好是本研究中的数据,可以支持这个解释?这个新的解释有什么理论意义?
- 理论贡献
- 对于文献中各个相关流派的研究,本文的贡献是什么?就本文对各个流派的贡献做逐一论证。
- 本研究中是不是有一些新的假设得到了支持?这些新的假设与前人的研究比,有什么显著的贡献?
- 基于本文的结果,是不是可以提出一个新的理论或者颠覆了一个旧的理论?如果是,那么这个新理论的特别之处在哪里?
- 本文是否开创了新的研究方向与研究领域?如果是,那么有哪些重要的研究方向可以在本文的基础上进一步研究?
- 本文的研究方法是不是具有创新性?是不是为这一类的研究展示了一种新的研究方法与步骤?
- 实践意义
- 业界人士如果读了这篇论文,他可以在实践中运用其中的哪些结论呢?根据被支持的假设,逐一解释业界可以应用的地方。
- 与业界的现有做法比,本文是不是提出了一种改进或全新的做法?
- 本文的局限性
- 本文在理论上的局限性是什么?本文没有关注哪些理论上重要的方面?
- 本文在实证研究中的局限性是什么?在取样、数据收集、测度工具、数据质量、分析方法方面是不是有缺陷?这些缺陷会如何影响本文结论的可靠性?
- 在同一个课题领域,有哪些研究问题是本文没有包括、但将来的研究应该探索的?
1.7 写Conclusion
在结论中,研究者对本文的科研主题进行回顾,总结主要的理论指导与假设,并实证研究的结果。然后,研究者要强调本文的理论与实践意义。