国标参考文献格式
McDERMOTT J H, LEHR A J, OXENHAM A J. Individual Differences Reveal the Basis of Consonance[J]. Current Biology, 2010, 20(11):1035-1041.
正文逐段译文
《当代生物学》,第20卷,1035–1041页,2010年6月8日 ©2010爱思唯尔有限公司 版权所有 数字对象标识符:10.1016/j.cub.2010.04.019
研究快报
个体差异揭示协和音的形成机理
乔希·H·麦克德莫特¹,*, 安德里亚娜·J·莱尔², 安德鲁·J·奥克瑟姆²
¹美国纽约大学神经科学中心,纽约州纽约市10003,美国
²美国明尼苏达大学心理学系,明尼阿波利斯市55455,美国
摘要
部分音符组合听感协和(悦耳),其余组合则不协和(刺耳),这一区分是音乐的核心要素。数百年来,学界围绕协和音的成因展开争论,相关假说分别从声学特征、听觉神经科学与后天文化熏陶三个维度进行阐释[1–12]。本研究借助听者个体差异对各类候选理论加以甄别。实验一方面测试受试者对各类和弦的偏好程度,另一方面采用非音乐类声源,分离出两类长期被视作协和音潜在成因的声学特征:拍频现象与频谱谐波关联关系[2,3,10,13–20]。受试者普遍偏好无拍频、具备谐波频谱的声音;在总计250余名受试中,仅谐波频谱偏好度与受试者偏爱协和和弦、排斥不协和和弦的倾向稳定相关。同时,受试者接触乐器的演奏年限越长,对谐波频谱的偏好越强,说明音乐环境的长期接触,会依托谐波在音乐里的核心地位强化人对谐波频率的偏好。谐波频谱广泛存在于自然界声响中,本研究结果证明,谐波频谱是协和听觉感知的底层成因。
研究结果
图1A译文:受试群体对不同音符组合悦耳度的平均评分。部分音组无论由哪种乐器演奏,评分始终更高,该现象即为协和性,其起源在历史上长期存在争议[1–12]。
古代学者认为协和性由音程的整数比值决定(图1B),而近现代研究将其与听觉系统敏感的声学属性相关联[10]。当下主流理论提出:不协和感来源于不同频率分量叠加产生的拍频效应[2,13–15]。两个频率不同的正弦波叠加时便会生成拍频(图1C):随时间推移,两个波形相位交替重合、错开,叠加后的合成波形幅值随之周期性起伏。这种幅值调制形成的听觉质感被称作粗糙度,大多受试者将其判定为刺耳难听[21,22],学界普遍认为该特征大量存在于不协和和弦、协和和弦中几乎不存在[13–15]。
图1C下方两行:两组双音音程(二音和弦)对应的频谱与波形。小二度是典型不协和音程,其频谱包含大量频距极近但不重合的频率分量,波形可见明显幅值波动(拍频);纯五度属于协和音程,各分量频率间距大或精准成倍数重合,几乎不产生拍频。
但两类音程还存在另一处关键区别:纯五度全部频率近似满足谐波关系,均为同一个基频(F0F_0F0)的整数倍(图1C右上)。该音程虽未囊括完整谐波序列,但每个频率都隶属于该基频的谐波。从这一特征来看,纯五度和单个乐音高度相似——常规单音频谱本身就是一组谐波序列,基频决定单音音高。小二度则完全不满足谐波排布规律、属于非谐波结构。由此衍生另一种理论:协和和弦的悦耳性并非源于拍频缺失,而是和弦频谱和单音谐波频谱高度近似[3,17–20]。
还有观点认为协和性和声学规律毫无关联,完全是后天文化浸染的产物[23]:听者仅是在长期聆听本土音乐的过程中,习惯性偏爱本土乐曲高频出现的特定和弦。现代十二平均律音阶一定程度上佐证了该猜想:平均律下的协和音程仅近似整数频率比(图1B),既无法实现完美谐波排布,也不能彻底消除拍频。当然,后天习得假说与声学成因假说并非互斥。若某一声学属性真正主导协和/不协和区分,人在反复聆听乐曲时,完全可以对该声学特征形成审美偏好。
为厘清上述争议,本研究依托受试者协和偏好的个体差异性展开实验:探究受试者和弦偏好的个体波动,能否用其对特定声学特征的偏好差异解释。实验选用人工定制的非音乐音源,分别调控拍频、谐波两类声学参数,测量受试者对应的声音偏好。通过「不含某特征音源评分 − 含该特征音源评分」构建单一特征偏好指标;若拍频或谐波决定协和感知,则对应的声学偏好指标需与和弦协和偏好显著相关。为保证结果稳健可复现,实验分两批受试组(第一批n=142n=142n=142、第二批n=123n=123n=123),并针对不同乐器音色录制的和弦分别开展相关性检验。
一、和弦协和偏好测量
本研究依托和弦悦耳度打分测试量化协和偏好(图1A)。针对每种乐器音色,分别构建两类偏好量化指标:双音音程指标、三音三和弦指标。指标数值=协和和弦均分−不协和和弦均分;数值越高代表受试者越偏爱协和音响。不同受试者指标得分差异稳定,同一名被试两次复测分数具备相关性;即便对原始评分做Z标准化、消除受试者打分尺度差异后,复测相关依然显著(图1D:第一批受试萨克斯音源复测散点图)。
全实验不同音色、受试组的复测相关系数:音程指标rrr介于0.600.75,三和弦指标$r$介于0.460.63,全部满足p<0.0001p<0.0001p<0.0001统计学显著。
图1D译文:第一批受试(萨克斯音源)经Z标准化评分得到的协和偏好指标,两次测试结果散点分布图。音程协和指标=5个高分协和音程平均分−5个低分不协和音程平均分;三和弦协和指标=大三和弦评分−增三和弦评分。单个圆点代表一名受试者数据;全文rrr均为斯皮尔曼相关系数。
二、声学特征偏好测量
1.拍频偏好指标(B1)构建
采用**同耳双音(双耳同馈)与分耳双音(双耳分馈)**两种播放模式呈现纯音对,以此测算拍频偏好。已知双音分耳放送可大幅削弱人耳感知到的拍频,但不会改变音源频谱、谐波结构与音高特征[24,25]。预实验证实:仅当两个纯音频差落在同一耳蜗滤波带宽内时,分耳播放的音对打分显著高于同耳播放(图2A)。
图2A译文:35名预实验受试者,同耳/分耳播放纯音对的平均悦耳度评分;误差棒为标准误;同音(0半音间距)仅能同耳放送;虚线代表拍频从可闻转为不可闻的临界频距(依据耳蜗滤波器带宽估算)。
由于只有频差落在单耳蜗滤波区间的音对才能产生可闻拍频[2],因此「同耳−分耳」的打分差值可量化受试者对拍频刺耳程度的反感度。实验选取三个频段的窄距纯音对(图2B),用全部分耳音对均分 − 全部同耳音对均分得到无拍频偏好指标B1。
图2B:拍频测试音源频谱示意图;音对间距为0.75或1.5个半音,同耳播放时可产生明显可闻拍频。
2.谐波偏好指标(H1、H2)构建
指标H1:对比谐波复音、失谐非谐波复音的悦耳评分(图2C)。谐波音源选用标准谐波序列的部分分量,分量间距足够大以规避显著拍频;非谐波音源仅对谐波音源各分量频率做微小偏移,其余参数完全一致。H1=谐波音源均分−非谐波音源均分H1=\text{谐波音源均分}-\text{非谐波音源均分}H1=谐波音源均分−非谐波音源均分。
图2C:谐波偏好测试音源频谱示意图;非谐波复音由标准谐波各分量小幅频偏生成,所有分量间距充足、无明显拍频;谐波与非谐波音源除频率排布外其余参数完全一致;频谱左侧数字用于对照图2D结果。
指标H2:规避B1音源仅含两个频点、和真实和弦频谱差异过大的缺陷。H2=单纯音均分−低频分耳音对均分H2=\text{单纯音均分}-\text{低频分耳音对均分}H2=单纯音均分−低频分耳音对均分;该组低频音对无谐波关联,分耳放送几乎无拍频,可复用拍频实验音源、同时排除互调失真带来的隐性拍频干扰[26]。
整体受试群体平均层面:受试者普遍偏爱谐波音源、无拍频音源(图2D译文);但个体对拍频、谐波的偏好存在明显分化(图2E、2F为第一批受试B1、H1复测散点)。两组受试所有声学偏好指标复测相关r=0.41∼0.76r=0.41\sim0.76r=0.41∼0.76,全部p<0.0001p<0.0001p<0.0001显著。关键结果:受试者拍频偏好(B1)与谐波偏好(H1)的个体得分无显著相关(图2G译文),各组二者相关系数在−0.09~0.17区间,全部p>0.05p>0.05p>0.05,证明两套实验成功分离两个独立声学变量。
图2D:第一批受试各类声学测试音源平均悦耳评分,误差棒为标准误。
图2E:B1指标两次Z标准化复测得分散点;r=0.76r=0.76r=0.76。
图2F:H1指标两次Z标准化复测得分散点;r=0.75r=0.75r=0.75。
图2G:B1与H1指标汇总得分散点,r=0.02r=0.02r=0.02。
三、声学偏好与和弦协和偏好的相关性
拍频指标和和弦协和偏好的相关系数整体偏低、跨音色/受试组结果不稳定(图3A上栏,补充附图S2佐证);与之相反,H1、H2两项谐波指标无论天然乐器音色还是人工合成音色,均和音程、三和弦协和偏好呈稳定强正相关(图3A中下栏):越偏爱谐波频谱的受试者,越偏好协和和弦。尽管人的和弦审美会受瞬时心境、近期聆听曲风等杂项因素干扰,但谐波偏好可以解释协和偏好的大量个体方差,拍频偏好的解释占比极低(图3B)。
细化单和弦评分相关性(全音色均值,图3C):拍频指标仅和大二度、小二度两类不协和音程呈现微弱负相关,和其余所有不协和和弦无规律关联;而两项谐波指标与本实验测试的全部不协和和弦均呈稳定负相关。值得注意:H1、H2由两套物理结构完全无关的音源数据构建,却呈现高度一致的相关分布规律,进一步验证谐波的决定性作用。
图3A:拍频、谐波偏好分别与音程/三和弦协和指标的相关系数;横轴标注音色:S萨克斯、V人声元音、SV合成元音、C合成复音、P纯音;误差棒95%置信区间,星号代表p<0.05p<0.05p<0.05显著。
图3B:声学偏好指标可解释的协和偏好方差占比(%),误差棒标准误;星号代表谐波指标方差解释率显著高于拍频指标(符号检验α=0.05\alpha=0.05α=0.05)。
图3C:各声学指标与单个和弦平均分的相关系数(全音色平均);蓝色竖线为本研究界定的不协和音程/和弦。
四、乐器演奏阅历带来的审美差异
将受试者乐器演奏年限分别与B1、H1、H2做相关(图4A):两项谐波偏好指标均和练琴年限显著正相关,拍频B1无相关。演奏乐器年限越长,受试者对谐波频谱的偏好越强。本实验声学测试音源无任何音乐属性、物理形态也刻意远离常规乐曲,该结果有力证明谐波是音乐的核心声学要素,人对谐波的审美偏好至少一部分由长期音乐熏陶习得。
同时,乐器练习时长也与和弦协和偏好强度正相关(图4B),再次佐证后天学习的作用。本研究仅用「练习年限」粗略量化西式音乐内化程度,实际相关强度大概率被低估(附图S4补充说明)。
图4A:受试乐器练习年限与三类声学偏好指标的相关系数,误差棒95%置信区间,多比较校正后星号代表p<0.05p<0.05p<0.05显著。
图4B:练琴年限和音程(蓝)、三和弦(绿)协和偏好指标的相关系数,标注规则同前。
讨论
本研究依托个体差异实验厘清协和/不协和的底层成因:和弦协和源于频率间的谐波排布,不协和由非谐波的频率组合导致;同时,人对谐波频谱、协和和弦的审美偏好显著受后天音乐阅历塑造。研究证实后天文化熏陶深刻影响协和感知,但并非让人随机偏爱某几组特定和弦,而是让人习得对「谐波结构」这一共通声学属性的审美偏好。谐波结构是哺乳动物听觉系统进化中重点处理的自然声学特征[27,28],和弦审美本质是听觉系统解析音高、声源分组的谐波分析模块附带产生的好恶评判[29,30]。
可闻拍频(听觉粗糙度)本身极易引发厌恶,作曲家也常利用该效果营造乐曲紧张感[31–33],但该审美好恶不受音乐学习影响,且无法决定和弦协和性。原因在于:不协和和弦未必产生强拍频,协和和弦也可能出现明显拍频;两个音源的拍频强弱受各自频谱幅值配比影响,同种音程换不同乐器演奏,拍频强弱差异巨大[34,35],因此拍频无法稳定表征和弦协和属性,仅作为独立于协和性之外的审美变量。反观谐波识别受分量幅值变化影响极小[36],能稳定锚定和弦的音乐属性。受限于缺少精准量化和弦实际谐波含量的感知标定算法,本研究未直接测算和弦谐波占比,转而采用纯谐波/失谐非谐波音源偏好的相关关系验证谐波的核心地位。
协和性研究长久以来是音乐领域先天本能vs后天习得的经典论战。本研究证实后天学习的作用,但同时提示相关研究需要拆分声学变量:过往婴幼儿、跨文化族群的协和感知实验,大多同时混杂谐波、拍频两个变量[5,7,9,11];未来需要分开验证两类因素的先天/后天属性。音乐阅历提升谐波偏好,既可能是后天完全习得,也可能是强化了人类先天自带的谐波偏好(自然界哺乳动物鸣叫声普遍具备谐波,谐波常作为健康、择偶吸引力的声学标识[37]),该猜想仍需后续实验佐证。
经典拍频决定论的来源是:早期研究发现纯音对的不协和评分可预测复音音程的刺耳程度[13,14],研究者将该规律全部归因于拍频。但本研究证明:窄距纯音对的难听感同时来自拍频+非谐波排布,过往被归为拍频的影响中,隐藏大量非谐波的贡献。佐证来自H2指标:构建H2的音对采用分耳放送、几乎无拍频,但其依然和和弦协和偏好高度相关,直接推翻过往结论。
即便实验和弦采用十二平均律、无法实现完美整数倍谐波,谐波偏好依旧可以有效预测和弦悦耳度,说明人耳谐波检测机制容错性较高,适配自然界天然音源普遍存在的微量谐波偏移特征[38]。谐波是否影响和弦进行、旋律的审美(比如时域整合频率信息)仍待探究[39];乐曲上下文环境会大幅改变单和弦的实际听感[40],声学规律在语境效应中的作用仍是开放性课题。
本研究用全新个体差异法破解协和性百年争议:过往各类假说预测结果高度重合、模型参数难以实测[10],而个体差异范式绕开该难点,确凿证明谐波是协和听觉的核心基础。
实验方法(简述,详细内容见补充材料)
受试与实验流程
全部受试为明尼苏达大学本科生,分两大队列(队列1:142人;队列2:123人),人口统计学特征相近、仅测试细节版本略有区别。所有被试先完成拍频+谐波两类声学打分测试,再分批完成不同乐器音色的和弦打分测试(同和弦换多种音源,用于复测信度计算)。所有测试音源随机播放,声学测试每个音源重复3轮、和弦测试重复4轮,每轮更换根音。和弦取自十二平均律;常规根音集中在中央C上方一个八度,萨克斯、人声元音音源受音域限制,根音从升G₃起。受试者打分区间−3(极度难听)~+3(极度悦耳),实验前简短练习熟悉全范围音源。
拍频测试音对间距0.75/1.5半音,同耳放送产生明显拍频;非谐波复音通过两种方式生成:各谐波分量同乘系数拉伸频率、或全部叠加固定频偏,除此之外谐波/非谐波音源参数完全一致。
数据分析
音程协和指标=前五高分音程平均分−后五低分音程平均分;三和弦指标=大三和弦均分−增三和弦均分。全分析采用斯皮尔曼相关系数、双侧显著性检验,多组对比使用改良邦弗罗尼校正。单个和弦相关分析采用全音色均分数据。
计算声学指标对协和偏好的方差解释率时,依托两类指标各自复测相关做衰减校正,相关系数平方后取全音色、全受试组均值。
补充材料译文
补充数据
1.声学测试指标信度与个体方差(附图S1)
附图S1统计两队列四项声学指标(B1/B2/H1/H2)的复测信度、个体间方差。信度即同一指标两次测试相关系数;方差为合并两次得分后受试群体数据离散度,表征个体偏好差异大小。信度、方差均由原始评分计算(原始分用于和协和指标做相关;Z标准化分数仅用于正文汇报复测信度,排除打分尺度干扰)。结果:拍频(B1/B2)与谐波(H1/H2)指标的信度、个体方差水平基本持平。
图S1A:两队列四项声学指标复测信度,误差棒95%置信区间;
图S1B:两队列四项声学指标个体方差。
2.备选拍频指标B2(附图S2)
预实验显示高频纯音对的分耳/同耳打分差值最明显,因此仅选用高频音对构建备选拍频指标B2=高频分耳均分−高频同耳均分B2=\text{高频分耳均分}-\text{高频同耳均分}B2=高频分耳均分−高频同耳均分。B2和和弦协和偏好依旧相关性微弱、跨组不稳定,方差解释率极低,同时和乐器练习年限无显著相关,和B1结论一致。
图S2A:B2与音程、三和弦协和指标相关系数;
图S2B:B2对协和偏好的方差解释占比;
图S2C:B2与各单和弦评分相关;
图S2D:B2和练琴年限相关系数。
3.未做Z标准化的重复分析(附图S3)
去掉和弦评分Z标准化步骤、复现图3全部统计:整体相关系数小幅升高,源于受试者打分尺度习惯的混杂影响,但全部核心变化趋势和原文一致,证明Z标准化仅优化干扰、不改变实验结论。
图S3A:原始未标准化评分下,拍频、谐波指标与协和指标相关;
图S3B:原始分下方差解释率(纵轴量程放大);
图S3C:原始分下单和弦相关系数。
4.偏相关分析:谐波偏好与音乐阅历(附图S4)
分别控制「练琴年限」或「谐波偏好」做偏相关:任意变量被控制后,剩余变量和协和偏好的相关系数下降但仍大多显著。说明谐波对协和偏好的作用一部分经由后天音乐阅历实现,同时谐波存在独立于练琴时长的先天影响(也可能是练琴年限指标本身过于粗略,无法精准量化音乐熏陶程度)。
图S4A:控制(虚线)/不控制(实线)练琴年限,谐波指标与协和偏好相关;
图S4B:控制(点线)/不控制(实线)谐波偏好,练琴年限与协和偏好相关;
图S4C:剔除练琴变量后,谐波指标方差解释率下降幅度;
图S4D:剔除谐波变量后,练琴年限方差解释率下降幅度。
补充实验细则
受试信息
两队列平均年龄20.2岁;队列1(143人,女95)平均乐器学习5.4年;队列2(122人,女79)平均5.7年。队列1依次完成萨克斯、人声元音、合成复音和弦测试,95人额外完成合成元音测试;队列2先做纯音/合成复音和弦,85人后续补测天然/合成元音。
音源参数
三类非谐波音源改动方案:①分量间距由12半音改为13半音;②偶次谐波抬升0.5半音、奇次谐波降低0.5半音;③仅队列1:全部谐波统一+30Hz频移。所有谐波/非谐波音源幅值每八度衰减14dB,贴合自然声源特征。
本研究频偏幅度(拉伸6%19%、抖动3%、整体偏移1.5%10%)远高于人耳失谐检出阈值(约1%基频),人耳可清晰分辨非谐波畸变。采用Praat测算谐波信噪比(HNR):谐波音源HNR≈44dB,三类非谐波音源HNR介于1522dB,差异超20dB;H2配套单音HNR=47.6dB、低频音对HNR20~28dB。现有HNR算法适配噪声-乐音区分,不完美适配谐波/失谐复音对比,后续需开发基于谐波筛的专用算法。
声学测试基准音:大部分音源基频取自中央C上方6半音区间;拍频测试低频音对:中央C上方1318半音,中频1924半音,高频25~30半音。和弦根音取自中央C上方8半音(萨克斯/人声改用升G₃起音域)。所有人工合成音源包络:10ms汉宁半窗起音+指数衰减包络(衰减常数2.5 sec−12.5\ \text{sec}^{-1}2.5sec−1),总时长截断至2s,末尾线性淡出;全音源播放声压65dB。
萨克斯音源取自爱荷华大学乐器采样库,使用Praat修音、剪辑;真人元音(/a/、/u/)由专业演唱者录制,150Hz四阶巴特沃斯高通滤波去除麦克风底噪;队列1人声固定/a/、拉平音高,队列1保留原始音高、/a/与/u/各半随机。合成元音:将真人元音平均频谱包络叠加至标准谐波复音生成。
实验流程
隔音双墙舱内森海塞尔HD580耳机放音;每组试次前2s、60dB白噪声掩蔽,消除前后试次听觉残留。和弦测试额外包含大七、小七、属七和弦(数据未纳入正文统计),声学测试附带多余对照音源(不参与数据分析)。音源全随机,声学重复3次、和弦4次,每次换根音;打分规则同正文。预实验纯音基准523Hz/740Hz,35名被试,重复3轮随机播放。
数据分析细则
指标均采用「两类音源平均分差值」计算(附图S5译文);全部斯皮尔曼双侧检验、改良邦弗罗尼多重比较校正;95%置信区间由1000次自举抽样生成。单音色相关纳入全部完成对应测试受试者;全音色平均相关仅选取四项音色全部完成打分的受试。
为消除受试者打分尺度差异:同一名受试者内部,所有和弦评分做Z标准化;声学指标原始分不标准化(仅复测信度用Z分汇报)。为验证标准化不改变结论,分别测试四种标准化方案(全不标准化、全标准化、仅和弦标准化、仅声学标准化),所有方案结论一致;非标准化结果见附图S3,相关小幅抬升,来自打分尺度混杂。
图S5A:协和指标计算公式示意图,黑线为队列1全音色和弦均分;音程指标:高分5组−低分5组;三和弦指标:大三−增三。
图S5B:声学指标计算公式;B1=全分耳音对−全同耳音对;B2=高频分耳−高频同耳;H1=谐波复音−非谐波复音;H2=单纯音−低频同耳音对。
参考文献(原文原样保留)
- Rameau, J.P. (1971). Treatise on Harmony (New York: Dover Publications)., Originally published in 1722.
- v Helmholtz, H. (1863). Die Lehre von den Tonempfindungen als Physiologische Grundlage fu¨ r die Theorie der Musik (Braunschweig: F. Vieweg und Sohn).
- Stumpf, C. (1890). Tonpsychologie (Leipzig: Verlag S. Hirzel). 4. Guernsey, M. (1928). The role of consonance and dissonance in music. Am. J. Psychol. 15, 173–204.
- Butler, J.W., and Daston, P.G. (1968). Musical consonance as musical preference: A cross-cultural study. J. Gen. Psychol. 79(1st Half), 129–142.
- Mathews, M.V., and Pierce, J.R. (1980). Harmony and nonharmonic partials. J. Acoust. Soc. Am. 68, 1252–1257.
- Zentner, M.R., and Kagan, J. (1996). Perception of music by infants. Nature 383, 29.
- Fishman, Y.I., Volkov, I.O., Noh, M.D., Garell, P.C., Bakken, H., Arezzo, J.C., Howard, M.A., and Steinschneider, M. (2001). Consonance and dissonance of musical chords: Neural correlates in auditory cortex of monkeys and humans. J. Neurophysiol. 86, 2761–2788.
- Trainor, L.J., Tsang, C.D., and Cheung, V.H.W. (2002). Preference for sensory consonance in 2- and 4-month-old infants. Music Percept. 20, 187–194.
- McDermott, J.H., and Oxenham, A.J. (2008). Music perception, pitch, and the auditory system. Curr. Opin. Neurobiol. 18, 452–463.
- Fritz, T., Jentschke, S., Gosselin, N., Sammler, D., Peretz, I., Turner, R., Friederici, A.D., and Koelsch, S. (2009). Universal recognition of three basic emotions in music. Curr. Biol. 19, 573–576.
- Bidelman, G.M., and Krishnan, A. (2009). Neural correlates of consonance, dissonance, and the hierarchy of musical pitch in the human brainstem. J. Neurosci. 29, 13165–13171.
- Plomp, R., and Levelt, W.J.M. (1965). Tonal consonance and critical bandwidth. J. Acoust. Soc. Am. 38, 548–560.
- Kameoka, A., and Kuriyagawa, M. (1969). Consonance theory. J. Acoust. Soc. Am. 45, 1451–1469.
- Hutchinson, W., and Knopoff, L. (1978). The acoustical component of western consonance. Interface 7, 1–29.
- Sethares, W.A. (1999). Tuning, Timbre, Spectrum, Scale (Berlin: Springer).
- Terhardt, E. (1974). Pitch, consonance, and harmony. J. Acoust. Soc. Am. 55, 1061–1069.
- Tramo, M.J., Cariani, P.A., Delgutte, B., and Braida, L.D. (2001). Neurobiological foundations for the theory of harmony in western tonal music. Ann. N. Y. Acad. Sci. 930, 92–116.
- Cariani, P.A. (2001). Temporal codes, timing nets, and music perception. J. New Music Res. 30, 107–135.
- Ebeling, M. (2008). Neuronal periodicity detection as a basis for the perception of consonance: A mathematical model of tonal fusion. J. Acoust. Soc. Am. 124, 2320–2329.
- Terhardt, E. (1974). On the perception of periodic sound fluctuations (roughness). Acustica 30, 201–213.
- Daniel, P., and Weber, R. (1997). Psychoacoustical roughness: Implementation of an optimized model. Acustica 83, 113–123.
- Lundin, R.W. (1947). Toward a cultural theory of consonance. J. Psychol. 23, 45–49.
- Rutschmann, J., and Rubinstein, L. (1965). Binaural beats and binaural amplitude-modulated tones: Successive comparison of loudness fluctuations. J. Acoust. Soc. Am. 38, 759–768.
- Bernstein, J.G., and Oxenham, A.J. (2003). Pitch discrimination of diotic and dichotic tone complexes: Harmonic resolvability or harmonic number? J. Acoust. Soc. Am. 113, 3323–3334.
- Feeney, M.P. (1997). Dichotic beats of mistuned consonances. J. Acoust. Soc. Am. 102, 2333–2342.
- Kadia, S.C., and Wang, X. (2003). Spectral integration in A1 of awake primates: Neurons with single- and multipeaked tuning characteristics. J. Neurophysiol. 89, 1603–1622.
- Lewis, J.W., Talkington, W.J., Walker, N.A., Spirou, G.A., Jajosky, A., Frum, C., and Brefczynski-Lewis, J.A. (2009). Human cortical organization for processing vocalizations indicates representation of harmonic structure as a signal attribute. J. Neurosci. 29, 2283–2296.
- Plack C.J., Oxenham A.J., Popper A.J., and Fay R.R., eds. (2005). Pitch: Neural Coding and Perception (New York: Springer).
- Darwin, C.J. (1997). Auditory grouping. Trends Cogn. Sci. 1, 327–333.
- Pressnitzer, D., McAdams, S., Winsberg, S., and Fineberg, J. (2000). Perception of musical tension for nontonal orchestral timbres and its relation to psychoacoustic roughness. Percept. Psychophys. 62, 66–80.
- Vassilakis, P. (2005). Auditory roughness as a means of musical expression. Selected Reports in Ethnomusicology 12, 119–144.
- Bigand, E., Parncutt, R., and Lerdahl, F. (1996). Perception of musical tension in short chord sequences: The influence of harmonic function, sensory dissonance, horizontal motion, and musical training. Percept. Psychophys. 58, 124–141.
- Kohlrausch, A., Fassel, R., and Dau, T. (2000). The influence of carrier level and frequency on modulation and beat-detection thresholds for sinusoidal carriers. J. Acoust. Soc. Am. 108, 723–734.
- Cook, N.D. (2009). Harmony perception: Harmoniousness is more than the sum of interval consonance. Music Percept. 27, 25–41.
- Ritsma, R.J. (1967). Frequencies dominant in the perception of the pitch of complex sounds. J. Acoust. Soc. Am. 42, 191–198.
- Bruckert, L., Bestelmeyer, P., Latinus, M., Rouger, J., Charest, I., Rousselet, G.A., Kawahara, H., and Belin, P. (2010). Vocal attractiveness increases by averaging. Curr. Biol. 20, 116–120.
- Fletcher, H., Blackham, E.D., and Stratton, R. (1962). Quality of piano tones. J. Acoust. Soc. Am. 34, 749–761.
- Parncutt, R. (1989). Harmony: A Psychoacoustical Approach (Berlin: Springer-Verlag).
- Steinbeis, N., Koelsch, S., and Sloboda, J.A. (2006). The role of harmonic expectancy violations in musical emotions: Evidence from subjective, physiological, and neural responses. J. Cogn. Neurosci. 18, 1380–1393.
补充参考文献(原文原样保留)
- Moore, B.C.J., Glasberg, B.R., and Peters, R.W. (1986). Thresholds for hearing mistuned partials as separate tones in harmonic complexes. Journal of the Acoustical Society of America 80, 479-483.
- Grube, M., von Cramon, D.Y., and Rubsamen, R. (2003). Inharmonicity detection: Effects of age and contralateral distractor sounds. Experimental Brain Research 153, 637642.
- Boersma, P. (1993). Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound. IFA Proceedings 17, 97-110.
- Tramo, M.J., Cariani, P.A., Delgutte, B., and Braida, L.D. (2001). Neurobiological foundations for the theory of harmony in Western tonal music. Annals of the New York Academy of Science 930, 92-116.