百科 > 金融 > 基金术语

基金绩效评价

什么是基金绩效评价

　　基金绩效评价就是在剔除了市场一般收益率水平、基金的市场风险和盈利偶然性的前提下，对基金经理人投资才能的公正客观的评价。

基金绩效评价方法的发展

　　基金绩效评价是一个复杂的问题。它不仅涉及到衡量绩效的客观有效的度量方法，也关系到基金绩效的持续性和业绩归因分析等多方面的因素。从目前的情况看，我国在基金绩效评价方面的研究依然非常薄弱，不仅在理论研究上还基本停留在国外90年代的理论水平，在实证研究上也比较缺乏。

　　国外近几十年的理论研究和实践表明，数量分析的方法被大量地引入基金绩效评价。随着现代金融理论的不断发展，基金绩效评价在理论研究的指导下进行了许多实证分析，而实证分析的结果又反过来对相关的金融理论和假设进行了验证。事实上，许多在金融投资理论界存在争议的假设依然能够在基金绩效评价的领域发现其踪迹。

　　国外对基金绩效评价研究有着长期的历史、较为完善的理论体系和大量的实证研究，而我国目前还基本处在开始的阶段。这是因为证券投资基金在我国的时间较短，即使以90年代初期各地不规范设立的基金（如蓝天基金、天骥基金和广发基金等）算起，也不过10余年的时间。若以1998年3月第一只封闭式基金（基金金泰、基金开元）成立算起也仅几年的时间。由于封闭式基金的基金规模（份额）并不随基金绩效发生变动，封闭式基金的发行长期处于超额认购的局面，加之持有人主要是通过封闭式基金的交易获取价差收益而不是通过净值增长获得资本利得，因此无论是管理公司、持有人、监管层和独立第三方对基金绩效评价的研究并不系统和深入。从2001年华安基金公司在中国市场发行了第一只开放式基金起，截至2005年12月28日，共有217只证券投资基金正式运作，其中开放式基金163只，封闭式基金54只。按照证监会11月底的统计数据，目前证券投资基金的净值规模已经达到5000亿元；共有52家基金管理公司，其中正式管理基金的是49家；与迅猛增长的基金市场相比，我国在基金绩效评价的理论研究和实证分析方面还远远落在后面。

　　国外的绩效评价具有较长的历史。60年代资产组合理论、资本资产定价模型和股票价格行为理论，奠定了现代基金评价理论的基石。特别是Sharpe/Lintner的资本资产定价模型（CPAM），更是基金绩效评价的基础。Treynor、Sharpe和Jensen几乎同时分别提出了经过风险调整后的基金绩效评价方法，这才使绩效评价能够在同样的风险水平上进行比较。尽管他们在衡量风险的指标选取上有所不同（Sharpe指数采用的是全部风险）。CPAM模型历史久远而且目前仍被广泛应用（例如Malkiel，1995和Ferson、Schadt，1996）。不过这个理论也遭到了强烈的反对（RichardRoll1977，1978，AdmatiandRoss，1985，和DybvigandRoss，1985a，b）。例如，使用证券市场线来进行绩效评价是“不确定的”。使用这种方法来判断绩效有时会被视为“无望的”（AdmatiandRoss，1985，p.16）和“总体而言任何事情皆有可能。”（DybvigandRoss，1985a， p.383）

　　针对上述的批评，又有一些改进的指标被提出。例如信息率，即是改进的詹森指数，通过单位非系统风险的超常收益率对基金投资业绩进行评价。1997年诺奖得主FrancoModigliani和其孙女LeahModigliani把国债引入证券投资的实际资产组合，构建一个虚拟的资产组合，使其总风险等于市场组合的风险，通过比较虚拟资产组合与市场组合的平均收益率来评价基金业绩，该种方法被命名为M2.

　　2000年Muralidhar认为Sharp值、信息率、M2法不足以有效地进行组合构建和基金业绩排序，问题的关键在于对组合和基准之间标准差的差异调整不够，并且忽略了“组合和基准的相关性”常导致错误排序和评价。鉴于此，Muralidhar提出了M3测度方法。Stutzer（2000）在损失厌恶理论基础上，假定投资者选择最大可能地回避风险，从而构建了一个新的评价指标，即衰减度（ProbabilityofDecayRate），该指标最大的特点在于允许收益率收敛于各种分布。当收益率收敛于非正态分布式衰减度对于偏度和峰度敏感性较高，正偏度的基金风险趋小。

　　此外，证券选择和时机选择、业绩归因、绩效的持续性、基金风格、绩效评估的一致性、基准组合的有效性和资产配置分析等方面，也是国外近期基金绩效评价研究的热点。

　　Treynor＆Mazuy（1966）首次提出的二次方程模型（T-M模型）可以用来检验基金经理的择时能力。择时能力是指基金经理预测风险资产的收益高于或低于无风险利率的能力。Heriksson＆Merton（1981）则提出在CPAM模型中增加一个二项式随机变量，称之为双β模型（H-M模型）。Bhattacharya＆Pfleiderer（1983）对H-M模型的研究表明，经过他们改进后的模型可以判断基金经理是否正确地利用了正确的信息。Connor＆Kora jczyk（1991）的研究表明在基金组合与市场收益率之间有协偏度（Co-skewness）时，T-M和H-M模型会得到错误的结论。Grinblatt＆Titman（1989，1994）针对这种情况提出了PositivePeriodWeightingMeasure（PPW）的模型，此模型通过计算期内各时期的超额收益率的加权收益率，给出了择股和择时能力的综合检验结果。此外，Chang＆Lewellen（1984）基于APT模型提出了一种新的检验方法。引入变量β1和β2，通过计算它们的差来判断资产管理人的择时能力。

　　Fama（1972）最早对基金绩效进行了归因分析，并提出了著名的Fama模型。Fama的模型建立在CAPM模型有效的前提上，他将资产组合的超额收益率分为“选择回报”（由分散回报和净选择回报组成）和“风险回报”（由投资者风险回报和经理人风险回报组成）两部分。Brinson，Hood＆Beebower（1986）提出的BHB模型则将资产组合与基准组合的差异归因于择时、择股和交互作用三类。但他们的研究结果也遭到了许多批评，如Hensel，Ezra＆Ilkiw（1991），JohnNuttall（1998）等。

　　绩效的持续性是绩效评价的又一个主要研究方面。如果基金绩效是持续的，则绩效评价的结果对投资者而言是具有实际应用意义的。尽管关于绩效持续性的研究常常是相互矛盾的，不过近来众多的研究比较倾向于认为基金的绩效具有较为显著的持续性。如Brown＆Goetzmann（1995）认为基金“短期内”具有持续性。比较常用的检验方式有半期平均秩差检验法和交叉积比率（CPRCrossProductRadio）法。半期平均秩差检验法是通过将基金按时间分为前后时间相等的两部份，并分别计算其秩。如果这两段的秩相等，则表明该基金的业绩在全部基金的排名保持稳定状态，其业绩具有长期的稳定性。CPR法是将一定时期内的基金绩效与所有基金的中位值相比较，将比较结果高者标为W（win），低于中位值者标为L（lost）。定义CPR=WW LL/（WL LW）。CPR的取值范围为（0，+∞），如果绩效的持续性越差，CPR值越接近0，反之若持续性越强，CPR值越接近正无穷。据Carhart（1997）的观点，短期的基金绩效的持续性应归咎于持有的好或差的股票，长期的持续性则是由于费率结构的设计不同。

　　基金的风格研究是对基金的投资和收益特点进行的研究。随着金融创新的深化和产品设计竞争的加剧，市场上逐渐出现了许多类型和风格差异的基金。因此基金的风格研究具有极大的实用性。基金风格研究的方法可以分为因素分析法和特征分析法。最早的风格研究方法是所谓的HBS（HoldingsBasedStyleAnalysis）法。这种方法通过对基金披露的全部持股信息进行分析而进行。缺点是无法有效地剔除“披露日修饰”行为。1992年夏普（Sharpe）采用12因素模型（这12个因素是短期票据、中期政府债、长期政府债、公司债、抵押证券、大盘价值股票、大盘成长股票、中盘股票、小盘股票、非美国债券、日本股票和欧洲股票）进行研究，这种方法被称为RBS（ReturnBasedStyleAnalysis）。RBS方法将基金收益分解为风格收益和选择收益。模型中因素的选取遵循排他、无遗漏和易于获得等原则。目前有越来越多的各种因素模型出现。而特征分析法有MSB（MorningstarStyleBox）方法等。晨星风格箱法（MSB）由著名的晨星公司于1992年提出并于2002年进行了改进。它首先根据资产组合中各股票市值规模的大小将其分为大盘、中盘和小盘，再在划分的每个市值区间根据定义的算法计算其价值和成长得分，最后将其定位到基金风格箱里的不同位置。

　　GolloandLockwood（1999）对1983-1991期间更换了经理人的共同基金的业绩、风险及投资风格的改变进行了研究。当用公司规模、价值/成长重新对基金进行分类时，发现有多于65%的基金在改变管理之后投资风格也发生了改变。

　　绩效评估的一致性是研究和比较基金绩效评价的诸方法结果差异性的。不过该方面的研究一直比较少，国内目前还只有王聪（2001）对多重比较法等概念进行了一些介绍。评估一致性的检验方法主要有Spearman秩相关检验、Kendall协同检验和多重比较法等。Spearman秩相关检验方法是通过对两种绩效评估方法所形成秩序列的相关性，判断两方法是否一致。如果该两种方法的秩（排序的差的平方）较小，则表明该两种方法对基金的评估具备一致性。Kendall协同检验是在相关系数检验法上发展的。其中Kendall协同系数定义为12S/m2n（n2-1）。W的取值范围在0和1之间。W的值越大，诸绩效评估方法具备越强的一致性。极端地，W取值1时说明所有的绩效评估方法结果完全相同。经过Kendall协同检验，具有一致性的基金可以通过多重比较法来进行总体业绩评估。

　　国内关于基金绩效评价的研究目前还比较少。从已发表的文章和收集的资料来看，国内的研究还局限于对国外理论的介绍和实证研究，更多地是对某种单独的理论或角度进行研究，缺乏整体和系统的研究和缺少理论上的创新。

基金绩效评价的指标

　　1、夏普(Sharpe)指数简介

　　美国经济学家威廉·夏普于1966年发表《共同基金的业绩》一文，提出用基金承担单位总风险（包括系统风险和非系统风险）所带来的超额收益来衡量基金业绩，这就是夏普指数。夏普指数通过一定评价期内，基金投资组合的平均收益超过无风险收益率部分与基金收益率的标准差之比来衡量基金的绩效。计算公式为：

　　Sp = (ｒp-ｒf)/σp

　　其中，Sp为夏普指数，ｒp为基金组合的实际收益, ｒf为无风险收益率, σp 为基金收益率所对应的标准差。

　　夏普指数的理论依据是资本资产模型（CAPM模型），以资本市场线(ＣＭＬ)为评价的基点,如果基金证券组合的夏普指数大于市场证券组合M的夏普指数，则该基金组合就位于CML之上，表明其表现好于市场；反之，如果基金投资组合P的夏普指数小于市场证券组合M的夏普指数，则该基金组合就位于CML之下，表明其表现劣于市场。因此，可以认为，夏普业绩指数越大,基金绩效就越好；反之，基金绩效就越差。

　　2、特雷诺(Treynor)指数简介

　　杰克·特雷诺1965年发表《如何评价投资基金的管理》一文，认为足够的证券组合可以消除单一资产的非系统性风险,那么系统风险就可以较好地刻画基金的风险，即与收益率变动相联系应为系统性风险。因此，特雷诺指数采用在一段时间内证券组合的平均风

　　险报酬与其系统性风险对比的方法来评价投资基金的绩效。这就是特雷诺指数，它等于基金的超额收益与其系统风险测度β之比。

　　计算公式为：

　　Tp = (ｒp-ｒf)/ βp

　　其中，Tp为特雷诺指数；βｐ表示基金投资组合的β系数，是投资组合要承担的系统风险。

　　特雷诺业绩指数的理论依据也是资本资产定价模型（CAPM模型），但是是以证券市场线（SML）为评价的基点，当市场处于平衡时，所有的资产组合都落在SML上，即SML的斜率就表示市场证券组合的特雷诺指数。当基金投资组合的特雷诺指数大于SML的斜率时，该投资组合就位于SML线之上，表明其表现优于市场表现；反之，当基金投资组合的特雷诺指数小于SML的斜率时，该投资基金组合位于SML线之下，表明其表现劣于市场表现。所以，特雷诺业绩指数越大,基金的绩效就越好；反之，基金的绩效就越差。

　　3、詹森(Jensen)指数简介

　　美国经济学家迈克尔·詹森1968年发表《1945-1964年间共同基金的业绩》一文，提出了一种评价基金业绩德绝对指标，即詹森指数。他认为,基金投资组合的额外收益可衡量基金额外信息的价值,因而可以衡量基金的投资业绩，其计算公式为：

　　Jp=ｒｐ-[ｒf+βp(ｒｍ-ｒf)]

　　----Jp为詹森指数。

　　詹森业绩指数,又称为α值,它反映了基金与市场整体之间的绩效差异。詹森指数也以资本资产定价模型为基础，根据SML来估计基金的超额收益率。其实质是反映证券投资组合收益率与按该组合的β系数算出来的均衡收益率之间的差额。当然，差额越大，也就是詹森系数越大,反映基金运作效果越好。如果为正值，则说明基金经理有超常的选股能力,被评价基金与市场相比，高于市场平均水平，投资业绩良好；为负值则说明基金经理的选股能力欠佳,不能跑过指数,被评价基金的表现与市场相比较整体表现差；为零则说明基金经理的选股能力一般,只能与指数持平。

基金绩效评价的指标的缺陷

　　上述三个指标是衡量基金业绩的经典方法，然而在实际操作中，对于相同的数据，却可能出现不一致的评价，究其原因，是各个指标对风险和收益的衡量上，各有特点，彼此之间有所不同。

　　本部分从各个指标对风险和收益的不同衡量出发，以对基金收益的分解为基础，分析一下夏普指数、特雷诺指数和詹森指数的缺陷及不足。

　　1、詹森指数的缺陷及不足

　　根据回归模型ｒｐ-ｒｆ=αｐ+βｐ(ｒｍ-ｒｆ)+ε，所以αｐ就是Jp的大小。根据证券市场线分析,詹森指数衡量了证券组合获得的高于市场平均回报的那部分风险溢价,即投资组合总收益与位于证券市场线上的证券组合收益之间的差额。根据上文法玛(Ｆａｍａ)基金组合收益分解可知,詹森指数衡量的是投资组合的选择收益,而对市场时机把握能力未做出评价。可见，詹森指数虽然是迄今为止使用最广泛的评价方法之一，但它对基金收益的评价是不够全面的。

　　其次，由于都以SML为研究的基点，用詹森指数和特雷诺指数评价基金整体效益时隐含了一个假设,即基金的非系统风险已通过投资组合彻底的分散掉，而事实往往不如此，特别是对于那些采用积极管理策略的投资基金都是不适用的。也可以说,这两种方法忽略了基金投资组合中所含证券的数目，即基金投资组合的广度,而只考虑了获得超额收益的大小，也就是基金投资组合的深度。这是另一个缺陷。

　　2、特雷诺指数的缺陷及不足

　　特雷诺指数的缺陷主要有两点：

　　首先，从其计算公式Tp = (ｒｐ-ｒｆ)/βｐ中很明显可以看出,如上一条所提到的，特雷诺指数中，风险的衡量只是本证券组合的系统性风险，即假设已经将非系统风险完全分散掉。但其实在实际操作当中, 基金所选择的风险并非完全分散化,因而系统风险与总体风险并不能等同，而是有可能存在较大误差。

　　第二，另外,特雷诺指数采用的收益Ｅ(ｒｐ-ｒｆ)是基金的整体收益，没有排除市场状况的因素。然而人往往不能战胜市场，市场因素是有可能在收益中起很大作用的,而非由于基金管理人的运作能力。例如，同一支基金既是不根据市场状况对系统风险（βｐ）进行调整，在牛市时，特雷诺指数也会比在熊市是大。这时因为市场风险的单位价格较高，而并不能反映基金管理人的经营能力强。可见，如果市场的状况不同，用特雷诺指数进行绩效评价就变得没有意义了。

　　一方面是基金投资组合的总收益，一方面是基金管理人承担的系统风险水平，两者相除时，得到的特雷诺指标来评价基金绩效就很可能与实际情况不符了。

　　3、夏普指数的缺陷及不足

　　夏普指数在考虑风险因素时,不仅考虑了系统风险,还考虑了非系统风险,但是它仍然存在着不合理性：

　　首先，在衡量收益时,它同特雷诺指数一样,也没有考虑市场因素。

　　其次，由于是相对指标，夏普指数和特雷诺指数都只能用作比较和排序,而无法反映基金表现优于市场组合的具体值究竟是多少。

基金业绩评价中的注意问题

　　除了不能机械地照搬基金评估的定量分析指标,而是要结合我国证券市场的实际情况之外，对我国证券投资基金的评价，还要注意以下几个问题：

　　（一）非数量化因素问题

　　基金评价指标都是数量化的,在实际选择基金的过程中还应该结合基金其他方面进行综合评价。比如说，基金评价期内，管理层和管理风格可能发生了一些变化。另外，经济大环境以及基金涉及证券的行业趋势等等，仅靠数字层面的分析是很难得到公正的评判的。比如,某类股票在过去的几年中曾经呈上扬走势,任何重仓持有这些股票的基金在这几个指标上都会表现很好,而当该类股票走低的时候,这些指标的数值也将很可能会随之走低。因此,投资者应该用评价指标的比较来缩小可选基金的视野,然后结合基金的管理团队、投资的风格、交易费用的结构、投资组合的潜在风险以及是否适合手中的投资组合等因素进行综合考虑，然后对目标基金做出较为全面的评判。

　　（二）绩效持续性问题

　　证券投资基金的评估应坚持以业绩为核心，同时要关注绩效的持续性。从国外基金运作的情况来看,大部分基金的业绩稳定性比较差。究其原因,基金的优异表现可能是来自基金管理人高超的投资技能或好运气。如果基金的业绩不具备持续性，就不能用过去的业绩对将来进行预测。因此,基金业绩的稳定与否也是基金评估和投资者选择基金的重要原则。在实际评价中，也要尽量选择较长的评价期，因为，从一定意义上来说，评价期越长,评价指标就越能真实地反映基金的业绩。

　　（三）基准的选择问题

　　要将基金的绩效与市场状况进行比较，需要有一个合理全面的参照标准。但是，中国目前尚无统一权威的市场指数。将基金与上证指数或者深证指数进行比较以反映基金绩效的方法不够客观。因为，一方面，上证指数或深证指数都不是两市场的统一指数，而基金是投资于两个市场的；另一方面，基金只能投资于两市的流通股，而上证指数和深证指数是以总股本而不是以流通股本为权重，因此以上证指数或深证指数对基金绩效进行评价都显得有效性不足。有观点认为应以两者的加权平均为基准，或者对两指数做出适当调整，但是实际操作中也有一定的难度。

　　（四）基金的可比性问题

　　根据不同的标准，基金可以分成许多的种类，不同种类的基金本身具有不同的特点。根据法律基础及组织形态的不同可划分为公司型的和契约型的;根据变现方式不同可划分为开放型的和封闭型的;根据投资目标不同可划为成长型和收入型等。因此,在基金评价时,必须坚持同类比较的原则,不同类型基金进行比较时一定要有相应的前提条件。

参考文献

↑ ^1.0 ^1.1 ^1.2 康媛.基金绩效评价之风险调整收益指标比较与选择(D).北京:中国人民大学.2004

阅读数：877