现实生活中的考试:MAS II
“现实生活中的考试”系列旨在分享 CAS 考试内容在当今职场中的应用。本质上,我们希望通过回答“我为什么要学习这些东西?”和“我什么时候会用到它们?”来提供一点动力。如果您还没有这样做,请花点时间阅读我们之前的文章(请参阅下面的 IRL 考试档案).
对于本期,我们的重点是 MAS II – 现代精算统计 II。
MAS II 的材料向考生介绍了一系列强大的技能!
该考试材料的有效性体现在“现代”这一名称中。精算职业如此充满活力的主要原因在于我们一直在努力进步。随着数据存储能力和计算能力的创新,我们的分析可以/必须进步。改进的预测分析和贝叶斯思维的好处使精算估计更加准确和细致。我们正处于精算复兴的中期!MAS II、MAS I、数据和分析入门课程以及即将推出的预测分析模块可帮助考生为未来的精算分析做好准备。
MAS II 分为四个有益的主题:可信度、线性混合模型、统计学习和时间序列。让我们讨论一下!
可信度简介
可信度是一项历史悠久的精算实践。通常,我们使用内部数据进行精算估计,这些数据可能太小或太嘈杂,无法完全视为具有统计意义,特别是当我们试图在更细微的层面上进行预测时。在这种情况下,我们希望用相关的、显著的值或数据行为的基本假设来加权我们的内部估计。这个加权估计提供了一个可信的数字,可用于精算方法,例如指示。例如,我们可能觉得我们的数据太薄弱,无法完全依赖预期损失的估计来用于州指示,因此我们可能希望用全国预期损失对估计进行可信度加权,将 40% 的权重放在我们的州损失估计上,将 60% 的权重放在全国损失上。由此产生的可信度加权预期损失将是一个更稳定的数字,可用于我们的指示。
MAS II 讨论了在计算可信度加权估计时如何确定要应用的权重 (Z)。目前,大多数业务线的费率制定方法都使用经典技术(有限波动)。虽然简单,但大多数情况下都是准确的。然而,这种方法可能会导致边缘不准确(例如,超级安全保单持有人和/或超级风险保单持有人)。为了提高准确性,精算师越来越多地深入研究贝叶斯方法。MAS II 讨论了 Buhlmann、Buhlmann-Straub 和一般贝叶斯程序。这些方法允许人们假设我们的数据性质可能如何表现,然后将内部估计应用于这些假设,通过计算 Z 或创建用于我们未来估计的预测分布。理解和应用这些基于贝叶斯的方法对于改进精算预期频率、严重程度和总损失估计至关重要。更精细的预测可以为保单持有人带来有利的选择和更公平的保费。
线性混合模型
为了向投保人收取公平的保费,我们需要能够以可靠的方式区分他们。根据一系列选定的投保人特征将风险分为同质组,并计算每个级别的相对平均预期损失,这使我们能够创建一种称为类别计划的乘法算法。类别计划的目的是根据每个投保人的个人特征计算他们的公平保费。然而,我们将数据分成的组越多,预测损失的统计显著性就越低。这带来了一个有趣的困境:我们希望正确分类风险,但也希望得到可靠的估计。因此,我们的分组不能太过细致。然而,每个组内的风险都不同。因此,我们并没有完全掌握真正的分类。对于这个困境,我们可以从使用模型中受益,比如线性混合模型 (LMM)。
LMM 结合了固定效应和随机效应,这意味着我们可以对一组独立变量与响应变量之间的关系进行建模(例如,投保人特征与预期损失),同时还可以对每个独立变量内的风险差异进行建模。与其他工具(如广义线性模型)一起,LMM 可以帮助我们在类别计划中更有效地区分投保人。LMM 还可用于业务分析、规划等。
统计学习
除了 LMM,还有大量有用的统计工具可以改进我们的精算方法和分析。MAS II 引入了许多这样的工具,包括 k-最近邻、决策树(CART)、随机森林、梯度提升机(GBM)、主成分分析(PCA)、聚类(k-均值、分层)、神经网络以及汇总统计数据的解释。
这些工具有多种用途。例如,基于树的方法和 PCA 用于帮助识别模型中使用的重要变量(例如,哪些保单持有人特征最能预测预期损失)。聚类方法用于帮助识别变量内各层之间的划分(例如,一个州的领土)。
解释统计数据(例如 p 值、AIC、R 平方、基尼系数、提升图等)的能力对于理解变量重要性和模型预测准确性必不可少。我们必须确定哪些模型最适合精算估计,并确保变量的选择和由此产生的预测是值得信赖的。
时间序列
用于精算估计的大部分数据都具有时间成分,其中先前的数据点自然会导致后续的数据点(即数据随时间相关)。这种自相关性以及长期趋势和季节性成分为预测未来行为提供了有用的模式。
时间序列模型有助于识别这些模式。MAS II 将特别教您自回归综合移动平均 (ARIMA) 模型。“AR”组件通过回归对自相关进行建模,“I”组件提供一种数据转换(差分/积分),隐式地对季节性和其他影响进行建模,而 MA 组件通过移动平均线对长期趋势进行建模。
ARIMA 模型尚未得到充分利用!它们在趋势选择方面具有强大的可能性,例如保费、损失、风险敞口和费用趋势。ARIMA 模型可用于识别变化的驱动因素。它们可用于业务分析、规划等。