编辑:时间:2026-05-06 21:04:00 浏览次数:
近日,统计与数据科学学院旷骐博士的系列成果发表或接受于国际统计学顶级期刊Journal of the American Statistical Association (JASA)、人工智能顶会NeurIPS 2025以及运筹学国际权威期刊Annals of Operations Research。该系列成果关注于统计学方法在人工智能算法与金融风控领域的交叉应用。
论文Distributional Off-Policy Evaluation with Deep Quantile Process Regression近日已被JASA接受。研究聚焦于强化学习中的离线策略评估问题。传统离线策略评估通常关注目标策略的平均回报,但在医疗决策、金融风控、智能调度等高风险场景中,仅估计均值往往难以精准刻画策略的不确定性。该研究提出一种基于深度分位数过程回归的离线策略评估方法。通过直接学习回报的连续分位数函数,该方法刻画目标策略回报分布的完整分布。文章为强化学习中的策略评估和不确定性量化提供了新的工具,以及相应的理论支撑。

针对更加复杂的决策环境,发表于NeurIPS 2025的文章 Breaking the Order Barrier:Off-Policy Evaluation for Confounded POMDPs探讨了存在不可观测混淆因子的策略评估问题。在实际应用中,决策者往往无法观测系统的完整状态,同时历史数据中的行为策略也可能受到未观测因素影响。这类问题会给离线策略评估带来严重偏差,是强化学习理论和因果推断中的重要挑战。该研究结合最新的近端因果推断方法,研究如何打破传统方法在样本复杂度上的限制,为复杂真实场景下的离线决策评估提供了理论支撑。

针对金融风险管理中违约损失率建模问题,文章Loss given default model for online microloans using neural network based quantile model提出了一种新的违约损失率预测方法。针对传统线性模型往往难以充分刻画违约损失的非线性结构和尾部风险这一问题,该研究基于分位数神经网络模型,对在线小微信贷的违约损失率进行建模。该方法能够描述不同风险水平下的变化特征,尤其适合用于识别高风险客户、刻画极端损失情形,并支持更加精细化的风险定价。

(图文/统计与数据科学学院 编辑/朱晓民 审核/谭育华 张华 郭露)
