分类 统计 下的文章

组会找了一篇 ICML 的贝叶斯优化相关论文,主要集中探究的主题是:对于 GP-BO ,输入数据集既有分类变量又有连续变量的时候,应该如何处理?这也是 Mixed Search Space 方向,也算是 BO 当中目前仍在解决的领域。希望自己能有朝一日也在 ICML 这种顶会上发论文。💪

- 阅读剩余部分 -

本文先介绍多臂老虎机的符号规范与基本定义,将其建模为含动作集、奖励集与概率分布的三元组,说明其在推荐、广告、投资等领域的应用。接着区分非结构化与结构化老虎机,定义伪遗憾、期望遗憾与遗憾界,指出探索‑利用权衡是核心问题。文末给出相关引理证明,并提供 Bernoulli 老虎机的 Python 实现与 Follow‑The‑Leader 算法示例,通过实验说明该算法遗憾呈线性增长,为后续更优算法作了铺垫。

- 阅读剩余部分 -