首页
关于
论坛
投稿
搜索
统计之都
2022-05-06
41 / 49
统计模型
修正的 LARS 算法和 lasso
修正的 LARS 算法和 lasso
郝智恒
/
2011-04-25
在小弟的上一篇文章中,简单的介绍了 LARS 算法是怎么回事。主要参考的是 Efron 等人的经典文章 least angle regression。在这篇文章中,还提到了一些有趣的看法,比如如何用 LARS 算法来求解 lasso estimate 和 forward stagewise estimate。这种看法将我对于模型选择的认识提升了一个层次。在这个更高的层次下看回归的变量选择过程,似乎能有一些更加创新的想……
统计模型
LARS 算法简介
LARS 算法简介
郝智恒
/
2011-04-23
最近临时抱佛脚,为了讨论班报告 Group Regression 方面的文章,研究了 Efron 等人于 2004 年发表在 Annals of Statistics 里一篇被讨论的文章 LEAST ANGLE REGRESSION。这篇文章很长,有 45 页。加上后面一些模型方面大牛的讨论的文章,一共有 93 页。对于这种超长论文,我向来敬畏。后来因为要报告的文章里很多东西都看不懂,才回过头来研读这篇基石性的文章。 所谓……
统计模型
正交试验和多因素方差分析
正交试验和多因素方差分析
刘飞燕
/
2011-04-02
英国学者 R. A. Fisher 等在二十世纪前期开创了近代数理统计这门大学科,开始的标志是学生氏 t 分布的引入。在统计的发展过程中,Fisher 又提出:“在进行一批试验之前,考虑到在取得这批试验的结果后,将要进行统计分析,因此,在试验前怎样合理地安排这批试验使得试验后的结果和统计分析取得更好的效果,是值得思考的。” 在这种提法的推动下,在数理统计中形成了一种一分为二和合二而一的试验设计与方差分析这两个……
新闻动态
通知:首届全国大学生数据挖掘邀请赛
通知:首届全国大学生数据挖掘邀请赛
邱怡轩
/
2011-03-20
[…] Amazon 的数百万图书,Netflix 的 10 万部电影,淘宝的 8 亿件在线商品,以及数以亿万计用户的资料和行为记录…… 互联网最近十年的迅猛发展伴随着海量数据的积累。然而,在线用户常常面对过多的选择而显得无所适从。心理学研究证实,这类情境下的用户有时会做出放弃交易的决定,从而造成大量潜在的用户流失。针对这一现象,统计技术的发展能够为在线服务商提供更有效的推荐算法,在帮助用户走出信……
统计应用
统计词话(一)
统计词话(一)
邱怡轩
/
2011-03-04
不知道这个标题是否有足够的吸引力把你骗进来。如果你认为统计是一个到处充满了期望方差分布回归随机多元和概率的东西,那么…… 你可能是对的,不过本文想要告诉你的是,你其实还可以用统计来做一些你关心的事情,比如现在,我们既谈风月,也谈统计。:D 相信大家对宋词都不会陌生。无论你是否喜欢,总还是可以吟诵出几句名篇来的。如果你经常找一些宋词来读的话,你可能会发现一个有趣的现象,那就是有些词语或意象似乎特别受到……
R 语言
用 R 也能做精算——actuar 包学习笔记(三)
用 R 也能做精算——actuar 包学习笔记(三)
李皞
/
2011-02-13
时隔半年,终于隆重推出了最终版~ 本次包括以下重要更新: […] 增加了(五) 保单组合的模拟 和 (六) 信度理论 的有关内容。 […] 在(四)风险理论一节增加了 VaR 和 TVaR 的介绍。 […] 全文重新用 LaTeX 排版,版式更精美。 […] 修改了前面文章中的一些错误。 […] 感兴趣的读者可以下载文章的 pdf 版本:用 R ……
统计模型
从线性模型到广义线性模型 (2)——参数估计、假设检验
从线性模型到广义线性模型 (2)——参数估计、假设检验
张缔香
/
2011-01-31
为了理论上简化,这里把 GLM 的分布限定在指数分布族。事实上,实际应用中使用最多的分布就是指数分布族,所以这样的简化可以节省很多理论上的冗长论述,也不会限制实际应用。 如前文如述,指数分布族的概率密度函数可以统一地写为: $$ f_Y(y;\theta,\Psi)=exp[(y\theta – b(\theta))/{\Psi} + c(y;\Psi)] $$ 这里为了在模型中体现散布参……
统计模型
一道抛硬币问题的不同解法和比较
一道抛硬币问题的不同解法和比较
魏太云
/
2011-01-22
[…] 本文针对求指定花样在抛硬币时首次出现时间期望的问题,分别从统计模拟、马氏过程、延迟更新过程、鞅、随机图等不同角度出发对该类问题进行了模拟和理论方面的解答,并展现了各种方法的特点和实用价值。 PDF 全文下载: 本文 PDF 文档
统计模型
从线性模型到广义线性模型(1)——模型假设篇
从线性模型到广义线性模型(1)——模型假设篇
张缔香
/
2011-01-18
在统计学里,对特定变量之间的关系进行建模、分析最常用的手段之一就是回归分析。回归分析的输出变量通常记做 \(Y\),也称为因变量 (dependent)、响应变量 (response)、被解释变量 (explained)、被预测变量 (predicted)、从属变量 (regressand);输入变量通常记做 \( x_1\),…,\(x_p\),也称为自变量 (independent)、控制变……
职业事业
统计学论文的发表流程、及统计学家的晋升和合作(内幕)
统计学论文的发表流程、及统计学家的晋升和合作(内幕)
谢益辉
/
2011-01-15
这标题很吸引人,所有统计学相关领域的人可能都关心这几件事,但敬请降低对本文的期望。我不能再多说,否则要剧透了(看过的朋友也请不要剧透)。这段 35 分钟的视频讲述了统计学论文是如何发表的、统计学家在机构内如何得到晋升(影响晋升的指标),以及统计学家和生物学家如何交流和合作的种种 “内幕”。新年伊始,我们也不想用大篇技术文章来“折磨” 统计之都的读者们,那么,开始欣赏这部小电影吧: […] 本……
统计应用
R 软件在精算教学中的应用案例
R 软件在精算教学中的应用案例
张缔香
/
2011-01-12
本文作者为张缔香,文章由 COS 编辑部审核发表,略有修改。点击此处下载 / 阅读本文 PDF 版本 R 软件做为一种统计软件,因其开源、免费、灵活的诸多优点得到越来越多的关注,无论网络上还是实体书店,关于 R 的教程铺天盖地,不甚枚举。因此,本文的目标不是做 R 的教程,而是将 R 和保险、精算教学结合起来,通过几个案例来说明 R 在保险、精算专业日常的教学和研究中可用之处。 作者在保险、精算的理论、专业知识方面水平有限,也……
统计计算
Sweave 后传:统计报告中的大规模计算与缓存
Sweave 后传:统计报告中的大规模计算与缓存
谢益辉
/
2011-01-03
学无止境。我曾以为我明白了如何在 Sweave 中使用缓存加快计算和图形,但后来发现我并没有真的理解,直到读了另外一些手册才明白,因此本文作为前文 “Sweave:打造一个可重复的统计研究流程” 之续集,向大家介绍一下如何在 Sweave 的计算和图形中使用缓存,以节省不必要的重复计算和作图,让那些涉及到密集型计算的用户不再对 Sweave 感到难堪。 如果你还没读前文,建议先从那里开始读,了解 Sweave 与“可……
««
«
39
40
41
42
43
»
»»