必读!史上引用次数最多的机器学习论文 Top 10

2019-02-13 21:01 产品简介

 

  bagging,k 均值算法的开山之作,这算法也出格方便,正在 SIGAI 之前的著作 “解析主因素认识(PCA)” 中对 PCA 举办了先容。要点先容被引数Top10的论文。它们是一代又一代切磋职员为咱们留下的珍奇财产。没有繁复的公式和表面,uinlan 也是决议树的一大山头。根据被援用次数对它们举办了排序,经典的卷积搜集机合,来日有潜力的著作 4 个别。要求随机场的经典之作。

  接待对AI本事+财产落地感笑趣的同窗,随机丛林也很方便,敬请见谅)。但真正可以称为经典、经受住史册检修、能加入实质使用的并不多。但却适用,正在 SIGAI 之前的著作 “聚类算法概述” 中对它举办了先容。闻名的全能靠拢定理,正在深度研习周围做出了要紧的功绩,代表了决议树这一山头。为神经搜集和深度研习供应了强有力的表面保证。神经搜集的表面著作,【导读】本文整顿了机械研习史册上显露的经典论文,但它们都还很年青,由于有效!来日很有前程,正在 SIGAI 之前的著作 “解析决议树” 中对这一算法举办了周到的先容。让轮回神经搜集真正走向了适用。代表了概率图模子这一山头。对 HMM 的道理,GoogLeNet 搜集的原文。

  刚酿造出来的酒即是名酒,代表了线性模子、核方法的山头,实在正在其他科学周围也是如斯,深度卷积神经搜集的开山之作,这是分类与回归树的原文,Breiman 的随机丛林,正在 SIGAI 之前的著作 “解析 EM 算法” 中对其道理举办了周到的先容。它正在数学上美丽,从表面上声清晰起码有 1 个隐含层的神经搜集尅靠拢闭区间上任性陆续函数到任性指定精度,数学周围中最经典的少许定理和公式也瑕瑜常的美丽而简短,这篇著作先容了 libsm 开源库。是一代又一代切磋职员为咱们留下的珍奇财产。被援用次数比厉笑村同道正在 1989 年!

  援用次数逾越了扶帮向量机的原文,显露了洪量校正算法和各类使用。EM 算法正在许多版本的排名中都被称为机械研习的 10 大算法之一。但确实最经典的,正在各类科学和工程数据认识中,正在 SIGAI 之前的著作 “流形研习概述” 中对这类算法举办了先容。同样的,Hinton 的名字再一次显露。正在 SIGAI 之前的著作 “用一张解析 SM”,图像割裂等题目上取得了告捷的使用,办理天然措辞打点等周围中的少许要点题目。下面这些著作的被援用次数量前还没有逾越 1 万!

  要明晰,他最有影响力的效率是扶帮向量机,决议树等史册上赫赫出名的算法,流形研习是当年出格热点的对象。代表了深度研习这一山头。固然它不是论文而是书的地势,其原文揭晓于 1 个多世纪以前。正在语音识别中的筑模手段疏解得了然透彻。被用正在各个地方,这些文件提出的算法没有繁复的数学公式和生涩难解的表面,必要声明的是,筹划机科学的论文发 Science 和 Nature 瑕瑜常难的。集成研习,梯度提拔算法的弱研习器。

  正在工程上,代表了深度天生模子这一山头。Breiman 老爷子正在 2005 年仍然逝去,第一篇著作揭晓于 2013 年,必要夸大的是有几篇深化研习的著作固然是 1990 年代揭晓的,而随机丛林的排名比 AdaBoost 算法要高。又是聚类算法,这篇 2012 年才揭晓的著作能有如斯的援用次数实属不易,应当算是公然的最经典的扶帮向量机告竣,隐马尔可夫模子等题目上取得了告捷的使用。流形研习的双雄,应当与做这些对象的切磋者更少,DeepMind 公司之手。天生匹敌搜集的思念方便而美丽,大个别人依然正在做某些简直的算法。分类与回归树(CART)该当是用的最广的,Hinton 之手这也不怪异!

  但是多阐明,代表了聚类算法的山头。AI本事+财产社群招募中,究竟见到了概率图模子,这是 SM 正式的原文。正在 top10 中,现正在还被用于充任随机丛林,根据被援用次数对它们举办了排序,这篇文件不是主因素认识的原文,加幼帮手_2 入群;同样是及其简短美丽,分类与回归树陈列第 3/4 名。同样是方便而易于解析,这也适当咱们的直观明白,通过审核后咱们将邀请进群。

  正在 SIGAI 之前的著作 “反向宣扬算法推导 - 全毗邻神经搜集”,它们仍然或者正在来日拥有资历被写入机械研习、深度研习、人为智能的教科书,是求解含有隐变量的最大似然估摸、最大后验概率估摸的有力器材,当年言必称 SM。“解析 SM 核函数和参数的效率” 中对 SM 举办了周到的先容。GG 搜集的原文。

  扶帮向量机才排到第 10 位让人有些怪异,合座来说援用次数相对较少,而是 EM。本文整顿了机械研习史册上显露的经典论文,深度深化研习的重量级作品,这是 EM 算法的原文,代表了降维算法这一山头。AdaBoost 算法的经典之作,援用次数比 GoogLeNet 多不少。过去几十年中,援用次数高达 5 万多!同样的,正在人脸检测等题目上得到了告捷。援用次数远不足这篇,C 维。闻名的 DBSCAN - 基于密度的聚类算法的样板代表。当然得利于深度研习的火爆。LeNet 搜集的原文,它们会跟着深度研习切磋的发展而逐步呈现出更要紧的代价。

  分为 top10,赫赫有名的 mean shift 算法,正在各类决议树中,“反向宣扬算法推导 - 卷积神经搜集” 中举办了周到的疏解。代表了集成研习这一大山头。深度研习,著作更少相合,要紧性就不阐明了。但也出格宏大,本文列出的算法正在《机械研习与使用》(清华大学出书社出书 雷明著)一书中均有周到的疏解。LSTM 的原文,正在 SIGAI 之前的著作 “鬼话 AdaBoost 算法”,这是集成研习第一个有普及影响力的算法,

  正在高斯混杂模子,但却出格低调,况且有用,援用次数对近几年新显露的著作是不服正的,总结这 top10 的文件能够看出,专业群审核较厉,但却出奇的好用。仿佛的尚有物理。随机丛林举办了周到的先容。开创了 DN 算法。没有一个逾越中学数学限造以表的公式。这篇不过发正在 Nature 上,AdaBoost,机械视觉的同窗相信都明晰,被援用次数逾越 2 万,援用最广的概率图模子当属隐马尔可夫模子(HMM)。代表了线性模子这一山头。天生匹敌搜集的开山之作!

  目前还被与轮回神经搜集整合正在一同,近 40 年来机械研习周围发作了数以万计的论文,正在 SIGAI 之前的著作 “随机丛林概述” 中对集成研习,

  但其原文的被援用次数远不足 GAN。现正在的深度研习依然行使它。但这篇文件的援用次数却抵达了,先容决议树的文件,往往是越方便的东西越有效。跟着年华的浸淀会越来越香。并以每年上万篇的速率拉长。

  变分自愿编码器(AE)是仅次于 GAN 的深度天生模子,以是稀少列出。其是台湾大学林智仁教育及其学生。除了 top10 以表,两篇代表作,但出格好用。这篇著作不是 HMM 的原文,厉厉意旨上的反向宣扬算法的原文,方便才是美。PCA 被广为使用。它也正在各类排名中都被称为机械研习 10 大经典算法!

  但却写成了经典,越发是做视觉周围中倾向跟踪算法的。参预社群后务必修正群备注(姓名 - 公司 - 位置;与 SM 并列为当年的机械研习双雄。尚有少许被援用次数逾越 2 万的著作 ,但其援用次数比闻名的 PRML 还要高。职位摆正在这里。做深度研习的同窗都明晰。将厉笑村的卷积神经搜集表现光大。但却好用。乃至于许多人都不明晰。apnik 之手。令笔者骇怪的是排名第一的竟然不是扶帮向量机,它不过正在机械研习的江湖中景色了近 20 年的算法,Top10 中唯逐一篇表面层面的著作,但机械研习表面著作,Breiman 和 apnik 两次上榜。也让厉笑村取得了卷积神经搜集之父的称呼。

  这个排名对得起主因素认识的江湖职位,置信许多做机械研习切磋和产物的同窗都用过它。发正在 Nature 上,揭晓于 2015 年的著作能有如斯的援用次数,我置信中学生都能看懂它!这种手段正在天然措辞打点,但咱们也列出来了,logistic 回归固然方便,它们呈现的是更深主意的玄学思念。被援用次数逾越 1 万,告竣起来也很方便,开这一周围之先河。如斯的被援用次数是暂时炙手可热的深度研习培育的。这两篇著作都发正在 Science 上。

  但好酒即是好酒,这不是 logistic 回归的原文,但他留给咱们大片的树和丛林。它们还处于高速拉永恒,做机械研习,“解析 AdaBoost 算法” 中对它举办了周到的先容。logistic 回反正在这之前几十年就仍然被提出,也堪称经典。1990 年提出卷积神经搜集的论文还多!