机器学习基础:用 Lasso 做特征选择

大家入门机器学习第一个接触的模型应该是简单线性回归,但是在学Lasso时往往一带而过。其实 Lasso 回归也是机器学习模型中的常青树,在工业界应用十分广泛。在很多项目,尤其是特征选择中都会见到他的影子。 Lasso 给简单线性回归加了 L1 正则化,可以将不重要变量的系数收缩到 0 ,从而实现了特征选择。本文重点也是在讲解其原理后演示如何用其进行特征选择,希望大家能收获一点新...

深度学习从理论到实践—logistic 回归(1)

一直以来想做一系列关于深度学习的分享,由于之前工作节奏紧张,属于个人时间比较少,再加上自己对深度学习认识有限,所以分享的内容相对比较零散,且内容也没有经过推敲,所以分享内容质量普遍一般。这一次借着《掘金技术社区签约计划第二期》东风,自己也想好好写几篇文章从而检验一下最近自己在写作上、表达上是否有所进步 今天将会聊点什么呢? 关于今天想要聊的,都一一这里列出 Logistic ...

【R语言数据科学】:机器学习常见评估指标

【R语言数据科学】:机器学习评估指标 🌸个人主页:JoJo的数据分析历险记📝个人介绍:小编大四统计在读,目前保研到统计学top3高校继续攻读统计研究生💌如果文章对你有帮助,欢迎✌关注、👍点赞、✌收藏、👍订阅专栏✨本文收...

【AI资讯月刊】350+资源大盘点!6月不容错过的资料和动态,都都都在这里啦!\u003C附下载\u003E

ShowMeAI 出品的『资讯日报』专栏,汇集了每日 AI 资讯,为从业者传送最值得关注的AI 动态,为学习者梳理最值得收藏的宝藏资料! 本篇为专栏的 6 月合辑,对 6 月份发布的 30 篇日报内容,进行了整合与分类,将350+学习资源 结构化得整理成了这本电子月刊(排版超美)! 本月电子刊包括工具库、模型框架、项目代码、算法实现、学习路线图、求职面试、 数据集、书籍、课程等...

【机器学习】K-means聚类分析

前言 聚类问题是无监督学习的问题,算法思想就是物以类聚,人以群分,聚类算法感知样本间的相似度,进行类别归纳,对新输入进行输出预测,输出变量取有限个离散值。本次我们使用两种方法对鸢尾花数据进行聚类。 无监督就是没有标签的进行分类 K-means 聚类算法 K-means聚类算法(k-均值或k-平均)聚类算法。算法思想就是首先随机确定k个中心点作为聚类中心,然后把每个数据点分配...

人工智能 | ShowMeAI资讯日报 #2022.06.30

1.工具&框架 工具框架:flair - 集成最先进NLP技术的简单框架(Python)tags: [NLP技术,NLP应用] ‘flair - A very simple framework for state-of-the-art NLP’ by Zalando Research GitHub: https://github.com/flairNLP/flair ...

云音乐FeatureStore建设与实践

从ML-Ops到Feature-Ops标准的机器学习系统由数据、模型、代码三个部分组织而成,其分别对应着特征工程、模型训练、模型部署三个阶段。他们彼此关联和依赖,并在各自的阶段承担着重要的职责和功能,以完成整个机器学习过程的使命。 随着AI应用的快速发展,并在人脸识别、广告、搜索、个性化推荐等领域有了大规模应用后,人们开始重视AI系统能力的基础建设。各大云平台厂商陆续推出了一...

OneFlow源码解析:算子签名的自动推断

撰文 | 郑建华 OneFlow是一个原生支持分布式训练的、高性能的深度学习框架。最近读了一些OneFlow的源码、架构设计和代码实现的文章,简单梳理一下自己的理解。主要通过图形展示调用过程和类之间的关系,只对部分重要的代码作一下分析。 深度学习框架是一个复杂的系统,而用户使用最多的就是算子(op)。...