FeatureEngineering04
我们在本课程中看到的大多数技术都是针对数值特征的。而我们将在本课中看到的技术,target encoding,则是针对分类特征的。它是一种将类别编码为数字的方法,类似于独热编码或标签编码,区别在于它还使用 target 来创建编码。这使它成为我们所称的监督特征工程(supervised feature engineering)技术。 目标编码(target encoding)目标编码是任何一种用从目标派生的某个数字替换特征类别的编码。 一个简单有效的版本是应用第3课中的分组聚合,如均值。使用 Automobiles 数据集,它计算每种车辆品牌的平均价格: 1234# 每个品牌的所有车型都会被替换为该品牌所有车型的平均价格autos["make_encoded"] = autos.groupby("make")["price"].transform("mean")autos[["make", "price",...
FeatureEngineering03
主成分分析(Principal Component Analysis)在前一课中,我们了解了特征工程的第一个基于模型的方法:聚类。在本课中,我们将学习下一个方法:主成分分析(PCA)。就像聚类是基于接近度对数据集进行划分一样,PCA可以被视为对数据变异性的划分。PCA是探索数据中重要关系并创建更具信息量特征的有效工具。 ...
FeatureEngineering01
特征工程入门在本课程中,您将学习构建优秀机器学习模型过程中最重要的步骤之一:特征工程。您将学习如何: 通过 mutual information(互信息)确定哪些特征最重要 创建新特征 使用 target encoding(目标编码)编码高基数类别变量 使用 k-means clustering(k均值聚类)创建分割特征 使用 principal component analysis(主成分分析)将数据集的变异分解为特征 实践练习将逐步引导您完成一个完整的 notebook,应用所有这些技术参加 House Prices Getting Started...
MysqlTutorial04
事务事务的概念及性质引入 事务性质(ACID)事务看起来感觉简单,但是要实现事务必须要遵守4个特性,分别如下: 原子性(Atomicity):一个事务中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节,而且事务在执行过程中发生错误,会被回滚到事务开始前的状态,就像这个事务从来没有执行过一样,就好比买一件商品,购买成功时,则给商家付了钱,商品到手;购买失败时,则商品在商家手中,消费者的钱也没花出去。 一致性(Consistency):是指事务操作前和操作后,数据满足完整性约束,数据库保持一致性状态。比如,用户 A和用户 B在银行分别有 800 元和 600 元,总共 1400 元,用户 A给用户 B转账 200 元分为两个步骤,从 A的账户扣除 200 元和对 B的账户增加 200 元。一致性就是要求上述步骤操作后最后的结果是用户 A 还有 600 元,用户 B有 800 元,总共 1400 元,而不会出现用户 A 扣除了 200元,但用户B未增加的情况(该情况,用户A和B均为 600 元,总共 1200...
MysqlTutorial02
索引1. 索引数据结构什么是索引?为什么索引能加快查询?索引是数据库中一种特殊的数据结构,它像书籍的目录一样,能帮助数据库系统快速定位和访问数据。索引能加快查询的原因在于: 减少数据访问量:通过索引,数据库只需要访问包含目标数据的部分,而不是扫描整个表。 有序存储:索引中的数据是按照特定顺序存储的,使得搜索、排序和分组操作更高效。 快速定位:使用树形结构等高效的数据结构,可以在大量数据中快速定位目标记录。 没有索引时,数据库需要进行全表扫描,时间复杂度为O(n);而使用索引后,查询时间复杂度可降至O(log n)。 B+ 树和(B 树和红黑树)有什么区别?为什么选择用 B+...
MysqlTutorial01
MySQL数据库基础培训:逻辑架构与InnoDB引擎1. MySQL基础概念1.1 什么是MySQLMySQL是全球最受欢迎的开源关系型数据库管理系统之一,由瑞典MySQL AB公司开发,现在属于Oracle公司。MySQL具有以下特点: 开源性:遵循GPL协议,可自由使用和修改 跨平台性:支持Windows、Linux、macOS等多种操作系统 可靠性:广泛应用于各类网站、应用程序和商业产品 性能:针对不同需求可以通过配置进行优化 MySQL广泛应用于网站开发、企业应用、数据仓库等场景,是互联网行业的基础设施之一。 1.2...
GameTheroy
博弈论与极大极小定理 笔记 1. 课程概述本课程探讨了博弈论在计算机科学中的应用,重点包括: 零和博弈与极小极大最优策略 随机算法与博弈论的联系 一般和博弈及纳什均衡 2. 博弈论基础博弈的定义 玩家(Players):参与者 策略(Actions):玩家可以采取的决策 收益(Payoff):由玩家的联合决策决定 3. 经典零和博弈:射手-守门员博弈设定 玩家:射手(Shooter) vs. 守门员(Goalie) 动作:左(L)或右(R) 规则: 若射手和守门员选择相同方向,守门员成功扑救 否则,射手得分 收益矩阵 守门员扑救:(+1, -1) 射手进球:(-1, +1) 这是一个零和博弈,满足 r+c=0 行矩阵/列矩阵 4. 纯策略 vs. 混合策略 纯策略:玩家每次都选择固定动作 混合策略:玩家按一定概率分配动作选择 收益计算 若两个玩家独立随机选择策略,预期收益计算为: $$E[payoff]=∑piqjR(i,j)E[\text{payoff}] = \sum p_i q_j...
MCUTuTorial01
P2 命名规则 40正极,20接地。P0到3,镜像Z形。左侧上下,右侧外里。9脚复位,P0上拉。31引脚,电平决定,接高访内,接低访外。 P4–点亮一个LED灯 1)通过PCB原理图可以知道控制LED灯亮灭的是P2口的,并且接入+VCC5V即高电平1,LED灯要那个亮的话那个线,P2端要设置为0,不亮就设置为1,有电势差,即有电流流过灯亮; 2)P2=1111 1110,即第一个灯亮其他灯不亮,但是我们读取是从下面的,所有不是(P2=0111 1111)这样写; 3)用到P2口,所有要导入头文件#….鼠标右键点击就可以加进来; 4)不能识别 P2=1111 1110这样的类型,所有将它转为16进制,开头用0x表示16进制的数 P2=0xFE ; //1111 1110 转换可以网上搜索,计算器也可以直接算; 5)一个亮一个灭P2=0x55; //0101 ...



