#
王胜鹏
10
30
机器学习(八) 机器学习(八)
提升方法 笔记摘要 在PAC(概率近似正确(PAC, Probably approximately correct))学习框架下,一个概念是强可学习的充分必要条件是这个概念是弱可学习的。 提升方法的两个问题 在每一轮如何改变训练数据的
2021-10-30
30
机器学习(七) 机器学习(七)
支持向量机 笔记摘要 SVM的基本模型是定义在特征空间上的间隔最大的线性分类器 线性可分支持向量机和线性支持向量机假设输入空间和特征空间的元素一一对应,并将输入空间中的输入映射为特征空间的特征向量;非线性支持向量机利用一个从输入空间到特征
2021-10-30
30
机器学习(六) 机器学习(六)
逻辑斯谛回归与最大熵模型 logistic regression是统计学习中的经典分类方法。最大熵是概率模型学习的一个准则,推广到分类问题得到最大熵模型(maxium entropy model) 这两种模型都属于对数线性模型 逻辑斯谛
2021-10-30
30
机器学习(五) 机器学习(五)
决策树 笔记摘要 决策树可以认为是if-then规则的集合,也可以认为是定义在特征空间上的条件概率分布 根据损失函数最小化的原则建立决策树模型 决策树的路径或其对应的if-then规则集合具有一个重要性质:互斥且完备 决策树的学习算法包含
2021-10-30
30
机器学习(四) 机器学习(四)
朴素贝叶斯法 笔记摘要 条件概率分布P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣Y=ck​)有指数级数量的参数,其实际估计是不可行的 指数级数量的参数 K∏j=1nSjK\prod_{j=1}^nS_jK∏j=1
2021-10-30
30
机器学习(三) 机器学习(三)
k近邻法 k值的选择、距离度量及分类决策规则是k近邻法的三要素 三要素在算法之中完整体现出来: 算法 输入: T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈X⊆Rn,yi∈Y={c1,c2,…,ck}T=\{(x_
2021-10-30
30
机器学习(二) 机器学习(二)
感知机 学习笔记 感知机是二类分类的线性模型,属于判别模型 感知机学习旨在求出将训练数据进行线性划分的分离超平面。是神经网络和支持向量机的基础 损失函数选择 损失函数的一个自然选择是误分类点的总数,但是,这样的损失函数不是参数
2021-10-30
29
29
pandas教程 pandas教程
import numpy as np import pandas as pd 生成对象 Series:维度——1;带标签的一维同构数组 DataFrame:维度——2;带标签的,大小可变的,二维异构表格 s = pd.Series([
2021-10-29
29
机器学习(一) 机器学习(一)
简要 统计学习或机器学习一般包括监督学习、无监督学习、强化学习,有时还包括半监督学习、主动学习 监督学习 监督学习指从标注数据中学习预测模型的机器学习问题,其本质是学习输入到输出的映射的统计规律。 输入变量XXX和输出变量YYY有不同
2021-10-29
1 / 2