机器学习线性模型训练：线性回归和逻辑回归

由于高等数学底子太差的原因，机器学习无法深入学习下去，只能做一个简单的尝试者，甚至连调优也未必能算的上，不过这样也好，可以把重心放到对业务的理解上，以及业务和模型的选择上。

线性模型包括了传统的线性回归、岭回归、Lasso回归，主要用于连续值的预测；逻辑回归虽然也是回归，但却是一种分类方法；LDA线性判别分析，则是一种降维方法；多项式回归，是使用线性模型训练数据的非线性函数。

总的来说，尝试着回顾一下，也挺有意思的。

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets,linear_model,discriminant_analysis,model_selection,preprocessing
from sklearn.pipeline import make_pipeline,Pipeline

def load_data():
    diabetes=datasets.load_diabetes()
    # datasets.load_diabetes()定义
    # C:\Python\Python37\Lib\site-packages\sklearn\datasets\_base.py
    #     return Bunch(data=data, target=target, DESCR=fdescr,
    #                  feature_names=['age', 'sex', 'bmi', 'bp',
    #                                 's1', 's2', 's3', 's4', 's5', 's6'],
    #                  data_filename=data_filename,
    #                  target_filename=target_filename)
    # print(diabetes)
    # 得到一个字典
    # print(diabetes.keys())
    #dict_keys(['data', 'target', 'DESCR', 'feature_names', 'data_filename', 'target_filename'])
    # print(diabetes['data'].shape)
    # (442, 10)
    # print(diabetes['target'])
    # print(diabetes['target'].shape)
    # (442, )
    # print(diabetes['feature_names'])
    # ['age', 'sex', 'bmi', 'bp', 's1', 's2', 's3', 's4', 's5', 's6']
    # print(diabetes['data_filename'])
    # C:\Python\Python37\lib\site-packages\sklearn\datasets\data\diabetes_data.csv.gz
    # 压缩包中有个X.csv文件，数据格式如下
    # 3.81E-02 5.07E-02   6.17E-02   2.19E-02   -4.42E-02  -3.48E-02  -4.34E-02  -2.59E-03  1.99E-02   -1.76E-02
    # -1.88E-03    -4.46E-02  -5.15E-02  -2.63E-02  -8.45E-03  -1.92E-02  7.44E-02   -3.95E-02  -6.83E-02  -9.22E-02
    # 8.53E-02 5.07E-02   4.45E-02   -5.67E-03  -4.56E-02  -3.42E-02  -3.24E-02  -2.59E-03  2.86E-03   -2.59E-02
    # print(diabetes['target_filename'])
    # C:\Python\Python37\lib\site-packages\sklearn\datasets\data\diabetes_target.csv.gz
    # 压缩包中有个y.csv文件，数据格式如下
    # 1.51E+02
    # 7.50E+01
    # 1.41E+02
return model_selection.train_test_split(diabetes.data,diabetes.target,
                                              test_size=0.25,random_state=)
# 线性回归
def test_LinearRegression(*data):
    X_train, X_test, y_train, y_test = data
    # 线性回归模型-最小二乘法线性回归：
    # sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False,copy_X=True, n_jobs=1)
    # 主要参数说明：
    # fit_intercept：表示是否计算截距,布尔型，默认为True，
    #   若参数值为True时，代表训练模型需要加一个截距项；
    #   若参数为False时，代表模型无需加截距项。
    # normalize：布尔型，默认为False，若fit_intercept参数设置False时，normalize参数无需设置；
    #   若normalize设置为True时，则输入的样本数据将( X - X均值) / | | X | |；
    #   若设置normalize = False时，在训练模型前， 可以使用sklearn.preprocessing.StandardScaler进行标准化处理。
    # copy_X,如果为True，则复制X
    # n_jobs，并行任务时指定的CPU数量
    # 属性：
    # coef_：回归系数(斜率)
    # intercept_：截距项
    # 主要方法：
    # fit(X, y, sample_weight=None) 训练模型
    # predict(X)    用模型进行预测
    # score(X, y, sample_weight=None)，返回预测得分
    #   其结果等于1 - (((y_true - y_pred) ** 2).sum() / ((y_true - y_true.mean()) ** 2).sum())
    #   score在-1范围内，越大预测性能越好
    regr=linear_model.LinearRegression()
    regr.fit(X_train,y_train)

    coef=regr.coef_
    intercept=regr.intercept_
    trainscore=regr.score(X_train,y_train)
    testscore=regr.score(X_test,y_test)
    trainpredict=regr.predict(X_train)
    testpredict=regr.predict(X_test)
    meansquareerror=np.mean((regr.predict(X_test)-y_test)**2)
    equalscore=np.mean(regr.predict(X_test)==y_test)

    #print('Coefficients={},intercept={}'.format(coef,intercept))
    ## Coefficients=[ -43.26774487 -208.67053951  593.39797213  302.89814903 -560.27689824   261.47657106   -8.83343952  135.93715156  703.22658427   28.34844354]
    ## intercept=153.06798218266258
    #print('Residual sum of squares={}'.format(meansquareerror))
    ## Residual sum of squares=3180.1988368427274
    #print('trainscore={}'.format(trainscore))
    ## trainscore=0.555437148935302
    #print('testscore={}'.format(testscore))
    ## testscore=0.35940090989715534
    #print('equalscore={:.2f}'.format(equalscore))
    ## standardscore=0.00
    #print('trainpredict={}'.format(trainpredict))
    #print('testpredict={}'.format(testpredict))
# 岭回归
def test_Ridge_Regression(*data):
    # lasso回归也是一种正则化的线性回归，且也是约束系数使其接近于，
    # 不过其用到的方法不同，岭回归用到的是L2正则化，
    # 而lasso回归用到的是L1正则化（L1是通过稀疏参数（减少参数的数量）来降低复杂度，即L1正则化使参数为零，L2是通过减小参数值的大小来降低复杂度，
    # Parameters
    #        alpha:正则化系数，较大的值指定更强的正则化。
    #        fit_intercept:是否计算模型的截距，默认为True，计算截距
    #        normalize:在需要计算截距时，如果值为True，则变量x在进行回归之前先进行归一化（）,如果需要进行标准化则normalize=False。若不计算截距，则忽略此参数。
    #        copy_X:默认为True，将复制X；否则，X可能在计算中被覆盖。
    #        max_iter:共轭梯度求解器的最大迭代次数。对于sparse_cg和lsqr,默认值由scipy.sparse.linalg确定。对于sag求解器，默认值为1000.
    #        tol:float类型，指定计算精度。
    #        solver：求解器{auto,svd,cholesky,lsqr,sparse_cg,sag,saga}
    #                aotu:根据数据类型自动选择求解器
    #                svd:使用X的奇异值分解计算岭系数。奇异矩阵比cholesky更稳定
    #                cholesky:使用标准的scipy.linalg.solve函数获得收敛的系数
    #                sparsr_cg:使用scipy.sparse.linalg.cg中的共轭梯度求解器。作为一种迭代算法，这个求解器比cholesky更适合大规模数据（设置tol和max_iter的可能性）
    #                lsqr:使用专用的正则化最小二乘方法scipy.sparse.linalg.lsqr。
    #                sag:使用随机平均梯度下降，saga使用其改进的，无偏见的版本，两种方法都使用迭代过程。
    #        random_state:随机数生成器的种子。
    # Attributes
    #        coef_:返回模型的估计系数。
    #        intercept_:线性模型的独立项，一维情形下的截距。
    #        n_iter:实际迭代次数。
    # Methods
    #        fit(X,y):使用数据训练模型
    #        get_params([deep=True]):返回函数LinearRegression()内部的参数值
    #        predict(X):使用模型做预测
    #        score(X，y):返回模型的拟合优度判定系数
    #        为回归平方和与总离差平方和的比值，介于-1之间，越接近1模型的拟合效果越显著。
    X_train, X_test, y_train, y_test = data
    regr = linear_model.Ridge()
    regr.fit(X_train,y_train)
    coef = regr.coef_
    intercept = regr.intercept_
    trainscore = regr.score(X_train, y_train)
    testscore = regr.score(X_test, y_test)
    trainpredict = regr.predict(X_train)
    testpredict = regr.predict(X_test)
    meansquareerror = np.mean((regr.predict(X_test) - y_test) ** 2)
    equalscore = np.mean(regr.predict(X_test) == y_test)
    # print('Coefficients={},intercept={}'.format(coef,intercept))
    # # Coefficients=[  21.19927911  -60.47711393  302.87575204  179.41206395    8.90911449  -28.8080548  -149.30722541  112.67185758  250.53760873   99.57749017],intercept=152.4477761489962
    # # intercept=3192.3285539937624
    # print('Residual sum of squares={}'.format(meansquareerror))
    # # Residual sum of squares=3192.3285539937624
    # print('trainscore={}'.format(trainscore))
    # # trainscore=0.4625439622495925
    # print('testscore={}'.format(testscore))
    # # testscore=0.35695757658096805
    # print('equalscore={:.2f}'.format(equalscore))
    # # standardscore=0.00
    # print('trainpredict={}'.format(trainpredict))
    # print('testpredict={}'.format(testpredict))
def test_Ridge_alpha(*data):
    X_train, X_test, y_train, y_test = data
    alphas=[0.01,0.02,0.05,0.1,0.2,0.5,1,2,5,10,20,50,100,200,500,1000]
    scores=[]
for i,alpha in enumerate(alphas):
        regr=linear_model.Ridge(alpha=alpha)
        regr.fit(X_train,y_train)
        scores.append(regr.score(X_test,y_test))

    fig=plt.figure()
    ax=fig.add_subplot(1,1,1)
    ax.plot(alphas,scores)
    ax.set_xlabel(r'$\alpha$')
    ax.set_ylabel(r'score')
    ax.set_xscale('log')
    ax.set_title('Ridge')
plt.show()

# Lasso回归
def test_Lasso_Regression(*data):
    # 岭回归是一种专用于共线性数据分析的有偏估计回归方法，实质上是一种改良的最小二乘估计法，
    # 通过放弃最小二乘法的无偏性，以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法，对病态数据的拟合要强于最小二乘法。
    # Parameters
    #   alpha : float, 可选，默认 1.0。当 alpha 为  时算法等同于普通最小二乘法
    #   fit_intercept : 是否计算模型的截距，默认为True，计算截距
    #   normalize : boolean, 可选, 默认 False;   若 True，则先 normalize 再 regression。若 fit_intercept 为 false 则忽略此参数。
    #   copy_X : 默认为True，将复制X；否则，X可能在计算中被覆盖。
    #   precompute : True | False | array-like, 默认=False
    #   max_iter : int, 可选,最大循环次数。
    #   tol : float, 可选，优化容忍度 The tolerance for the optimization: 若更新后小于 tol，优化代码检查优化的 dual gap 并继续直到小于 tol 为止。
    #   warm_start : bool, 可选。为 True 时, 重复使用上一次学习作为初始化，否则直接清除上次方案。
    #   positive : bool, 可选。设为 True 时，强制使系数为正。
    #   selection : str, 默认 ‘cyclic’
    #       若设为 ‘random’, 每次循环会随机更新参数，而按照默认设置则会依次更新。设为随机通常会极大地加速交点（convergence）的产生，尤其是 tol 比 1e-4 大的情况下。
    #   random_state : int, RandomState instance, 或者 None (默认值)
    # Attributes
    #        coef_:返回模型的估计系数。
    #        intercept_:线性模型的独立项，一维情形下的截距。
    #        n_iter:实际迭代次数。
    # Methods
    #        fit(X,y):使用数据训练模型
    #        get_params([deep=True]):返回函数LinearRegression()内部的参数值
    #        predict(X):使用模型做预测
    #        score(X，y):预测性能得分
    #           为回归平方和与总离差平方和的比值，介于-1之间，越接近1模型的拟合效果越显著。
    X_train, X_test, y_train, y_test = data
    regr = linear_model.Lasso()
    regr.fit(X_train, y_train)
    coef = regr.coef_
    intercept = regr.intercept_
    trainscore = regr.score(X_train, y_train)
    testscore = regr.score(X_test, y_test)
    trainpredict = regr.predict(X_train)
    testpredict = regr.predict(X_test)
    meansquareerror = np.mean((regr.predict(X_test) - y_test) ** 2)
    equalscore = np.mean(regr.predict(X_test) == y_test)
    # print('Coefficients={},intercept={}'.format(coef,intercept))
    # # Coefficients=[  0.          -0.         442.67992538   0.           0.   0.          -0.           0.         330.76014648   0.        ]
    # # intercept=152.52260710501807
    # print('Residual sum of squares={}'.format(meansquareerror))
    # # Residual sum of squares=3583.4215227615487
    # print('trainscore={}'.format(trainscore))
    # # trainscore=0.41412544493966097
    # print('testscore={}'.format(testscore))
    # # testscore=0.27817828862078764
    # print('equalscore={:.2f}'.format(equalscore))
    # # standardscore=0.00
    # print('trainpredict={}'.format(trainpredict))
    # print('testpredict={}'.format(testpredict))
def test_Lasso_alpha(*data):
    X_train, X_test, y_train, y_test = data
    alphas = [0.01, 0.02, 0.05, 0.1, 0.2, 0.5, 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000]
    scores = []
for i, alpha in enumerate(alphas):
        regr = linear_model.Lasso(alpha=alpha)
        regr.fit(X_train, y_train)
        scores.append(regr.score(X_test, y_test))

    fig = plt.figure()
    ax = fig.add_subplot(1, 1, 1)
    ax.plot(alphas, scores)
    ax.set_xlabel(r'$\alpha$')
    ax.set_ylabel(r'score')
    ax.set_xscale('log')
    ax.set_title('Lasso')
plt.show()

# ElasticNet回归
def test_ElasticNet_Regression(*data):
    # ElasticNet回归是对Lasso回归和Ridge回归的融合，利用了L1和L2范数的融合，所以在参数中除了alpha之外还有L1_ratio 默认alpha=1，l1_ratio=0.5
    # Parameters
    #   alpha: a值。
    #   fit_intercept:一个布尔值，指定是否需要计算b值。如果为False，那么不计算b值（模型会认为你已经将数据中心化了）。
    #   max_iter:整数值，指定最大迭代次数。
    #   normalize：一个布尔值。如果为True，那么训练样本会在回归之前被归一化。
    #   copy_X：一个布尔值，如果为True，则会复制X值
    #   precompute：一个布尔值或者一个序列。他决定是否提前计算Gram矩阵来加速计算。
    #   tol：一个浮点数，指定判断迭代收敛与否的阈值。
    #   warm_start：一个布尔值，如为True，那么使用前一次训练结果继续训练。否则重头开始训练。
    #   positive：一个布尔值，如为Ture，那么强制要求全中响亮的分量都为整数。
    #   selection：一个字符串，可以为‘cyclic’（更新时候，从前向后一次选择权重向量的一个分量来更新）或者‘random'（随机选择权重向量的一个分量来更新），他指定了当每轮迭代的时候，选择权重向量的一个分量来更新
    #   random_state：一个整数或者一个RandomState实例，或者为None。
    # Attributes
    #        coef_:返回模型的估计系数。
    #        intercept_:线性模型的独立项，一维情形下的截距。
    #        n_iter:实际迭代次数。
    # Methods
    #        fit(X,y):使用数据训练模型
    #        get_params([deep=True]):返回函数LinearRegression()内部的参数值
    #        predict(X):使用模型做预测
    #        score(X，y):预测性能得分
    #           为回归平方和与总离差平方和的比值，介于0-1之间，越接近1模型的拟合效果越显著。
    X_train, X_test, y_train, y_test = data
    regr = linear_model.ElasticNet()
    regr.fit(X_train, y_train)
    coef = regr.coef_
    intercept = regr.intercept_
    trainscore = regr.score(X_train, y_train)
    testscore = regr.score(X_test, y_test)
    trainpredict = regr.predict(X_train)
    testpredict = regr.predict(X_test)
    meansquareerror = np.mean((regr.predict(X_test) - y_test) ** 2)
    equalscore = np.mean(regr.predict(X_test) == y_test)
    # print('Coefficients={},intercept={}'.format(coef,intercept))
    # # Coefficients=[ 0.40560736  0.          3.76542456  2.38531508  0.58677945  0.22891647  -2.15858149  2.33867566  3.49846121  1.98299707],intercept=151.92763641451165
    # # intercept=151.92763641451165
    # print('Residual sum of squares={}'.format(meansquareerror))
    # # Residual sum of squares=4922.355075721768
    # print('trainscore={}'.format(trainscore))
    # # trainscore=0.010304451830727368
    # print('testscore={}'.format(testscore))
    # # testscore=0.008472003027015784
    # print('equalscore={:.2f}'.format(equalscore))
    # # standardscore=0.00
    # print('trainpredict={}'.format(trainpredict))
    # print('testpredict={}'.format(testpredict))
def test_ElasticNet_alpha_rho(*data):
    X_train, X_test, y_train, y_test = data
    alphas = np.logspace(-2,2)  #log分布间距生成list
    rhos=np.linspace(0.01,1)     #取线性，均匀返回五是个值
    scores = []
    for alpha in alphas:
        for rho in rhos:
            regr = linear_model.ElasticNet(alpha=alpha,l1_ratio=rho)
            regr.fit(X_train, y_train)
            scores.append(regr.score(X_test, y_test))

    # 绘图
    alphas,rhos=np.meshgrid(alphas,rhos)
    scores=np.array(scores).reshape(alphas.shape)
    from mpl_toolkits.mplot3d import Axes3D
    from matplotlib import cm
    fig = plt.figure(figsize=(10,5))
    ax=Axes3D(fig)
    surf=ax.plot_surface(alphas,rhos,scores,rstride=1,cstride=1,cmap=cm.jet,linewidth=0,antialiased=False)
    fig.colorbar(surf,shrink=0.5,aspect=5)
    ax.set_xlabel(r'$\alpha$')
    ax.set_ylabel(r'$\rho$')
    ax.set_zlabel('score')
    ax.set_title('ElasticNet')
plt.show()

# 加载鸢尾花数据
def load_iris_data():
    iris=datasets.load_iris()
    X_train=iris.data
    y_train=iris.target
    return model_selection.train_test_split(X_train,y_train,test_size=0.25,random_state=0,stratify=y_train)

# 逻辑回归
def test_Logistic_Regression(*data):
    # logistic 回归，虽然名字里有 “回归” 二字，但实际上是解决分类问题的一类线性模型。
    # maximum-entropy classification（MaxEnt，最大熵分类），或 log-linear classifier（对数线性分类器）。
    # 该模型利用函数 logistic function 将单次试验（single trial）的可能结果输出为概率。
    # scikit-learn 中 logistic 回归在 LogisticRegression 类中实现了二分类（binary）、一对多分类（one-vs-rest）及多项式 logistic 回归，并带有可选的 L1 和 L2 正则化。
    # Parameters
    #   penalty='l2' : 字符串‘l1’或‘l2’,默认‘l2’。
    #       用来指定惩罚的基准（正则化参数）。只有‘l2’支持‘newton-cg’、‘sag’和‘lbfgs’这三种算法。
    #       如果选择‘l2’，solver参数可以选择‘liblinear’、‘newton-cg’、‘sag’和‘lbfgs’这四种算法；如果选择‘l1’的话就只能用‘liblinear’算法。
    #   dual=False : 对偶或者原始方法。Dual只适用于正则化相为l2的‘liblinear’的情况，通常样本数大于特征数的情况下，默认为False。
    #   C=1.0 : C为正则化系数λ的倒数，必须为正数，默认为1。和SVM中的C一样，值越小，代表正则化越强。
    #   fit_intercept=True : 是否存在截距，默认存在。
    #   intercept_scaling=1 : 仅在正则化项为‘liblinear’，且fit_intercept设置为True时有用。
    #   solver='liblinear' : solver参数决定了我们对逻辑回归损失函数的优化方法，有四种算法可以选择。
    #       a) liblinear：使用了开源的liblinear库实现，内部使用了坐标轴下降法来迭代优化损失函数。
    #       b) lbfgs：拟牛顿法的一种，利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。
    #       c) newton-cg：也是牛顿法家族的一种，利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。
    #       d) sag：即随机平均梯度下降，是梯度下降法的变种，和普通梯度下降法的区别是每次迭代仅仅用一部分的样本来计算梯度，适合于样本数据多的时候。
    #   multi_class='ovr' : 分类方式。
    #       ovr即one-vs-rest(OvR)，multinomial是many-vs-many(MvM)。
    #       如果是二元逻辑回归，ovr和multinomial并没有任何区别，区别主要在多元逻辑回归上。
    #       ovr不论是几元回归，都当成二元回归来处理。mvm从从多个类中每次选两个类进行二元回归。如果总共有T类，需要T(T-1)/2次分类。
    #       OvR相对简单，但分类效果相对略差（大多数样本分布情况）。而MvM分类相对精确，但是分类速度没有OvR快。
    #       如果选择了ovr，则4种损失函数的优化方法liblinear，newton-cg,lbfgs和sag都可以选择。但是如果选择了multinomial,则只能选择newton-cg, lbfgs和sag了。
    #   class_weight=None : 类型权重参数。用于标示分类模型中各种类型的权重。默认不输入，即所有的分类的权重一样。
    #       选择‘balanced’自动根据y值计算类型权重。
    #       自己设置权重，格式：{class_label: weight}。例如0,1分类的er'yuan二元模型，设置class_weight={:0.9, 1:0.1}，这样类型的权重为90%，而类型1的权重为10%。
    #   random_state=None : 随机数种子，默认为无。仅在正则化优化算法为sag,liblinear时有用。
    #   max_iter=100 : 算法收敛的最大迭代次数。
    #   tol=0.0001 : 迭代终止判据的误差范围。
    #   verbose= : 日志冗长度int：冗长度；：不输出训练过程；1：偶尔输出；>1：对每个子模型都输出
    #   warm_start=False : 是否热启动，如果是，则下一次训练是以追加树的形式进行（重新使用上一次的调用作为初始化）。布尔型，默认False。
    #   n_jobs=1 : 并行数，int：个数；-1：跟CPU核数一致；1:默认值。
    # Attributes
    #        coef_:返回模型的估计系数。
    #        intercept_:线性模型的独立项，一维情形下的截距。
    #        n_iter:实际迭代次数。
    # Methods
    #   fit(X, y, sample_weight=None)
    #           拟合模型，用来训练LR分类器，其中X是训练样本，y是对应的标记向量
    #           返回对象，self。
    #   fit_transform(X, y=None, **fit_params)
    #       fit与transform的结合，先fit后transform。返回X_new:numpy矩阵。
    #   predict(X)
    #       用来预测样本，也就是分类，X是测试集。返回array。
    #   predict_proba(X)
    #       输出分类概率。返回每种类别的概率，按照分类类别顺序给出。如果是多分类问题，multi_class="multinomial"，则会给出样本对于每种类别的概率。
    #       返回array-like。
    #   score(X, y, sample_weight=None)
    #       返回给定测试集合的平均准确率（mean accuracy），浮点型数值。
    #       对于多个分类返回，则返回每个类别的准确率组成的哈希矩阵。
    X_train, X_test, y_train, y_test = data
    regr = linear_model.LogisticRegression()
    regr.fit(X_train, y_train)
    coef = regr.coef_
    intercept = regr.intercept_
    trainscore = regr.score(X_train, y_train)
    testscore = regr.score(X_test, y_test)
    trainpredict = regr.predict(X_train)
    testpredict = regr.predict(X_test)
    meansquareerror = np.mean((regr.predict(X_test) - y_test) ** 2)
    equalscore = np.mean(regr.predict(X_test) == y_test)
    # print('Coefficients={},intercept={}'.format(coef,intercept))
    # # Coefficients=[[-0.38340846  0.86187824 -2.27003634 -0.9744431 ]
    # #  [ 0.34360292 -0.37876116 -0.03099424 -0.86880637]
    # #  [ 0.03980554 -0.48311708  2.30103059  1.84324947]]
    # # intercept=[  8.75830949   2.49431233 -11.25262182]
    # print('Residual sum of squares={}'.format(meansquareerror))
    # # Residual sum of squares=0.0
    # print('trainscore={:.2f}'.format(trainscore))
    # # trainscore=0.9553571428571429
    # print('testscore={:.2f}'.format(testscore))
    # # testscore=1.0
    # print('equalscore={:.2f}'.format(equalscore))
    # # standardscore=1.00
    # print('trainpredict={}'.format(trainpredict))
    # print('testpredict={}'.format(testpredict))
def test_Logistic_Regression_C(*data):
    X_train, X_test, y_train, y_test = data
    Cs=np.logspace(-2,4,num=100)
    scores = []
for C in Cs:
        regr = linear_model.LogisticRegression(C=C)
        regr.fit(X_train, y_train)
        scores.append(regr.score(X_test, y_test))

    fig = plt.figure()
    ax = fig.add_subplot(1, 1, 1)
    ax.plot(Cs, scores)
    ax.set_xlabel(r'C')
    ax.set_ylabel(r'score')
    ax.set_xscale('log')
    ax.set_title('LogisicRegrssion')
    plt.show()
# 线性判别分析回归
def test_LDA(*data):
    # ElasticNet回归是对Lasso回归和Ridge回归的融合，利用了L1和L2范数的融合，所以在参数中除了alpha之外还有L1_ratio 默认alpha=1，l1_ratio=0.5
    # Parameters
    #   solver：一个字符串，指定了求解最优化问题的算法，可以为如下的值。
    #       'svd'：奇异值分解。对于有大规模特征的数据，推荐用这种算法。
    #       'lsqr'：最小平方差，可以结合skrinkage参数。
    #       'eigen' ：特征分解算法，可以结合shrinkage参数。
    #   skrinkage：字符串‘auto’或者浮点数活者None。该参数通常在训练样本数量小于特征数量的场合下使用。该参数只有在solver=lsqr或者eigen下才有意义
    #       '字符串‘auto’：根据Ledoit-Wolf引理来自动决定shrinkage参数的大小。
    #       'None：不使用shrinkage参数。
    #       浮点数（位于~1之间）：指定shrinkage参数。
    #   priors：一个数组，数组中的元素依次指定了每个类别的先验概率。如果为None，则认为每个类的先验概率都是等可能的。
    #   n_components：一个整数。指定了数组降维后的维度（该值必须小于n_classes-1）。
    #   store_covariance：一个布尔值。如果为True，则需要额外计算每个类别的协方差矩阵。
    #   warm_start：一个布尔值。如果为True，那么使用前一次训练结果继续训练，否则从头开始训练。
    #   tol：一个浮点数。它指定了用于SVD算法中评判迭代收敛的阈值。
    # ————————————————
    # Attributes
    #       coef_：权重向量。
    #       intercept：b值。
    #       covariance_：一个数组，依次给出了每个类别烦人协方差矩阵。
    #       means_：一个数组，依次给出了每个类别的均值向量。
    #       xbar_：给出了整体样本的均值向量。
    #       n_iter_：实际迭代次数。
    # Methods
    #       fix(X,y)：训练模型。
    #       predict(X)：用模型进行预测，返回预测值。
    #       score(X,y[,sample_weight])：返回（X，y）上的预测准确率（accuracy）。
    #       predict_log_proba（X）：返回一个数组，数组的元素一次是 X 预测为各个类别的概率的对数值。 
    #       predict_proba（X）：返回一个数组，数组元素一次是 X 预测为各个类别的概率的概率值。
    X_train, X_test, y_train, y_test = data
    lda = discriminant_analysis.LinearDiscriminantAnalysis()
    lda.fit(X_train, y_train)
    coef = lda.coef_
    intercept = lda.intercept_
    trainscore = lda.score(X_train, y_train)
    testscore = lda.score(X_test, y_test)
    trainpredict = lda.predict(X_train)
    testpredict = lda.predict(X_test)
    meansquareerror = np.mean((lda.predict(X_test) - y_test) ** 2)
    equalscore = np.mean(lda.predict(X_test) == y_test)
    # print('Coefficients={},intercept={}'.format(coef,intercept))
    # # Coefficients=[[  6.66775427   9.63817442 -14.4828516  -20.9501241 ][ -2.00416487  -3.51569814   4.27687513   2.44146469][ -4.54086336  -5.96135848   9.93739814  18.02158943]]
    # # intercept=[-15.46769144   0.60345075 -30.41543234]
    # print('Residual sum of squares={}'.format(meansquareerror))
    # # Residual sum of squares=0.9
    # print('trainscore={}'.format(trainscore))
    # # trainscore=0.9732142857142857
    # print('testscore={}'.format(testscore))
    # # testscore=1.0
    # print('equalscore={:.2f}'.format(equalscore))
    # # equalscore=0.00
    # print('trainpredict={}'.format(trainpredict))
    # print('testpredict={}'.format(testpredict))
def plot_LDA(converted_X,y):
    from mpl_toolkits.mplot3d import Axes3D
    fig=plt.figure(figsize=(10,5))
    ax=Axes3D(fig)
    colors='rgb'
    markers='o*s'
for target,color,marker in zip([,1,2],colors,markers):
        pos=(y==target).ravel()
        X=converted_X[pos,:]
        ax.scatter(X[:,],X[:,1],X[:,2],color=color,marker=marker,label='Label %d'%target)

    ax.legend(loc='best')
    fig.suptitle('Iirs')
    plt.show()

def plot_LDA_diff(*data):
    X_train, X_test, y_train, y_test = data
    X=np.vstack((X_train,X_test))
    Y=np.vstack((y_train.reshape(y_train.size,1),y_test.reshape(y_test.size,1)))
plot_LDA(X,Y)

lda=discriminant_analysis.LinearDiscriminantAnalysis()
    lda.fit(X,Y)
    convertedX=np.dot(X,np.transpose(lda.coef_))+lda.intercept_
plot_LDA(convertedX,Y)


def f(x):
    randa = np.random.uniform(, 0.5, size=x.shape)
    randb = np.random.uniform(, 2, size=x.shape)
    randc = np.random.uniform(, 2, size=x.shape)
return x*x*(randa+1)-x*(randb+2)-randc

def load_ploy_data():
    X=np.linspace(1,100,100)
    y = f(X)
    c = list(zip(X, y))
    np.random.shuffle(c)
    newX,newy=zip(*c)
    size=20
    newX=list(newX)
    newy=list(newy)
    X_train=np.array(newX[:size])
    y_train=np.array(newy[:size])
    X_test=np.array(newX[size:])
    y_test=np.array(newy[size:])

    X = X[:, np.newaxis]
    X_train = X_train[:, np.newaxis]
    y_train = y_train[:, np.newaxis]
    X_test = X_test[:, np.newaxis]
    y_test = y_test[:, np.newaxis]

return X_train, X_test, y_train, y_test,X,y

def test_PolynomialFeatures(degree,*data):
    # 机器学习中一种常见的模式，是使用线性模型训练数据的非线性函数。
    # 这种方法保持了一般快速的线性方法的性能，同时允许它们适应更广泛的数据范围。
    # 主要参数
    #   degree：控制多项式的度
    #   interaction_only：默认为False，如果指定为True，那么就不会有特征自己和自己结合的项，上面的二次项中没有a^2和b^2。
    #   include_bias：默认为True。如果为True的话，那么就会有上面的 1那一项。
    X_train, X_test, y_train, y_test = data

    model = Pipeline([('poly', preprocessing.PolynomialFeatures(degree=degree)),
                      ('linear', linear_model.LinearRegression())])
    model.fit(X_train,y_train)
    X=np.vstack((X_train,X_test))

    coef = model.named_steps['linear'].coef_
    intercept = model.named_steps['linear'].intercept_
    y_plot = model.predict(X)
print('Coefficients={},intercept={}'.format(coef, intercept))
    # Coefficients=[-6.52563764e-09  4.07601927e+01 -2.10719706e+02  5.42901460e+02...]
    # intercept=intercept=188.12644759943421
def test_PolynomialFeatures_degree(*data):
    X_train, X_test, y_train, y_test,X,y = data
    plt.scatter(X_train,y_train, color='navy', s=30, marker='o', label="training points")
    plt.scatter(X_test, y_test, color='green', s=30, marker='*', label="test points")
    colors = ['teal', 'yellowgreen', 'gold','black']
for count, degree in enumerate([2 ,3, 4, 5]):
        model = Pipeline([('poly', preprocessing.PolynomialFeatures(degree=degree)),
                          ('linear', linear_model.LinearRegression())])
        model.fit(X_train,y_train)
        y_plot=model.predict(X)
        plt.plot(X, y_plot, color=colors[count], linewidth=2,label="degree %d" % degree)
    plt.legend()
plt.show()

if __name__ == '__main__':
    X_train,X_test,y_train,y_test=load_data()
    test_LinearRegression(X_train,X_test,y_train,y_test)
    test_Ridge_Regression(X_train,X_test,y_train,y_test)
    test_Ridge_alpha(X_train,X_test,y_train,y_test)
    test_Lasso_Regression(X_train,X_test,y_train,y_test)
    test_Lasso_alpha(X_train,X_test,y_train,y_test)
    test_ElasticNet_Regression(X_train,X_test,y_train,y_test)
    test_ElasticNet_alpha_rho(X_train,X_test,y_train,y_test)
    X_train, X_test, y_train, y_test = load_iris_data()
    test_Logistic_Regression(X_train,X_test,y_train,y_test)
    test_Logistic_Regression_C(X_train,X_test,y_train,y_test)
    test_LDA(X_train,X_test,y_train,y_test)
    plot_LDA_diff(X_train,X_test,y_train,y_test)
    X_train, X_test, y_train, y_test,X,y = load_ploy_data()
    test_PolynomialFeatures(2,X_train,X_test,y_train,y_test)
    test_PolynomialFeatures_degree(X_train,X_test,y_train,y_test,X,y)

# 线性判别分析回归

阅读全文

机器学习(130423) 机器学习(130423)
线性回归(4247) 线性回归(4247)

讨论8种在Python环境下进行简单线性回归计算的算法

对于大多数数据科学家而言，线性回归方法是他们进行统计学建模和预测分析任务的起点。但我们不可夸大线性模型（快速且准确地）拟合大型数据集的重要性。

2019-02-13 10:23:16

2374

机器学习实战之logistic回归

logistic回归是一种广义的线性回归，通过构造回归函数，利用机器学习来实现分类或者预测。原理上一文简单介绍了线性回归，与逻辑回归的原理是类似的。预测函数（h）。该函数就是分类函数，用来预测

2020-09-29 15:17:40

2078

25个机器学习面试题，你都会吗？

的，而有些只是为了逗大家开心。问题1. 我在 95% 的置信区间下构建了一个线性回归模型。这是否意味着我的模型参数对于试图近似的函数有 95% 的概率是真实的估计值？（提示：这实际上意味着在 95% 的试验

2018-09-29 09:39:54

回归算法之逻辑回归的介绍

回归算法之逻辑回归

2020-05-21 16:25:15

回归算法有哪些，常用回归算法（3种）详解

回归是数学建模、分类和预测中最古老但功能非常强大的工具之一。回归在工程、物理学、生物学、金融、社会科学等各个领域都有应用，是数据科学家常用的基本工具。回归通常是机器学习中使用的第一个算法。通过学习

2020-07-28 14:36:05

回归系数表的变量

（二）读懂逻辑回归结果 —— 哪个变量值得关注

2019-09-26 13:40:29

回归预测之入门

式子吧，不然看一些相关的论文可就看不懂了，这个系列主要将会着重于去机器学习的数学描述这个部分，将会覆盖但不一定局限于回归、聚类、分类等算法。回归与梯度下降：回归在数学上来说是给定一个点集，能够用一条曲线

2018-10-15 10:19:03

机器学习100天之多元线性回归

机器学习100天-多元线性回归 [代码实现细节分析]

2020-05-12 15:06:34

机器学习训练秘籍——吴恩达

。监督学习算法主要包括线性回归（linear regression）、对数几率回归（logistic regression，又译作逻辑回归、逻辑斯蒂回归）和神经网络（neural network）。虽然

2018-11-30 16:45:03

机器学习的回归任务

常见线性回归理论与算法实现

2019-10-29 11:09:03

机器学习的分类器

各种机器学习的应用场景分别是什么？例如，k近邻,贝叶斯，决策树，svm，逻辑斯蒂回归和最大熵模型

2019-09-10 10:53:10

机器学习笔试题精选

面试。红色石头准备在公众号连载一些机器学习笔试题系列文章，希望能够对大家有所帮助！Q1. 在回归模型中，下列哪一项在权衡欠拟合（under-fitting）和过拟合（over-fitting）中影

2018-10-11 10:03:55

机器算法学习比较

（一个比较严格的条件），朴素贝叶斯分类器的收敛速度将快于判别模型，如逻辑回归，所以你只需要较少的训练数据即可。即使NB条件独立假设不成立，NB分类器在实践中仍然表现的很出色。它的主要缺点是它不能学习

2016-09-27 10:48:01

线性回归定义

线性回归与评价指标-2

2019-09-03 14:24:29

线性回归的标准方程法使用

线性回归-标准方程法示例（python原生实现）

2019-05-07 16:44:03

Case-Control 关联分析模型

一、Case-Control关联分析模型（第一部分主要是在人类中）卡方检验举例逻辑回归逻辑混合模型二、（动植物）数量性状关联分析模型加性模型（GAM）当线性模型的种种条件不能满足时，就要考虑用平滑性模型来替代。平滑性模型可以对非线性关...

2021-07-23 07:03:13

Edge Impulse的回归模型

Edge Impulse的回归模型可以从数据中学习模式，并将其应用于新数据。非常适合预测数字连续值。

2021-12-20 06:21:35

Keras之ML~P：基于Keras中建立的回归预测的神经网络模型

Keras之ML~P：基于Keras中建立的回归预测的神经网络模型(根据200个数据样本预测新的5+1个样本)——回归预测

2018-12-20 10:43:06

Multivariate Linear Regression多变量线性回归

吴恩达机器学习-手写笔记三 - Multivariate Linear Regression 多变量线性回归

2020-06-11 17:02:50

TensorFlow逻辑回归处理MNIST数据集

。mnist.train.images 的每项都是一个范围介于 0 到 1 的像素强度：在 TensorFlow 图中为训练数据集的输入 x 和标签 y 创建占位符：创建学习变量、权重和偏置：创建逻辑回归模型

2020-08-11 19:36:01

TensorFlow逻辑回归处理MNIST数据集

2020-08-11 19:36:31

TensorFlow实现多元线性回归（超详细）

随着训练过程的进行而减少：本节使用了 13 个特征来训练模型。简单线性回归和多元线性回归的主要不同在于权重，且系数的数量始终等于输入特征的数量。下图为所构建的多元线性回归模型的 TensorBoard 图：（点此查看高清大图）现在可以使用从模型中学到的系数来预测房价：

2020-08-11 19:35:23

TensorFlow实现简单线性回归

器：声明初始化操作符：现在，开始计算图，训练 100 次：查看结果：解读分析从下图中可以看到，简单线性回归器试图拟合给定数据集的线性线：在下图中可以看到，随着模型不断学习数据，损失函数不断下降

2020-08-11 19:34:38

Tensorflow的非线性回归

Tensorflow 非线性回归

2020-05-12 10:19:42

matlab回归分析总结

1、多元线性回归2、多项式回归3、非线性回归4、逐步回归[hide][/hide]

2012-03-20 10:26:23

python数据分析基础之使用statasmodels进行线性回归

python 数据分析基础 day16－使用statasmodels进行线性回归

2020-06-19 11:22:24

【下载】《机器学习》+《机器学习实战》

。使用 MATLAB，您可以立即访问预置的函数、大量的工具箱以及用于分类、回归和聚类的专门应用程序。您可以：1.比较各种方法，例如逻辑回归、分类树、支持向量机、集成方法和深度学习。2.使用模型优化和缩减技术

2017-06-01 15:49:24

【微信精选】手把手跟我入门机器学习:手写体识别模型

前两篇的连载会以机器学习理论为主，之后的文档就基本是纯实际应用了，不会有太多理论内容了：[ Darknet 训练目标检测模型 ]、[ RT-Thread 连接 ROS 小车控制 ]。这篇文章假定大家

2019-09-23 07:00:00

【阿里云大学免费精品课】机器学习入门：概念原理及常用算法

的周围环境的反馈来做出判断。课程大纲如下：第1 章：机器学习概念、原理和应用场景•机器学习基础概念•机器学习的领域•机器为什么能学习第2 章：机器学习常用算法•监督学习 - 线性回归

2017-06-23 13:51:15

人工智能基本概念机器学习算法

目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集：训练集

2021-09-06 08:21:17

使用KNN进行分类和回归

，这种学习器很少或根本不处理训练数据。与线性回归等积极学习的算法不同，KNN 不会估计在训练阶段概括训练数据的模型的参数。惰性学习有利有弊，训练一个积极学习的成本可能很高，但使用生成的模型进行预测

2022-10-28 14:44:46

使用PyMC3包实现贝叶斯线性回归

分布。这个方法相当复杂，原理方面我们这里不做详细描述，这里只说明一些简单的概念，为什么使用MCMC呢？　　频率主义和贝叶斯回归方法之间的关键区别在于他们如何处理参数。在频率统计中，线性回归模型的参数

2022-10-08 15:59:35

分享一个自己写的机器学习线性回归梯度下降算法

单变量线性回归算法，利用Batch梯度梯度下降算法迭代计算得到误差最小的代价函数theta0,theta1。调节学习率a可以观察拟合得到的函数和代价函数误差收敛情况。

2018-10-02 21:48:58

单变量线性回归算法的符号定义和代价函数

吴恩达机器学习笔记（二）——单变量线性回归

2019-03-08 12:50:39

如何用C语言实现一个简单的一元线性回归算法

今天我们用C语言实现一个简单的线性回归算法；在代码前面我们在回顾一下线性回归。线性回归是回归问题中的一种，线性回归假设目标值与特征是线性相关的，即满足一个多元一次方程式。通过构建损失函数，来求解损失

2021-07-20 06:34:33

如何规划出完美的机器学习入门路径？| AI知识科普

方法的不同，机器学习可分为：监督学习，无监督学习，半监督学习，强化学习。在这里我们讲2种机器学习的常用方法：监督学习，无监督学习。监督学习是从标记的训练数据来推断一个功能的机器学习任务，可分为“回归”和“分类

2018-07-27 12:54:20

如何选择机器学习的各种方法

，机器学习最大的分支的监督学习和无监督学习，简单说数据已经打好标签的是监督学习，而数据没有标签的是无监督学习。从大的分类上看，降维和聚类被划在无监督学习，回归和分类属于监督学习。无监督学习如果你的数据

2019-03-07 20:18:53

干货 | 这些机器学习算法，你了解几个？

，广义线性模型，2，支持向量机，3，最近邻居法，4，决策树，5，神经网络，等等… 但是，从我们的经验来看，这并不总是算法分组最为实用的方法。那是因为对于应用机器学习，你通常不会想，“今天我要训练一个支持向量机

2019-09-22 08:30:00

斯坦福机器学习公开课笔记之单变量线性回归

斯坦福机器学习公开课笔记一 --单变量线性回归

2020-06-11 13:53:59

树回归学习和实践

树回归理论与算法实现

2019-10-23 11:34:40

浅析逻辑回归

ML-逻辑回归-公式推导- 多种实现

2019-04-25 15:35:14

生产应用中使用线性回归进行实际操练

【线性回归】生产应用中使用线性回归进行实际操练

2020-05-08 07:45:36

简单线性回归代码实现细节分析

机器学习100天-简单线性回归 [代码实现细节分析]

2020-05-22 10:16:34

自回归滞后模型进行多变量时间序列预测案例分享

回归的机器学习方法也可以使用。　　但是其他变量可能包含sparkling wine未来销售的重要线索。看看下面的相关矩阵。原作者：Vitor Cerqueira

2022-11-30 15:33:53

回归型支持向量机在电机故障诊断中的研究

通过分析电机故障模式识别的原理，提出应用回归型支持向量机进行电机故障特征学习和分类的方法；从回归型支持向量机的基本原理出发，探讨线性回归与非线性回归两种情形，

2009-07-16 11:09:45

多响应线性回归模型Bayes最优设计的等价性定理

多响应线性回归模型Bayes最优设计的等价性定理:讨论多响应线性回归模型的Bayes设计问题,给出回归参数的Bayes估计,并建立Bayes Z - 最优准则. 在Z - 最优准则下, 得到了多响应线性回归

2009-10-25 12:23:20

传感器网络中一种基于一元线性回归模型的空时数据压缩算法

针对传感器网络中节点采样数据的空间和时间冗余特点以及节能要求，该文提出了一种基于一元线性回归模型的空时数据压缩算法ODLRST。ODLRST 先在每个节点内进行消除时间冗余的数

2010-03-06 11:46:25

#机器学习基于模型的线性回归方法

人工智能机器学习

电子技术那些事儿发布于 2022-09-09 20:56:15

线性回归(1)#机器学习

机器学习

未来加油dz发布于 2023-07-14 16:53:23

线性回归(2)#机器学习

机器学习

未来加油dz发布于 2023-07-14 16:54:21

基于同态加密的分布式隐私保护线性回归分析模型

基于同态加密的分布式隐私保护线性回归分析模型_李娟

2017-01-03 17:41:58

基于多元线性回归的阻性和容性电流分解

基于多元线性回归的阻性和容性电流分解_韩永森

2017-01-07 17:16:23

支持向量机（SVM）的定义、分类及工作流程图详解

SVM可以做线性分类、非线性分类、线性回归等，相比逻辑回归、线性回归、决策树等模型。

2017-11-30 10:59:55

82535

基于一般线性模型的功能磁共振成像回归量正交化

针对功能磁共振成像（ fMRI）模型回归量之间存在共线性的问题，提出了一种正交化的方法。首先，确定感兴趣以及待正交的回归量；其次，从待正交回归量中减去与感兴趣回归量相关的部分，使模型中共线的回归

2017-12-01 13:38:01

机器学习中几种常见回归函数的概念学习

回归问题的条件/前提： 1）收集的数据 2）假设的模型，即一个函数，这个函数里含有未知的参数，通过学习，可以估计出参数。然后利用这个模型去预测/分类新的数据。 1. 线性回归假设特征

2017-12-15 11:20:06

4602

8 种进行简单线性回归的方法分析与讨论

本文中，作者讨论了 8 种在 Python 环境下进行简单线性回归计算的算法，不过没有讨论其性能的好坏，而是对比了其相对计算复杂度的度量。对于大多数数据科学家而言，线性回归方法是他们进行统计学建模和预测分析任务的起点。但我们不可夸大线性模型（快速且准确地）拟合大型数据集的重要性。

2018-01-05 08:18:57

9523

基于Weierstrass逼近定理在非线性回归模型中应用

基于Weierstrass逼近定理，阐释了将一般非线性回归模型近似为多项式模型来处理的数学原理，从而引入了把多元非线性回归分析转化为多元线性回归分析的一般方法，并且通过实际应用案例分析表明该方法的实用性和有效性。

2018-01-12 09:59:47

8种用Python实现线性回归的方法对比分析_哪个方法更好？

来谈谈线性回归。没错，作为数据科学界元老级的模型，线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统的模型分析和检验不说，你真的就能熟练应用线性回归了么？

2018-06-28 09:53:00

4127

回归样条法介绍及其实现步骤与技巧

线性回归是一种极其简单的、使用最广泛的用于预测建模的统计方法。作为监督学习算法，它能解决回归问题。当我们建立起因变量和自变量之间的线性关系后，这时我们就得到了一个线性模型。从数学角度看，它可以被当做是一个线性表达式：

2018-03-23 16:37:39

18914

对于机器学习/数据科学初学者应该掌握的七种回归分析方法

对于机器学习/数据科学的初学者来说，线性回归，或者Logistic回归是许多人在建立预测模型时接触的第一/第二种方法。由于这两种算法适用性极广，有些人甚至在走出校门当上数据分析师后还固执地认为回归只有这两种形式。那么事实真的是这样吗？

2018-04-27 15:55:44

3980

机器学习算法的无监督学习的详细介绍

and Unsupervised Learning 我们已经学习了许多机器学习算法，包括线性回归，Logistic回归，神经网络以及支持向量机。这些算法都有一个共同点，即给出的训练样本自身带有标记。比如

2018-05-01 17:43:00

12211

人工智能机器学习三大类之回归模型（RM）

回归不是单一的有监督学习技术，而是许多技术所属的整个类别。回归的目的是预测数值型的目标值，如预测商品价格、未来几天的PM2．5等。最直接的办法是依据输入写出一个目标值的计算公式，该公式就是所谓

2018-07-13 01:39:00

8897

掌握logistic regression模型，有必要先了解线性回归模型和梯度下降法

先回想一下线性回归，线性回归模型帮助我们用最简单的线性方程实现了对数据的拟合，然而，这只能完成回归任务，无法完成分类任务，那么 logistics regression 就是在线性回归的基础上添砖加瓦，构建出了一种分类模型。

2018-06-04 11:31:10

7339

Sklearn与TensorFlow机器学习实用指南

以一个简单的线性回归模型为例，讨论两种不同的训练方法来得到模型的最优解。

2018-06-22 10:02:19

7500

DNN与逻辑回归效果一样？

谷歌用深度学习分析电子病例的重磅论文给出了一个意外的实验结果，DNN与逻辑回归效果一样，引发了热烈讨论。

2018-06-28 16:01:33

5747

深度学习与计算机视觉学习笔记：线性回归（Linear Classification）

由 mengqiqi 于星期四, 2018-09-06 11:37 发表本次我们基于线性回归的图像分类算法，采用的数据集合是CIFAR10，具体信息如下图所示。参数化方法：线性回归如下图所示

2018-09-06 20:31:01

337

深度学习基础教程之线性回归识别数字图像分类的详细资料免费下载

让我们从经典的线性回归（Linear Regression ［1］）模型开始这份教程。在这一章里，你将使用真实的数据集建立起一个房价预测模型，并且了解到机器学习中的若干重要概念。

2018-09-10 17:38:42

数学推导+纯Python实现机器学习算法

跟上一讲写线性模型一样，在实际动手写之前我们需要理清楚思路。要写一个完整的逻辑回归模型我们需要：sigmoid函数、模型主体、参数初始化、基于梯度下降的参数更新训练、数据测试与可视化展示。

2018-10-16 16:12:34

2608

如何使用智能支持向量机的回归模型进行金融数据的预测

针对金融数据的非线性、时变性、随机性、模糊性、不确定性等特点，提出一种崭新的智能支持向量回归模型，并且运用一种新型的遗传算法优选模型参数。实验结果表明，所提出的智能支持向量回归模型预测金融数据比BP神经网络模型预测精度高、速度快。

2018-12-20 16:35:26

逻辑回归的对于数据学习的关键

5个原因告诉你：为什么在成为数据科学家之前，“逻辑回归”是第一个需要学习的。

2018-12-29 15:55:22

2904

matlab经典算法数字实验教程之回归分析

本文档的主要内容详细介绍的是matlab经典算法数字实验教程之回归分析主要内容包括了：1.一元线性与非线性回归分析，2.简介一元非线性回归模型，3.MATLAB软件实现，4.一元回归模型与回归分析。

2019-01-03 11:46:44

如何帮你的回归问题选择最合适的机器学习算法

回归分析在机器学习领域应用非常广泛，例如，商品的销量预测问题，交通流量预测问题。那么，如何为这些回归问题选择最合适的机器学习算法呢？

2019-05-03 09:39:00

2571

针对线性回归模型和深度学习模型，介绍了确定训练数据集规模的方法

具体来看，对于传统的机器学习算法，模型的表现先是遵循幂定律（power law），之后趋于平缓；而对于深度学习，该问题还在持续不断地研究中，不过图一为目前较为一致的结论，即随着数据规模的增长，深度

2019-05-05 11:03:31

5747

MATLAB数据建模方法中的机器学习方法介绍

回归模型描述了响应（输出）变量与一个或多个预测变量（输入）变量之间的关系。 MATLAB 支持线性，广义线性和非线性回归模型。以下示例演示如何训练逻辑回归模型。

2019-09-16 14:31:21

4949

广义线性模型介绍

，softmax回归是多项分布+对数最大似然估计的结果，最大熵是基于期望+对数似然估计的结果。前三者可以从广义线性模型角度来看。

2019-11-22 15:10:30

3744

机器学习的线性回归分析

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。其表达形式为y = w’x+e，e为误差服从均值为0的正态分布。

2020-01-23 17:33:00

2567

机器学习的回归分析和回归方法

根据受欢迎程度，线性回归和逻辑回归经常是我们做预测模型时，且第一个学习的算法。但是如果认为回归就两个算法，就大错特错了。事实上我们有许多类型的回归方法可以去建模。每一个算法都有其重要性和特殊性。

2020-01-19 17:22:00

3568

你了解机器学习中的线性回归吗

线性回归是对数据中简单关系建模的宝贵工具。虽然它不像更现代的机器学习方法那么花哨或复杂，但它通常是许多存在直接关系的现实世界数据集的正确工具。

2020-02-24 14:03:34

1497

机器学习教程之线性模型的详细资料说明

本文档的主要内容详细介绍的是机器学习教程之线性模型的详细资料说明。

2020-03-24 08:00:00

线性回归是人工智能机器学习里面最基础的算法

如上图所示，蓝色的点为样本点，假设x轴是房屋面积，y轴是房屋价格，那线性回归就是找到这样一条红色的直线，使得它对所有的样本做出做好的拟合，也就是距离所有的样本点平均距离最近，这样当有新的房屋面积需求时候，估计出来的房屋价格误差就是最小的。

2020-03-25 16:23:48

3876

10大常用机器学习算法汇总

本文介绍了10大常用机器学习算法，包括线性回归、Logistic回归、线性判别分析、朴素贝叶斯、KNN、随机森林等。

2020-11-20 11:10:04

2462

机器学习：线性回归与逻辑回归的理论与实战

1、基本概念要进行机器学习，首先要有数据。从数据中学得模型的过程称为“学习”或“训练”。其对应的过程中有几个基本术语需要知道。（1）训练集：模型训练过程中使用的数据称为训练集，其中每个样本称为

2020-12-26 09:58:11

1727

基于低秩表示的鲁棒线性回归模型

现有的线性回归方法不能有效处理噪声和异常数据。针对这一问题，结合低秩表示和鲁棒回归方法构建模型LR-RRM。利用低秩表示方法以有监督的方式检测数据内的噪声和异常值，从原始数据的低维子空间中恢复

2021-05-28 10:56:37

面向非线性动态的保精度-稀疏特性核回归模型

2021-07-02 15:00:47

使用三种稳健线性回归模型处理异常值

　　线性回归是最简单的机器学习模型之一。它通常不仅是学习数据科学的起点，也是构建快速简单的最小可行产品（ MVP ）的起点，然后作为更复杂算法的基准。

2022-10-10 14:31:51

7181

ELMER: 高效强大的非自回归预训练文本生成模型

每个单词都依赖于输入文本与之前生成的单词。自回归生成模型只建模了前向的单词依赖关系，依次生成的结构也使得自回归模型难以并行化。目前大部分预训练生成模型均采用自回归方式，包括GPT-2，BART，T5等模型。

2023-03-13 10:39:59

910

嵌入式开发的一元线性回归算法介绍

一元线性回归顾名思义就是一个自变量（可以是ADC采集到的电压值、DS18B20采集到的温度值、也可以是光敏传感器采集的光照强度值）。

2023-04-29 09:49:00

398

机器学习应该学习哪些人工智能技术学习路线分享

熟悉机器学习领域的经典算法、模型及实现的任务等，同时学习搭建和配置机器学习环境，并学会用线性回归解决一个实际问题。

2023-05-10 14:42:30

432

PyTorch教程3.1之线性回归

电子发烧友网站提供《PyTorch教程3.1之线性回归.pdf》资料免费下载

2023-06-05 11:30:51

PyTorch教程3.4之从头开始执行线性回归

电子发烧友网站提供《PyTorch教程3.4之从头开始执行线性回归.pdf》资料免费下载

2023-06-05 11:25:23

PyTorch教程3.5之线性回归的简洁实现

电子发烧友网站提供《PyTorch教程3.5之线性回归的简洁实现.pdf》资料免费下载

2023-06-05 11:28:01

PyTorch教程-3.1. 线性回归

（以美元为单位）。要开发预测房价的模型，我们需要掌握由销售额组成的数据，包括每个房屋的销售价格、面积和年龄。在机器学习的术语中，数据集称

2023-06-05 15:38:37

312

PyTorch教程-3.4. 从头开始执行线性回归

在 SageMaker Studio Lab 中打开笔记本我们现在准备好通过线性回归的全功能实现来工作。在本节中，我们将从头开始实现整个方法，包括（i）模型；(ii) 损失函数；(iii) 小批量

2023-06-05 15:38:38

285

机器学习回归模型相关重要知识点总结

来源：机器学习研习院回归分析为许多机器学习算法提供了坚实的基础。在这篇文章中，我们将总结10个重要的回归问题和5个重要的回归问题的评价指标。1、线性回归的假设是什么？线性回归有四个假设线性：自变量

2022-11-10 10:02:42

415

线性回归背景下交互作用术语的直观解释

线性回归中相互作用项的综合指南

2023-07-05 16:30:30

982

人工智能课程学什么

其次，在机器学习方面，你需要学习跟机器学习相关的算法和数据结构，机器学习技术的应用以及一些常见的模型和算法，例如线性回归、逻辑回归、支持向量机、随机森林、神经网络、卷积神经网络等。

2023-08-13 14:25:53

597

机器学习theta是什么？机器学习tpe是什么？

解一下theta。在机器学习中，theta通常表示模型的参数。在回归问题中，theta可能表示线性回归的斜率和截距；在分类问题中，theta可能表示多项式模型的各项系数。这些参数通常是通过训练数据自动学习得到的，而不是手工设置的。在机器学习中，优化theta是一

2023-08-17 16:30:08

1023

多元线性回归的特点是什么

何为多元线性回归？对比于前一天学习的线性回归，多元线性回归的特点是什么？多元线性回归与简单线性回归一样，都是尝试通过使用一个方程式来适配数据，得出相应结果。不同的是，多元线性回归方程，适配的是两个

2023-10-31 10:34:10

526

线性回归模型的基础知识

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。 1.准备开始之前，你要确保Python和pip已经成功安装在电脑上，如果没有，可以访问

2023-10-31 10:54:19

198

深入探讨线性回归与柏松回归

或许我们所有人都会学习的第一个机器学习算法就是线性回归算法，它无疑是最基本且被广泛使用的技术之一——尤其是在预测分析方面。

2024-03-18 14:06:10

已全部加载完成

搜索历史

机器学习线性模型训练：线性回归和逻辑回归

评论