博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【Spark机器学习速成宝典】模型篇03线性回归【LR】(Python版)
阅读量:5160 次
发布时间:2019-06-13

本文共 1482 字,大约阅读时间需要 4 分钟。

目录

  

  


 

线性回归原理

   详见博文: 

 

 

线性回归代码(Spark Python) 

  

  代码里数据: 密码:acq1

 

# -*-coding=utf-8 -*-  from pyspark import SparkConf, SparkContextsc = SparkContext('local')from pyspark.mllib.regression import LabeledPoint, LinearRegressionWithSGD, LinearRegressionModel# Load and parse the data 加载和解析数据,将每一个数转化为浮点数。每一行第一个数作为标记,后面的作为特征def parsePoint(line):    values = [float(x) for x in line.replace(',', ' ').split(' ')]    return LabeledPoint(values[0], values[1:])data = sc.textFile("data/mllib/ridge-data/lpsa.data")print data.collect()[0] #-0.4307829,-1.63735562648104 -2.00621178480549 -1.86242597251066 -1.024....-0.864466507337306parsedData = data.map(parsePoint)print parsedData.collect()[0] #(-0.4307829,[-1.63735562648,-2.00621178481,-1.86242597251,-1.024....,-0.864466507337])# Build the model 建立模型model = LinearRegressionWithSGD.train(parsedData, iterations=1000, step=0.1)# Evaluate the model on training data 评估模型在训练集上的误差valuesAndPreds = parsedData.map(lambda p: (p.label, model.predict(p.features)))MSE = valuesAndPreds \    .map(lambda vp: (vp[0] - vp[1])**2) \    .reduce(lambda x, y: x + y) / valuesAndPreds.count()print("Mean Squared Error = " + str(MSE)) #Mean Squared Error = 6.32693963099# Save and load model 保存模型和加载模型model.save(sc, "pythonLinearRegressionWithSGDModel")sameModel = LinearRegressionModel.load(sc, "pythonLinearRegressionWithSGDModel")print sameModel.predict(parsedData.collect()[0].features) #-1.86583391312

 

 

 

 

转载于:https://www.cnblogs.com/itmorn/p/8023396.html

你可能感兴趣的文章
成功实施的APS项目故事分享---我们数据治理的心路历程
查看>>
4.2.7 Waiting ten thousand years for Love
查看>>
java concurrent 探秘
查看>>
IE模式下EasyUI Combobox无效问题
查看>>
五种常用的图片格式及其是否有数据压缩的总结
查看>>
【miscellaneous】华为智能视频监控系统设计解决方案
查看>>
netstat实现原理
查看>>
寻找完美平方数
查看>>
初学反编译-.-
查看>>
防御式编程
查看>>
单线程并发的server端
查看>>
View可以设置tag携带数据
查看>>
individual reading task ---12061183 叶露婷
查看>>
delphi的消息对话框
查看>>
java:Apache Shiro 权限管理
查看>>
38.输出1到最大的N位数[Print 1 to max number of N bits]
查看>>
ZOJ - 2165 Red and Black
查看>>
objective c的注释规范
查看>>
FreeNas安装配置使用
查看>>
机器学习中的F1-score
查看>>