2018-10-26 15:37 重庆邮电大学 C++

关注

【有书共读】python带我起飞读书笔记10

第11章实战

1. 爬取股票内容

import urllib.request
import re

stock_CodeUrl = 'http://quote.eastmoney.com/stocklist.html'
#获取股票代码列表
def urlTolist(url):
    allCodeList = []
    html = urllib.request.urlopen(url).read()
    html = html.decode('gbk')
    s = r'<li><a target="_blank" href="http://quote.eastmoney.com/\S\S(.*?).html">'
    pat = re.compile(s)
    code = pat.findall(html)
    for item in code:
        if item[0]=='6' or item[0]=='3' or item[0]=='0':
            allCodeList.append(item)
    return allCodeList


if __name__=='__main__':
    allCodelist = urlTolist(stock_CodeUrl)
    print(allCodelist[:10])

运行结果：

第12章自动化实战：读取Excel数据文件，并用可视化分析

from sklearn.manifold import TSNE
import matplotlib as mpl
import matplotlib.pyplot as plt
 
mpl.rcParams['font.family'] = 'STSong'

import pandas as pd
df = pd.read_csv("d://all_stock_data//600001.csv",encoding = "gbk")
print(df.head(1))     # 输出部分信息
df.plot()                    #图示

price = df[['日期','收盘价']]  #选取关注列
print(price[:5])             #输出部分信息
price.columns = ["data",'price']    #修改列名
print(price[:5])             #输出部分信息



df_new = df[['日期','开盘价','收盘价']].set_index('日期')# 修改索引
print(df_new[:5])              #输出部分信息
df_new['收盘价'][:20].plot(kind = 'bar') #以直方图形式显示
df_new[:20].plot() #以直方图形式显示

第13章从一组看似混乱的数据中找出y=2x的规律

本案例大概分为如下四步：

1.准备数据

2.训练模型并实现可视化

3.评估模型

4.保存模型，并应用模型

1.准备数据

代码：

import numpy as np
import matplotlib.pyplot as plt
#样本准备
train_X = np.linspace(-1, 1, 100)
train_Y = 2 * train_X + np.random.randn(*train_X.shape) * 0.3 # y=2x，但是加入了噪声
#显示模拟数据点
plt.plot(train_X, train_Y, 'ro', label='Original data')
plt.legend()
plt.show()

输入6，的模型预测结果： [[ 12.03576099]]
线性模型的斜率与截距： [[ 1.99726304]] [ 0.05218275]
使用斜率与截距的计算结果： [[ 12.03576099]]

2.训练模型并实现可视化

代码：

#模型训练及可视化
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(train_X.reshape(100,1),train_Y.reshape(100,1))
print("输入6，的模型预测结果：",model.predict(6))
print("线性模型的斜率与截距：",model.coef_,model.intercept_)
#y = kx+b
print("使用斜率与截距的计算结果：",model.coef_*6 +model.intercept_ )

3.评估模型

#模型评估
X_test = np.linspace(11,20,20)
Y_test =  2 * X_test + np.random.randn(*X_test.shape) * 0.3
print("模型评估的分值：",model.score(X_test.reshape(20,1),Y_test.reshape(20,1)))

4.保存模型，并应用模型

#模型保存，及应用
from sklearn.externals import joblib
joblib.dump(model, "train_model.m")
model = joblib.load("train_model.m")
print("导入模型，并输入6得到的预测结果：",model.predict(6))

模型评估的分值： 0.997262181599
导入模型，并输入6得到的预测结果： [[ 12.03576099]]

#读书笔记##笔记#

全部评论

推荐最新楼层

03-04 17:00

首都师范大学硬件产品经理

找了几个深圳小而美公司

之前梳理各地的公司清单，好像反响一般让大家能获得更好的offer，打听了身边朋友及HR口风，然后结合网上的信息，让大家有一个参考。如有不对，欢迎大家进行指证！！-1.  Insta360影石（春招已开，速投）招聘岗位：技术研发、运营等亮点：扁平化管理，团队年轻化，90后为主；有奖减重挑战赛（减1斤奖励500元），每月300元学习基金，多样化培训课程。-2.  Aftership外企（没开春招，有社招）招聘岗位：软件工程师、技术岗等薪资待遇：技术岗月薪20-30k，全额五险一金，餐补，商业医疗保险，12天带薪年假。亮点：听说薪资很好，而且对新人友好，是远程办公优先的公...

文远知行公司福利 271人发布

投递普速（北京）科技有限公司等公司10个岗位 >

点赞评论收藏

03-06 22:05

门头沟学院数据分析师

年薪20万但996，还是朝九晚五10万，哪个更划算？

一、高薪的诱惑与996的代价先说说第一种选择：年薪20万，但得996。啥叫996啊？就是每周干6天，每天从早上9点熬到晚上9点，12小时的工作时间，强度大得让人咋舌。这种模式在互联网公司里挺常见。钱多，真香！年薪20万，听着就让人心动。尤其在大城市，这钱能让你日子过得挺滋润，租个像样点的房子，吃点好的，偶尔还能出去浪一圈。对于刚起步的年轻人来说，这简直是快速攒钱的好机会，几年下来可能就攒出一套房首付了。但代价也不小不过，996可不是闹着玩的。每天12小时，6天连轴转，留给自己的时间基本为零。周末想睡个懒觉？想都别想。长期这么搞，身体扛不住是迟早的事，心理上也容易崩。健康这东西，没了钱可买不回来...

大数据从入门到精通-最全...

点赞评论收藏

02-26 21:06

西华大学嵌入式软件开发

简历

简历就写着一页好嘛？感觉找工作好难….学了那么久面试问的多少都还不太会。再不行就去干测试和运维了 #嵌入式#

点赞评论收藏

03-09 09:16

深圳技术大学 Java

腾讯通知我二轮技术面都过了，Hr 面考察什么

求助🥺

蚂蚁岗位内推官：1 你觉得你有哪些缺点和优点？ 2 你怎么评价你面试的这家公司？ 3 你在校期间，有没有哪段时间或者某件事情让你受挫？ 4 在校期间遇到最有挑战的事情是什么？ 5 目前手上有 offer 吗？ 6 自我介绍 7 职业规划 8 报学校专业是怎么考虑的？ 9 工作城市 10 你是独生子女吗？ 11 那你男朋友吗？ 12 那你们出来面试都了解过哪些企业？ 13 到后期你们每个人手上有好几个offer，哪些因素决定你们选择这家公司? 14 你更倾向哪种公司？有什么特别的点？ 15 你大学有没有特别难忘的经历或者项目分享一下的? 16 团队合作中遇到什么问题？ 17 对互联网加班有什么看法？ 18 那你现在的技术薄弱点在哪里，怎么去突破？ 19 你的兴趣爱好有哪些？ 20 现在进度最快的公司是哪家？ 21 拿到哪几家offer，是否谈过薪资等

点赞评论收藏