2018-10-26 15:37 重庆邮电大学 C++

关注

【有书共读】python带我起飞读书笔记10

第11章实战

1. 爬取股票内容

import urllib.request
import re

stock_CodeUrl = 'http://quote.eastmoney.com/stocklist.html'
#获取股票代码列表
def urlTolist(url):
    allCodeList = []
    html = urllib.request.urlopen(url).read()
    html = html.decode('gbk')
    s = r'<li><a target="_blank" href="http://quote.eastmoney.com/\S\S(.*?).html">'
    pat = re.compile(s)
    code = pat.findall(html)
    for item in code:
        if item[0]=='6' or item[0]=='3' or item[0]=='0':
            allCodeList.append(item)
    return allCodeList


if __name__=='__main__':
    allCodelist = urlTolist(stock_CodeUrl)
    print(allCodelist[:10])

运行结果：

第12章自动化实战：读取Excel数据文件，并用可视化分析

from sklearn.manifold import TSNE
import matplotlib as mpl
import matplotlib.pyplot as plt
 
mpl.rcParams['font.family'] = 'STSong'

import pandas as pd
df = pd.read_csv("d://all_stock_data//600001.csv",encoding = "gbk")
print(df.head(1))     # 输出部分信息
df.plot()                    #图示

price = df[['日期','收盘价']]  #选取关注列
print(price[:5])             #输出部分信息
price.columns = ["data",'price']    #修改列名
print(price[:5])             #输出部分信息



df_new = df[['日期','开盘价','收盘价']].set_index('日期')# 修改索引
print(df_new[:5])              #输出部分信息
df_new['收盘价'][:20].plot(kind = 'bar') #以直方图形式显示
df_new[:20].plot() #以直方图形式显示

第13章从一组看似混乱的数据中找出y=2x的规律

本案例大概分为如下四步：

1.准备数据

2.训练模型并实现可视化

3.评估模型

4.保存模型，并应用模型

1.准备数据

代码：

import numpy as np
import matplotlib.pyplot as plt
#样本准备
train_X = np.linspace(-1, 1, 100)
train_Y = 2 * train_X + np.random.randn(*train_X.shape) * 0.3 # y=2x，但是加入了噪声
#显示模拟数据点
plt.plot(train_X, train_Y, 'ro', label='Original data')
plt.legend()
plt.show()

输入6，的模型预测结果： [[ 12.03576099]]
线性模型的斜率与截距： [[ 1.99726304]] [ 0.05218275]
使用斜率与截距的计算结果： [[ 12.03576099]]

2.训练模型并实现可视化

代码：

#模型训练及可视化
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(train_X.reshape(100,1),train_Y.reshape(100,1))
print("输入6，的模型预测结果：",model.predict(6))
print("线性模型的斜率与截距：",model.coef_,model.intercept_)
#y = kx+b
print("使用斜率与截距的计算结果：",model.coef_*6 +model.intercept_ )

3.评估模型

#模型评估
X_test = np.linspace(11,20,20)
Y_test =  2 * X_test + np.random.randn(*X_test.shape) * 0.3
print("模型评估的分值：",model.score(X_test.reshape(20,1),Y_test.reshape(20,1)))

4.保存模型，并应用模型

#模型保存，及应用
from sklearn.externals import joblib
joblib.dump(model, "train_model.m")
model = joblib.load("train_model.m")
print("导入模型，并输入6得到的预测结果：",model.predict(6))

模型评估的分值： 0.997262181599
导入模型，并输入6得到的预测结果： [[ 12.03576099]]

#读书笔记##笔记#

全部评论

推荐最新楼层

01-15 17:48

已编辑

用友网络_Java开发

Trae 项目规则篇

接上文，不知上文的同学，请自行查看专栏，按顺序阅读即可。环境变量配置好以后，这次我们可以打开Trae了，进入之后，首先去设置找到规则设置。如图所示：然后我们需要关注的是个人规则和项目规则。如图所示：个人规则：规则全局生效，不管你打开什么项目这个规则都是跟着你走的，所以不要写的太具体。写一些简明扼要的即可。请保持对话语言为中文我的系统为 Windows请在生成代码时添加函数级注释项目规则：只针对某一个项目来讲，对于实习生来说，最关键的几个规则我写一下，剩下的规则还得靠自己根据项目来编写。1.确保每次代码变更不会破坏现有功能，且尽可能保持最小的改动。2.以代码逻辑为主，行级、方法级注释只做参考。不...

用 Trae 上班：实习...

点赞评论收藏

2025-11-26 02:29

北京虾皮信息科技有限公司_今日头条_前端工程师(准入职员工)

和女朋友一起北漂啦

女朋友签约了滴滴我签约了字节明年就可以开始北漂生活啦

尼公子的虾滑海鲜粥：你好，举报在哪里，替我点一下

点赞评论收藏

01-16 18:52

福建省莆田第一中学 C++

2023年莆田市C++专项第三期学员友谊赛题解

本次比赛共有 $80$ 人提交代码，最高分 $375$，$200$ 分及以上 $15$ 人。恭喜俞伯洋同学获得本次比赛第一名！| | 提交数 | 通过数 | 通过率 | 与出题组预期相比 || :-----------: | :-----------: | :-----------: | :-----------: | :-----------: || A | $140$ | $16$ | $11.43\%$ | 略低于预期 || B | $131$ | $4$ | $3.05\%$ | 符合预期 || C | $109$ | $0$ | $0\%$ | 远低于预期 || D | $139$ ...

点赞评论收藏

招聘动态

27届寒假/转正实习汇总

全站热榜

创作者周榜

正在热议