资源预览内容
第1页 / 共13页
第2页 / 共13页
第3页 / 共13页
第4页 / 共13页
第5页 / 共13页
第6页 / 共13页
第7页 / 共13页
第8页 / 共13页
第9页 / 共13页
第10页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnPythonPython 数据可视化、安装环境数据可视化、安装环境 matplotlibmatplotlib _ _光环大数据光环大数据 PythonPython 培训培训Python 数据可视化、安装环境 matplotlib、绘制简单的折丝图。写得比较粗浅,后面会对数据分析专题进行深入,做数据可视化的时候发现没有数据来源,接下来要准备爬虫的教程了.安装环境 matplotlib个人前面也说了强烈建议使用 Pycharm 作为 Python 初学者的首选 IDE,主要还是因为其强大的插件功能,很多环境都能一键安装完成,像本文的matplotlib,numpy,requests 等。下面直接上效果图:绘制简单的折丝图使用 plot 来绘制折线importmatplotlib.pyplotasplt#绘制折线图squares=1,4,9,16,25#plt.plot(squares,linewidth=5)#指定折线粗细,光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cn#plt.show();#修改标签文字和线条粗细#plt.title(“squrenumber“,fontsize=24)#plt.xlabel(“Value“,fontsize=14)#plt.ylabel(“squareofvalue“,fontsize=14)#plt.tick_params(axis=both,labelsize=14)#plt.show()#校正图形input_values=1,2,3,4,5plt.plot(input_values,squares,linewidth=5)plt.show()折线图 1.png生成的效果图:光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cn使用 scatter 绘制散点图并设置样式importmatplotlib.pyplotasplt#简单的点#plt.scatter(2,4)#plt.show()#修改标签文字和线条粗细plt.title(“squrenumber“,fontsize=24)plt.xlabel(“Value“,fontsize=14)plt.ylabel(“squareofvalue“,fontsize=14)#设置刻度标记大小plt.tick_params(axis=both,which=major,labelsize=14)#绘制散点x_values=1,2,3,4,5光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cny_values=1,4,9,16,25plt.scatter(x_values,y_values,s=100)plt.show()scatter 绘制散点.png自动计算数据importmatplotlib.pyplotaspltx_values=list(range(1,1001)y_values=x*2forxinx_values#y_values=x*xforxinx_values#y_values=x2forxinx_valuesplt.scatter(x_values,y_values,s=40)#坐标轴的取值范围#plt.axis(0,1100,0,1100000)#依次是 xminxmax,ymin,ymaxplt.show()光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cn自动计算效果图.png随机漫步importmatplotlib.pyplotasplyfromrandomimportchoiceclassRandomWalk():def_init_(self,num_points=5000):self.num_points=num_pointsself.x_values=0self.y_values=0deffill_walk(self):#不断走,直到达到指定步数whilelen(self.x_values)self.num_points:#决定前进方向以及沿这个方向前进的距离x_direction=choice(1,-1)光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnx_distance=choice(0,1,2,3,4,5,6,7,8,9)x_step=x_direction*x_distancey_direction=choice(1,-1)y_distance=choice(0,1,2,3,4,5,6,7,8,9)y_step=y_direction*y_distance#不能原地踏步ifx_step=0andy_step=0:continuenext_x=self.x_values-1+x_stepnext_y=self.y_values-1+y_stepself.x_values.append(next_x)self.y_values.append(next_y)rw=RandomWalk()rw.fill_walk()光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnply.scatter(rw.x_values,rw.y_values,s=15)ply.show()效果图随机漫步图.png使用 Pygal 模拟掷骰子pygal 绘图.png环境安装,直接在 Pycharm 上安装插件。importpygalfromrandomimportrandintclassDie():def_init_(self,num_sides=6):self.num_sides=num_sides;defroll(self):#返回一个位于 1 和骰子面数之间的随机值光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnreturnrandint(1,self.num_sides)die=Die()results=#掷 100 次骰子,并将结果放在列表中。forroll_numinrange(10):result=die.roll()results.append(str(result)print(results)#分析结果frequencies=forvalueinrange(1,die.num_sides+1):frequency=results.count(value)frequencies.append(frequency)print(frequencies)光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cn#对结果进行可视化hist=pygal.Box()hist.title=“resultofrollingoneD61000times“hist.x_labels=1,2,3,4,5,6hist.x_title=“Result“hist.y_title=“frequencyofresult“hist.add(D6,frequencies)hist.render_to_file(die_visual.svg)使用 WebAPI1.1 安装 requests这个可以直接在 Pycharm 中安装插件,非常方便。1.2 处理 API 响应importrequests#执行 api 调用并存储响应光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnurl=https:/api.github.com/search/repositories?q=language:python&sort=starsr=requests.get(url)print(“Statuscode:“,r.status_code)#将 api 响应存储在一个变量中response_dic=r.json()#处理结果print(response_dic.keys()得到结果:Statuscode:200dict_keys(total_count,incomplete_results,items)1.3 处理响应字典#将 api 响应存储在一个变量中response_dic=r.json()#处理结果光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnprint(response_dic.keys()print(“Totalrepositories:“,response_dictotal_count)repo_dics=response_dicitemsprint(“repositoriesreturned:“+str(len(repo_dics)#研究一个仓库repo_dic=repo_dics0print(“nKeys:“,str(len(repo_dic)#forkeyinsorted(repo_dic.keys():#print(key)print(“Name:“,repo_dicname)print(“Owner:“,repo_dicownerlogin)print(“Starts:“,repo_dicstargazers_count)print(“Repository:“,repo_dichtml_url)print(“Created:“,repo_diccreated_at)光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/hadoop.aura.cn 光环大数据光环大数据 http:/hadoop.aura.cnprint(“Updated:“,repo_dicupdated_at)print(“Description:“,repo_dicdescription)得到结果:Totalrepositories:2061622repositor
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号