在实操大数据之前,我们可以先在本地进行一些小型数据库的操作,对sql和spark进行一些初步了解。本文就先介绍下mysql和workbenck的安装和使用,以及介绍python链接数据库的操作。后续文章再介绍详细的使用python对库表的sql操作,以及spark计算。
按照指示操作默认安装,在安装时,MySQL会要求我们设置一个本地登陆账号,账号名一般命为root,端口为3306,自定义一个password即可。
官方下载MySQL Installer:
(相关资料图)
下载后按照步骤安装,安装完成后启动
输入密码就可以进入啦~
官方下载链接:https://dev.mysql.com/downloads/workbench/
按照步骤进行安装,安装完成后启动
输入设置的mysql的密码进入,然后创建一个schema
创建后,在左侧Schemas的tab就能看见创建的数据库了,然后就可以在里面创建自己的tables。
由于 MySQL 服务器以独立的进程运行,并通过网络对外服务,所以,需要支持 Python 的 MySQL 驱动来连接到 MySQL 服务器。
目前,有两个 MySQL 驱动:
1. mysql-connector-python:是 MySQL 官方的纯 Python 驱动
2. MySQL-python :是封装了 MySQL C驱动的 Python 驱动
我们用python链接,所以需要pip库
install mysql-connector-python
mysql安装我们已经有了用户名和密码, 因为链接的本地数据库,所以ip:port默认是localhost:3306,在workbenck里面我们已经创建了一个数据库test。
使用代码创建数据库链接:
config = { "user" : "root", #用户名 "password" : "123456", #自己设定的密码 "host" : "127.0.0.1", #ip地址,本地填127.0.0.1,也可以填localhost "port" : "3306", #端口,本地的一般为3306 "database" : "test", #数据库名字,这里选用test}con = mysql.connector.connect(**config)# buffered = True 不设的话,查询结果没有读完会报错# raise errors.InternalError("Unread result found")mycursor = con.cursor(buffered = True)
通过执行sql语句,创建库表以及往表内插入数据:
def create_table_test(table_name): # 创建一个表 sql = "CREATE TABLE %s (id INT AUTO_INCREMENT PRIMARY KEY, \ name VARCHAR(255) , address VARCHAR(255), \ sex VARCHAR(225) , age INT(10) , sl INT(10))"%(table_name) mycursor.execute(sql) def insert_table_test(table_name): # 往表里插入一些记录 sql = "INSERT INTO " + table_name + "(name,address,sex,age,sl) VALUES(%s,%s,%s,%s,%s)" # print("sql", sql) val = ("zhangsan", "beijing", "M", 23, 30000) mycursor.execute(sql, val) val = ("lisi", "shanghai", "F", 23, 30000) mycursor.execute(sql, val) val = [("zhangsan", "shenzhen", "M", 35, 30000), ("zhangsan", "beijing", "M", 28, 30000), ("zhangsan", "aomen", "F", 30, 40000), ("zhangsan", "hongkang", "M", 35, 30000), ("zhangsan", "taiwan", "M", 32, 20000)] mycursor.executemany(sql, val) con.commit()
如果有大量数据,通过以上插入就比较麻烦, 我们也可以通过导入本地,这里就需要使用ORM技术。
ORM技术:Object-Relational Mapping,把关系数据库的表结构映射到对象上。在Python中,最有名的ORM框架是SQLAlchemy。
我们先安装SQLAlchemy:
pip install sqlalchemypip install pandas
为了方便,我们先在workbenck里创建sql_test表,
右键-->create table。
然后执行如下代码:
import pandas as pdfrom sqlalchemy import create_engineimport pymysqlexcelFile = r"F:\spark_code\my_sql_test.xlsx"def create_table_from_excel(): df = pd.DataFrame(pd.read_excel(excelFile)) engine =create_engine("mysql+pymysql://root:123456@localhost:3306/test") df.to_sql("sql_test",con=engine,if_exists="replace",index=False)
参考:
https://www.cnblogs.com/PacificOcean/p/14558449.html
https://cloud.tencent.com/developer/article/1443032
在实操大数据之前,我们可以先在本地进行一些小型数据库的操作,对sql和spark进行一些初步了解。本文就先介绍下mysql和workbenck的安装和使用,以及
1、符合题目要求的成语有以下几个:2、潸然泪下、催人泪下、肚里泪下、黯然泪下、怆然泪下、凄然泪下。3、1、潸然泪下:4、
“肚大如鼓”的戈谢病,经常不自主抽搐的亨廷顿舞蹈症,一碰易碎的“瓷娃娃”……这些少见的病名背后,是罕见病患者求医问药的艰辛不易。2023
作者:黎励团结奋进新征程,同心奋斗创伟业。由中央网信办主办的2022中国正能量“五个一百”网络精品征集评选展播活动火热进行中。本届活动立
中新网北京2月28日电(刘欢)奋进新征程的路上,总有一些人让我们感动。他们用点点星火,点燃我们对未来的信心与向往。在奋进的时代里,无数平凡
中新网3月1日电最高检1日召开新闻发布会,通报近五年来未成年人检察工作情况以及协同各方加强未成年人保护工作成效。最高检
中国日报网2月28日电据香港《南华早报》28日报道,华尔街银行业的分析师们普遍表示,中国成为世界经济唯一亮点,大中华区企业正在引领经济复苏
瓣瓣同心京津冀坚持以人民为中心,不断增强人民群众获得感,是京津冀协同发展的出发点和落脚点。九年来,三地深化基本公共服务共建共享,提升
民族日报·中国临夏网记者马正兰广通河畔,涛声依旧;文化之乡,团结和美。自古以来,广河县就有着多民族聚居、多文化交融的特殊县情。在历史
让“美丽产业”更有颜值
1、Altius无人机,是一种俄新式重型攻击无人机。2、该无人机属于重型中高空长续航无人机,搭载通用武器系统,可携带
中新网3月1日电(记者李金磊)3月1日起,2022年度个税汇算正式开始。一些人又可以领到国家的退税“红包”了,不过,也有人需要补税。2022年度个
新华社天津2月28日电题:从新春“三热”看天津滨海新区发展新华社记者毛振华、王井怀、梁姊春光无限好,奋进正当时。作为我国开发开放前沿,天
央视网消息(新闻联播):国家统计局今天(2月28日)发布2022年国民经济和社会发展统计公报。数据显示,2022年,中国经济保持增长,发展质量稳
敖蓉党的二十大报告对新时代就业工作提出了促进高质量充分就业的战略目标。这一目标展现了两个未来图景:一是实现人人都有机会就业,通过就业
夏弥来为大家解答以下的问题,射雕英雄传之铁血丹心,说一说射雕英雄传之铁血丹心的简介,现在让我们一起来看看吧!1、《射雕英
1、首先将控制面板打开,接着直接额选择网络和共享中心选项,然后再选择左边的更改适配器设置选项,再查看无线网络连接是否被禁用,如果被
以联想笔记本电脑ThinkBook14,win10系统为例,笔记本找不到wifi网络的原因如下:1、路由器处于关闭状态,没有打开路由器,所以笔记本电脑
想知道你的iPhone是连接到路由器的2 4GHz还是5GHz频段?虽然iPhone并没有提供检测网络运行频段的内置功能,但只用借助一些简单的变通方法,
iphone13屏幕自动亮怎么关闭?下面就给大家分享苹果13手机关闭屏幕自动亮教程。1、打开手机设置,点击显示与亮度2、进入页面后,将自动右侧
1、来电提醒是指手机关机或不在服务区时,在此期间内不超过24小时的来话信息都将通过来电提醒平台为您保存,待手机恢复正常后,所有期间的
1、一个是内存识别问题,一个是BIOS工作异常。解决办法是首先关机,把内存取下来,用橡皮擦亮金手指内去除金手指,再插上试试。2、如果仍然
教育硕士于1997年开始招生,培养基础教育教学和基础教育管理的高层次人才。教育类硕士分为教育硕士和教育学硕士。教育硕士报考条件:(一)中
君子端方,温润如玉《长风万里》经典台词。1。君子端方,温良如玉。2。知我者谓我心忧,不知我者谓我何求。《长风万里》: 一夕承诺一生不
都说北方美女精,南方美女多,尤其是川渝,一直被称为全国美女最多的地区。成都太古里号称是一个天然秀场,潮男靓女多到普通人去了都恨不得隐
澳大利亚“战略家”博客2月27日发表题为《中国比美国更有条件在经济分化中生存下去吗?》的文章,作者是澳大利亚战略政策研究所高级研究员戴维
1、CUE全称是CadillacUserExperience,意为“凯迪拉克用户体验”。2、凯迪拉克新一代车载信
人民日报记者丁怡婷图①:甘肃张掖临泽县平川北滩30万千瓦风电建设现场。 王将摄(人民视觉) 图②:国网浙江杭州临平区供电公司员工在
子鸣近日,满载1万吨进口钾肥的“盛威18”轮在江苏省连云港4号泊位顺利靠泊。连日来,连云港周边地区用肥需求量增多,为保障船舶计划如期兑现
人民日报记者邵玉姿新需求催生新市场,新市场带动新职业。近年来,为满足群众日益个性化、品质化的美好生活需求,一系列细分领域的新职业应运