第7单商品推荐案例 Ver1.2-20221118

Imagemap
第7单商品推荐案例
Ver1.2-20221118概述训练要点回顾并熟练使用python进行数据采集熟练掌握sqoop的使用,将数据从mysql采集到hive熟练掌据在hive上完成数据处理熟练掌握sqoo的使用,将数据从hive转存到mysql训练数据据的可视化,将mysql的数据取出并完成可视化需求说明1,本实训最终要实现智能推荐商品功能,能够将商品推送到多终端应用(WEB,APP ...2,本实训目前要实现的功能是通过同学采集商品数据,分析商品数据,对商品进行统计, ...实现步骤1,数据采集:使用scrapy框架实现电商网站的数据采集,存入mysql数据库2,数据转存:使用sqoop将mysql的数据转存到hive库中3,数据分析:在hive中使用HSQL完成数据的统计分析4,数据存储:使用sqoop将hive的数据转存到mysql中5,数据可视:使用python将mysql的结果数据显示出来并上传到web上作业要求1,对实训目前要实现的功能进行描述、架构设计、详细设计2,对实训过程中源码、操作步骤、运行结果截图3,对过程出现的问题,如何处理进行收集4,整理上述内容,按照实训报告模板完成报告内容实训报告实训报告模板模板下载流程设计数据采集python采集数据到DB采集到mysql采集到Mongodb数据存储使用sqoop转换数据到hdfs转移到hive转换到hbase数据分析使用hive分析数据生成hive结果使用hbase查询和处理数据生成hbase结果数据存储使用sqoop将hive结果转移数据到mysql转移到mysql使用sqoop将hbase结果转移到mysql转移到mysql数据可视将mysql中的结果数据显示到web上方案实现库表设计在mysql上创建采集表CREATE TABLE `test`.`goods_data` (
  `mi ...在mysql上创建收集表CREATE TABLE `wc_goods_name` (
  `mid` i ...数据采集python采集到mysqlhttps://gitee.com/big-data-lab/share/tre ...数据存储mysql采集到hive以下命令中'张三'需更换为本人的中文姓名,需与采集数据时使用的名字一致sqoop import   --connect "jdbc:mysql://h ...数据分析hive上词频统计use myname;
drop table wc_goods_name;
cr ...数据存储hive转存到mysqlsqoop export --connect "jdbc:mysql://hom ...数据可视jupyter上展示数据打开jupyterhttp://home.hddly.cn:8888 密码:12345678导入bigdata库File->New->Terminal,运行如下:首次安装:pip install bgutils-hddly更新:pip install --upgrade bgutils-hddly创建脚本进入目录:/worker/C4/班级名称/选择+号->NodeBook->Python3(ipykernel)右击新生成的文件:Untitled.ipynb->Rename->将文件名改为: ...如图在右侧的文件内容框中复制粘贴下方的脚本,根据脚本中的提示修改内容如图编写脚本备注:以下使用gitee.com,需要先注册并登陆https://gitee.com/big-data-lab/share/blo ...结果检视http://home.hddly.cn:90/stud/P022002/查看该目录下是否含有本人学号的图片文件版本历史Ver1.0-20221015初始版本,发布项目和实训报告模板Ver1.1-20221020脚本使用gitee.com的Ver1.2-20221118修复gitee源码有误的地址
hide
第7单商品推荐案例
Ver1.2-20221118
hide
方案实现