当前位置: 首页 > news >正文

一个好网站建设怎么做网站官方电话

一个好网站建设,怎么做网站官方电话,建设部执业资格注册中心网站查询,北京网站建设seo公司哪家好目录 一、大数据概论 1.大数据的概念 2.大数据的特点 3.大数据应用场景 二、Hadoop概述 1.Hadoop定义 2.Hadoop发展历史 3.Hadoop发行版本 4.Hadoop优势 5.Hadoop1.x/2.x/3.x 6.HDFS架构 7.Yarn架构 8.MapReduce架构 9.大数据技术生态体系 一、大数据概论 1.大数…目录 一、大数据概论 1.大数据的概念 2.大数据的特点 3.大数据应用场景 二、Hadoop概述 1.Hadoop定义 2.Hadoop发展历史 3.Hadoop发行版本 4.Hadoop优势 5.Hadoop1.x/2.x/3.x 6.HDFS架构 7.Yarn架构 8.MapReduce架构 9.大数据技术生态体系 一、大数据概论 1.大数据的概念 指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据主要解决海量数据的采集、存储和分析计算问题。 顺序存储单位bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。 1Byte8bit1KB1024Byte1MB1024KB...... 2.大数据的特点 ①Volume大量典型个人计算机硬盘容量为TB量级一些大型企业可以达到EB量级。 ②Velocity高速根据IDC的数字宇宙报告预计2025年全球数据使用量可以达到163ZB。 ③Variety多样数据可以分为结构化数据和非结构化数据。结构化数据主要以便于存储的数据库/文本为主非结构化数据包含了网络日志、音频、视频、图片、地理位置信息等多类型数据对于数据的处理能力具有更高要求。 ④Value低价值密度价值密度的高低与数据总量大小成反比。快速对有价值数据“提纯”成为目前大数据背景下待解决的难题。 3.大数据应用场景 抖音、电商广告推荐、零售策略、保险海量数据挖掘及风险预测...、金融多维体现用户推荐、人工智能5G物联网方面等。 二、Hadoop概述 1.Hadoop定义 Hadoop是一个由Apache基金会所开发的分布式系统基础架构主要解决海量数据的存储和海量数据的分析计算问题。 广义上来说Hadoop通常是指一个更广泛的概念——Hadoop生态圈。 2.Hadoop发展历史 ①Hadoop创始人Doug Cutting为实现Google类似的全文搜索功能在Lucene框架基础上进行优化升级查询引擎和索引引擎。 ②2001年底Lucene成为Apache基金会的一个子项目。 ③对于海量数据的场景Lucene框架面对与Google同样的困难存储海量数据困难检索海量速度慢。 ④学习和模仿Google解决这些问题的办法微型版Nutch。 ⑤Google是Hadoop的思想源泉 ⑥2003-2004年Google公开GFs和MapReduce思想细节Doug Cutting等人使用两年时间实现使Nutch性能飙升。 ⑦Hadoop作为Lucene子项目Nutch一部分正式引入Apache。 ⑧2006年Map-Reduce和Nutch Distributed FileSystem纳入Hadoop项目Hadoop正式诞生。 3.Hadoop发行版本 Apache2006、Cloudera2008、Hortonworks2011。 4.Hadoop优势 ①高可靠性Hadoop底层维护多个数据副本即使Hadoop某个计算元素或存储出现故障也不会导致数据丢失。 ②高扩展性在集群间分配任务数据可方便的扩展数以千计的结点。可动态增加和删除服务器。 ③高效性在MapReduce的思想下Hadoop是并行工作的以加快任务处理速度。可以实现集群工作。 ④高容错性能够自动将失败的任务重新分配。就是在执行过程中如果遇到任务无法执行将会把这个失败的任务重新分配到其他服务器这个被分配的服务器需要具有相关资源。 5.Hadoop1.x/2.x/3.x ①Hadoop1.x组成 MapReduce计算资源调度 HDFS数据存储 Common辅助工具 ②Hadoop2.x组成 MapReduce计算 Yarn资源调度 HDFS数据存储 Common辅助工具 ③Hadoop3.x组成组成上和2.x相同但是细节方面存在差异。 MapReduce计算 Yarn资源调度 HDFS数据存储 Common辅助工具 6.HDFS架构 Hadoop Distributed File System简称HDFS是一个分布式文件系统。 ①NameNodenn存储文件的元数据如文件名、文件目录、文件属性生成时间、副本数、文件权限以及每个文件的块列表和块所在的DataNode等。 ②DataNodedn在本地文件系统存储文件块数据以及块数据的校验和。 ③Secondary NameNode2nn每隔一段时间对NameNode元数据备份。 7.Yarn架构 Yet Anothor Resource Negotiator简称YARN是一种资源协调者是Hadoop的资源管理器。 ①ResourceManagerm整个集群资源内存、CPU等的总负责。 ②NodeManagernm单个节点服务器资源总和。 ③ApplicationMasteram单个任务运行的总和。 ④Container容器相当于一台独立服务器里面封装了任务运行所需要的资源比如内存、CPU、磁盘、网络等。一个Container可以运行1-8g内存。 Tips客户端可以有多个集群上可以运行多个ApplicationMaster每个NodeManager可以有多个Container执行。 过程client提交作业给ResourceManagerResourceManager进行节点服务器分配在ResourceManager中创建Container在Container里面运行任务。 8.MapReduce架构 MapReduce将计算过程分为两个阶段Map和Reduce。 Map阶段并行处理输入数据 Reduce阶段对Map结果进行汇总。 9.大数据技术生态体系 数据库结构化数据→Sqoop数据传递→HDFS文件传输→Yarn资源管理... 文件日志半结构化数据→Flume日志收集→HDFS文件传输→HBase非关系型数据库→Yarn资源管理... 视频、PPT等非结构数据→Kafka消息队列...
http://www.pierceye.com/news/618787/

相关文章:

  • 湖北定制型网站建设微信公众平台网页版
  • 需要做网站的公司有哪些免费网页模板之家
  • 淘客网站怎么备案合肥在线官网
  • 马上飞做的一些网站免费自助建站系统有哪些
  • 建网站投放广告赚钱wordpress全屏弹窗插件
  • 电子商务公司网站模版通辽网站建设公司
  • 国外社交网站建设苏州seo门户网
  • 小程序建站公司唐山网页搜索排名提升
  • 网站后台模板北京网络营销方案
  • 网站如何不被百度搜到浙江网站怎么做推广
  • 网站建设主机类型怎么选diy电子商城网站
  • 中文域名 怎么做网站门户网站建站系统
  • 网站上的个人词条怎么做的做网站推广有用吗
  • 定兴县住房和城乡建设局网站河南省新闻奖
  • 江西省建设工程协会网站查询郑州网站建设一汉狮网络
  • 网站是否含有seo收录功能素材下载平台网站源码
  • 西宁个人网站建设不错的网站建设
  • 海南综合网站两学一做电视夜校做网店网站
  • wordpress分类页面空白网站建设优化哪家好
  • 宁波模板建站哪家服务专业wordpress 神箭手
  • 一张图片网站代码视频生成链接在线工具
  • 网站品牌推广浙江手机版建站系统开发
  • 网站后台密码在哪个文件建站报价表
  • 昌乐营销型网站建设个人管理系统
  • 手机网站开发位置定位天津和平做网站公司
  • 搜搜提交网站入口国外wordpress空间
  • python 做网站 数据库做企业官网还有必要吗
  • 数据录入网站开发安阳县实验中学
  • 网站 风格镜子厂家东莞网站建设
  • 做网站策划需要用什么软件网站建设 好发信息网