织梦 网站地图,网站流量统计平台,淘宝客网站建设视频教程,手机投资网站第一大题
第一大题计算
给出计算连接到EC2节点的EBS的高可用性(HA)的数学公式#xff0c;如场景中所述#xff1b;计算EC2节点上的EBS的高可用性(HA)#xff1b;场景中80%的AWS EC2节点用于并行处理#xff0c;总共有100个虚拟中央处理单元(vCPUs)用于处理数据#xff0…
第一大题
第一大题计算
给出计算连接到EC2节点的EBS的高可用性(HA)的数学公式如场景中所述计算EC2节点上的EBS的高可用性(HA)场景中80%的AWS EC2节点用于并行处理总共有100个虚拟中央处理单元(vCPUs)用于处理数据使用固定工作负载和缩放工作负载来计算AWS EC2系统的系统效率(固定和缩放效率)。 利用上述资料分别以“固定工作量”和“扩展工作量”计算该电子商务集群的两个系统效率如果该电子商务公司使用的集群平均平均恢复时间(MTTR)为96小时总平均故障时间(MTTF)为900天计算集群的高可用性(HA) 一个Amazon AWS EC2 集群包含300个vCPUs。如果这些处理器的80%用于并行执行计算和处理活动计算使用“固定工作负载”和“扩展工作负载”的AWS EC2集群的系统效率(两个单独的计算)上面描述的AWS EC2集群还有一个为集群提供HA的AWS S3如果集群的总平均故障间隔时间(MTTF)为500天平均平均修复时间(MTTR)为2.5天则计算集群的系统可用性 第一大题n个xx只答若干个短语
列出四种云部署模型该题出现2次 描述管理虚拟集群的四种方法W1D2 讨论四种类型的云计算部署模型并在每种情况下描述Security和Trust的问题 描述私有云和公共云部署模型之间的三个区别W1D1 描述两种类型的可伸缩性度量以及在此场景中可能出现的问题一家银行决定在其现有的银行应用程序中添加一个新的客户关系管理(CRM)功能还在两个国家开设了新的分行这些新分行将使用相同的应用程序。 第一、二大题描述名词
第一大题和第二大题的描述名词雷同所以放一起但第三、四大题也有很多来源于前两周
第一大题描述名词
描述计算机网络中的数据完整性和数据机密性该题出现2次 描述 AWS CloudFront 描述AWS Regions和AWS Zones AWS VPC的公网子网CIDR为20.0.2.0/20计算IP数量地址写出子网可以拥有的最大EC2实例。 描述AWS可信顾问W1D3 第二大题描述名词
描述Amazon CloudWatch和AWS CloudTrail 描述模型视图控制器(MVC)和前端控制器设计模式为这两种设计模式在实际应用中的应用分别举出一个例子 第二大题
第二大题CUDA代码
关于GPU和CUDA简要说明在CUDA C编程模型中使用的五个主要步骤以解决基于主机和设备组件的GPU编程架构的异构性质编写一个简单的CUDA C程序打印“欢迎来到GPU编程世界!”使用myGPUKernel()作为CUDA C程序的内核名称并使用 分隔符启动它以打印消息“欢迎来到GPU编程世界!”并行五次(不要使用任何C迭代循环命令)。 编写一个GPU CUDA C程序内核名为“add”添加两个整数变量a和显示程序将与主机(CPU)和设备(GPU)通信的所有步骤包括内存管理活动(可以随意使用更多变量)。 关于GPU和CUDA描述使用CUDA平台编写GPU的三种方法描述GPU CUDA计算或编程中异构计算的两个特性。 两个特性找不到原文下面三选一吧 第二大题经济计算
根据上述公司收支的描述计算资本支出(CAPEX)和运营费用假设公司可以通过在AWS市场上向客户出租资产来收回所有的资本支出估算一下如果公司将其基础设施迁移到云端可以节省多少成本。 关于云经济的用图表分别描述计算传统IT成本和云计算成本的两种算法/数学模型如果一个传统IT系统的总成本为50万英镑那么它的前期资本成本为30万英镑用云计算代替传统IT模式的成本是多少? 第三大题
第三大题Map/Reduce项目涉及代码
下列Map/Reduce伪代码的结果是什么?解释它并举例说明映射器/还原器之间的信息交换 编写一个Map/Reduce Java程序来计算每个事件类别中最受欢迎的事件(即最常预订的古典音乐会爵士音乐会流行音乐会等)。包括注释来解释代码的作用。您还可以使用伪代码来编写规范或者用图表来说明输入、映射、减少和输出块之间的数据流。 // 定义Booking Reservation类
class BookingReservation {String eventID;String userID;String eventCategory;String action;Date time;// 构造函数和访问方法// 省略其他方法和字段
}// Map阶段
class MapClass extends MapperObject, Text, Text, BookingReservation {public void map(Object key, Text value, Context context) throws IOException, InterruptedException {// 解析日志行BookingReservation reservation parseLog(value.toString());// 输出键值对以事件类别作为键context.write(new Text(reservation.eventCategory), reservation);}private BookingReservation parseLog(String log) {// 解析日志行并创建BookingReservation对象// 省略实现细节}
}// Reduce阶段
class ReduceClass extends ReducerText, BookingReservation, Text, Text {public void reduce(Text key, IterableBookingReservation values, Context context) throws IOException, InterruptedException {// 使用computeMax方法计算每个事件类别中最受欢迎的事件BookingReservation mostPopularEvent computeMax(values);// 输出结果以事件类别作为键context.write(key, new Text(mostPopularEvent.getEventID()));}private BookingReservation computeMax(IterableBookingReservation values) {// 实现computeMax方法返回列表中最常见的事件// 省略实现细节}
}// 配置和运行Map/Reduce任务
public static void main(String[] args) throws Exception {Configuration conf new Configuration();Job job Job.getInstance(conf, PopularEvents);job.setJarByClass(YourClassName.class);job.setMapperClass(MapClass.class);job.setReducerClass(ReduceClass.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(Text.class);// 设置输入和输出路径FileInputFormat.addInputPath(job, new Path(inputPath));FileOutputFormat.setOutputPath(job, new Path(outputPath));System.exit(job.waitForCompletion(true) ? 0 : 1);
}第三大题计算主要是阿姆达尔定律
关于Map/Reduce的性能定义并行计算中的加速概念使用Amdahl定律计算用10个处理器运行此作业时可实现的最大加速注意8%的计算作业必须顺序执行。 关于Map/Reduce的性能描述阿姆达尔定律以及顺序计算和并行计算之间的区别。说出Hadoop中必须按顺序执行的一个阶段如果95%的计算作业必须顺序执行那么在跨8个处理器运行该作业时可实现的最大加速是多少?同样对于同一个作业当跨1000个处理器运行该作业时可实现的最大加速是多少?用阿姆达尔定律来回答 描述Flynn对计算机体系结构的四种分类。W1D1用阿姆达尔定律计算提高使用10个处理器并行运行20%应用程序的系统的性能速度 在该场景中Hadoop使用10个mapper和2个reducer来完成计算每个Mapper发出多少中间键:值对?有多少唯一的键被馈送到每个Reducer? 待完成 第三大题也与map有关但不是代码和计算
涉及到Map/Reduce的Combiner什么是Combiner用处?它和减速器有什么不同?使用组合器是可选的还是强制的简要说明组合器必须遵守的两条规则。 关于Map-Reduce的数据过滤Map-Reduce作业中数据过滤的目的是什么?给出一个数据过滤的例子为什么数据过滤是“Mapper唯一的工作” 第三大题HDFS描述
涉及Hadoop计算作业执行用箭头(→)连接Hadoop计算任务对应负责的守护进程 关于Hadoop分布式文件系统的NameNode在HDFS中的职责是什么用合适的图表解释HDFS的写操作(例如如何创建一个新文件并将数据写入HDFS)为什么HDFS默认为每个块存储三个单独的副本?为什么在大型集群中将三个副本分散到不同的物理机架上是有用的? 关于分布式处理系统的弹性在分布式系统的背景下什么是“五九可用性”?请解释这与“单点故障”的概念之间的关系以及这可能对分布式系统产生的负面影响HDFS (Hadoop Distributed File System)如何检测数据块损坏如果Map任务中的一个失败Map/Reduce作业是否会完成?应用程序主机和节点管理器如何检测Map任务的失败并对其作出反应? 啥玩意儿啊没有原文 第四大题
第四大题DNS描述
什么是内容交付网络中的DNS缓存DNS缓存的两个好处。 与内容交付网络(cdn)有关什么是内容分发网络(CDN)?解释内容交付网络是如何工作的cdn中的DNS重定向是什么?简要解释不同的DNS重定向类型及其优缺点点对点(P2P)网络是什么?解释P2P网络相对于客户机-服务器网络的三个好处。 第四大题数据库描述 关于Map/Reduce之外的大数据平台什么是内存处理?讨论Hadoop Map/Reduce与现代内存处理系统(如Apache Spark)相比的的主要性能限制用一个例子说明两者的区别在Apache Spark的背景下什么是弹性分布式数据集(RDD) ?解释两种类型的RDD操作并为每种操作提供一个示例例如如何通过编程操作创建和修改RDD。 与云数据库有关解释以下这些用于实现数据分区和复制的技术内存缓存、读写分离、High可用性、集群和数据分片SQL数据库以牺牲分区为代价提供了强一致性和可用性而不同的NoSQL数据库采用不同的基于cap的权衡那么亚马逊发电机系统做了哪些权衡? 与云数据库有关为什么在云数据库中使用数据分区和复制很重要在数据访问上下文中解释强一致性和最终一致性之间的区别用例子来解释 关于分布式云数据库的解释NoSQL数据库与传统关系数据库的区别请在ACID事务属性上下文中解释这一点使用NoSQL数据库的好处是什么说出使用NoSQL数据库(例如Cassandra)而不是使用传统SQL关系数据库的两个原因什么是布鲁尔CAP定理解释CAP的三个特性NoSQL数据库是否满足CAP的所有三个支柱如果没有解释为什么没有以及放松这些限制的好处是什么。 关于Casandra的一个NoSQL数据库解释卡桑德拉戒指上的复制因子是指什么这对Cassandra数据存储的弹性有什么影响假设你管理一个Cassandra数据库你面临着可伸缩性问题即当前的Cassandra节点集不足以处理你的应用程序的需求如何增加Cassandra数据库的容量用弹性来解释这一点以及它对性能的影响Cassandra有单点故障吗 第四大题其它描述
传统的流处理系统和微批流处理系统有什么区别? 关于分布式图处理的解释Pregel在并行图计算时使用“像顶点一样思考”模型的方式给出一个适合这个模型的图算法的例子什么是图分区为什么有必要讨论图划分在分布式图处理系统中的作用图分区和性能之间的关系是什么错误的分区决策会导致更差的性能吗如果是为什么