作者:民工肖某

以下的内容可能比较零散,主要为了记录。

4月份

ü  Hadoop分块。将文件划分为block,数据上传时HDFS分块,块大小由hadoop-default.xml进行设置,默认每块64M//物理划分;由maptask任务重新getsplit的数量,实际是maptask的个数是由splits的长度决定的

ü  datastage ,整体架构,引擎层,原数据层,dbms,共存的组件

ü  平台及元数据。元数据(传感器/web日志/RDBMS/社交/云/文件/office文档)à事件处理(企业信息管理工具:数据就按摩、数据发现、数据分析、数据清理、数据集成-ETL/数据虚拟化、数据隐私、数据审计、数据保护)à接口1(nosql数据库/hadoop-复杂分析);接口2(EDW数据仓库和数据市场);接口3(DW-结构化数据);接口4(DM)à数据虚拟化(data virtualization)à应用1(定制MR/MR BI/基于搜索的BI):接口1;应用2(定制MR/MR BI/基于搜索的BI/BI工具平台+数据可视化):接口2、接口3、接口4(BI工具平台+数据可视化)

ü  sahara架构:horizon-GUI;keystone-用户权限;nova-配置虚机;glance-虚机镜像(OS+hadoop);swift-作业存储;目标提供analystic-service;

ü  restful API。http无状态;rest有状态;包含:URL;媒体类型(json/xml/yaml);资源操作(put/get/post/delete)

ü  linux命令:tar –xzvf xxxx

ü  一号店的上线与CMDB。IDC上线(上架/硬件init/装机)-部署(资源分配/上架/监控/日志/用户/发布init)—对接CMDB API—业务部署(业务配置/业务发布/业务监控);装机(mac-管理IP-IPMI-初始化raid、bios-选择模板-装机-资源池)-资源池(上架-服务-维护-回收)-CMDB(业务变更-人工校对-自动化测试//业务IP关系/业务测试脚本—发布策略puppet)

ü  原生ATS(apache traffic server)- 冷热分区,混合存储,分块+LRU算法+全局中间层+配置比例:内存:SSD:SATA=1:10:100;3层架构=LVS+Haproxy+ATS;单集群200台,4线程 4G+50% CPU

ü  比较iscsi和FC san、FCoE;iscsi负载最低;协议开销小;iscsi吞吐率高-读写块;CPU相似;

 

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据