博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop使用场景
阅读量:5290 次
发布时间:2019-06-14

本文共 424 字,大约阅读时间需要 1 分钟。

Hadoop使用场景:

  1. 大数据量存储:分布式存储
  2. 日志处理: Hadoop擅长这个
  3. 海量计算: 并行计算
  4. ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
  5. 使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
  6. 机器学习: 比如Apache Mahout项目
  7. 搜索引擎:hadoop + lucene实现
  8. 数据挖掘:目前比较流行的广告推荐
  9. 大量地从文件中顺序读。HDFS对顺序读进行了优化,代价是对于随机的访问负载较高。
  10. 数据支持一次写入,多次读取。对于已经形成的数据的更新不支持。
  11. 数据不进行本地缓存(文件很大,且顺序读没有局部性)
  12. 任何一台服务器都有可能失效,需要通过大量的数据复制使得性能不会受到大的影响。
  13. 用户细分特征建模
  14. 个性化广告推荐
  15. 智能仪器推荐

转载于:https://www.cnblogs.com/pejsidney/p/6955473.html

你可能感兴趣的文章
TFS 服务端默认端口更改
查看>>
C#字符串string的常用使用方法
查看>>
3.6.使用STC89C52控制MC20解析GPS的经纬度数据上传到指定服务器
查看>>
Could not load driverClass com.mysql.jdbc.Driver错误
查看>>
路飞学城-爬虫集训营-第一章
查看>>
技术人员应真正学会的第二课程
查看>>
[洛谷P3628] [APIO2010]特别行动队
查看>>
《集体智慧编程》第12章:算法总结
查看>>
Hbase配置运行
查看>>
【转载】"30年---我与赛灵思FPGA的故事”:ZYNQ-7000使用总结(6)——AXI接口简述...
查看>>
Jenkins系列-Jenkins通过Publish over SSH插件实现远程部署
查看>>
ERR: Failed to complete setup of assembly (hr = 0x8007000b). Probing terminated.
查看>>
Java 中int、String的类型转换
查看>>
Oracle 查看正在执行的SQL语句
查看>>
HDU 1069 Monkey and Banana
查看>>
一个类有两个方法,其中一个是同步的,另一个是非同步的; 现在又两个线程A和B,请问:当线程A访问此类的同步方法时,线程B是否能访问此类的非同步方法?...
查看>>
consonant combination
查看>>
堆排序
查看>>
elk报错解决
查看>>
centos6更改时区
查看>>