hadoop

  • 将Hadoop源码转作eclipse工程

    将Hadoop源码转作eclipse工程下载hadoop源码,可以从官网hadoop.apache.org,或者通过命令:git clone git://git.apache.org/hadoop-common.git

  • 漫步云中网络

    漫步云中网络张 华, 高级软件工程师, IBM 龚 永生, 资深软件工程师, IBM 简介: 在生产环境中,云中的网络通常被划分为公共网络、管理网络和服务网络。本文首先通过三个小试验向您介绍了如何通过 TAP/TUN、NAT、Linux Bridge、VLAN 等技术实现云中网络的一般原理。有了这些基础,相信您会对接下来介绍的一个具体的 OpenStack 云的示例网络配置倍感亲切。同理,这些基础也将助您在其他云中网络中轻松漫步。

  • Hadoop 1.2.1编译Eclipse插件

    Hadoop 1.2.1编译Eclipse插件/src/contrib/eclipse-plugin/build.xml 1)取消ivy-download: 2)添加将要打包到plugin中的第三方jar包列表:

  • Hadoop Summit 2013见闻:看完基本了解整个Hadoop生态圈格局和趋势了

    Hadoop Summit 2013见闻:看完基本了解整个Hadoop生态圈格局和趋势了原文出处: 钱五哥の共享空间 今天参加了3个keynotes,42个session中的8个,和一大堆厂商讨论技术,真是信息大爆炸的一天。

  • HDFS写入和读取流程

    HDFS写入和读取流程您还未登录!|登录|注册|帮助 首页 业界 移动 云计算 研发 论坛 博客 下载 更多 guisu,程序人生。 能干的人解决问题。智慧的人绕开问题(A clever person solves a problem. A wise person avoids it)

  • Hadoop在CentOS下的单机配置

    Hadoop在CentOS下的单机配置前言的前言 如果你做某件从未接触过的事的时候很纠结很曲折,那么为你自己高兴吧,你能学到很多东西! 以下的东西都是贴图,所以你们只有手敲了。我也不清楚这个东西是不是应该花很多时间去做,有得有失,某些付出不知道到底值多少。据//说一下午都能配出来,谁叫我傻呢,谁叫我蠢呢,不过该走的路咱还是踏实点走吧,不去跟人比。所以现在我把细节写出来,供大家参考,让你能在两小时内完成。希望它能帮助你学习,而不是让你变得更依赖。如有不对的地方请指正,我也是初学者。谢谢!

  • Hadoop版本梳理

    Hadoop版本梳理由于Hadoop版本混乱多变,因此,Hadoop的版本选择问题一直令很多初级用户苦恼。本文总结了Apache Hadoop和Cloudera Hadoop的版本衍化过程,并给出了选择Hadoop版本的一些建议。

  • Hadoop集群_Hadoop安装配置

    Hadoop集群_Hadoop安装配置Hadoop集群(第5期)_Hadoop安装配置 1、集群部署介绍 1.1 Hadoop简介   Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。

  • Hadoop知识分享文稿 ( by quqi99 )

    Hadoop知识分享文稿 ( by quqi99 ) - 技术并艺术着您还未登录!|登录|注册|帮助 首页 业界 移动 云计算 研发 论坛 博客 下载 更多 技术并艺术着 张华的技术Blog

  • 基于Hadoop 2.2.0的高可用性集群搭建步骤(64位)

    基于Hadoop 2.2.0的高可用性集群搭建步骤(64位) 内容概要: CentSO_64bit集群搭建, hadoop2.2(64位)编译,安装,配置以及测试步骤 新版亮点:基于yarn计算框架和高可用性DFS的第一个稳定版本。

  • CentOS的Hadoop集群配置

    CentOS的Hadoop集群配置CentOS的Hadoop集群配置(一) 参考资料: http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

  • OpenStack_Hadoop

    OpenStack_Hadoop针对OpenStack、Hadoop种不同领域软件的分析 1 OpenStack 1.1 简介 一款管理分布在多台物理机器上的多台虚拟机的开源虚拟机管理软件。 虚拟化是指在同一台物理机器上提供多台虚拟机器的技术。

  • hadoop

    hadoop hadoop Table of Contents 1 hadoop 1.1 FAQ 1.1.1 Hadoop可以用来做什么 1.1.2 Hadoop包括哪些组件 1.1.3 CDH和Apache Hadoop的关系

  • hdfs_shell

    hdfs_shellHDFS File System Shell Guide Table of contents 1 Overview............................................................................................................................3

  • hdfs_design

    hdfs_designHDFS Architecture by Dhruba Borthakur Table of contents 1 2 Introduction .......................................................................................................................3 Assumptions and Goals .....................................................................................................3

  • mapred_tutorial

    mapred_tutorialMap/Reduce Tutorial Table of contents 1 2 3 4 5 Purpose...............................................................................................................................2 Pre-requisites......................................................................................................................2 Overview............................................................................................................................2 Inputs and Outputs............................................................................................................. 3 Example: WordCount v1.0................................................................................................ 3

  • mapreduce

    mapreduce-osdi04MapReduce: Simplified Data Processing on Large Clusters Jeffrey Dean and Sanjay Ghemawat

  • 深入理解Hadoop集群和网络

    深入理解Hadoop集群和网络原文出处: bradhedlund 译文出处: kickxxx 本文侧重于Hadoop集群的体系结构和方法,以及它与网络和服务器基础设施的关系。文章的素材主要来自于研究工作以及同现实生活中运行Hadoop集群客户的讨论。如果你也在你的数据中心运行产品级的Hadoop集群,那么我希望你能写下有价值的评论。

  • Notes for Hadoop the definitive guide

    Notes for Hadoop the definitive guide1. Introduction to HDFS 1.1. HDFS Concepts 1.1.1. Blocks l HDFS too has the concept of a block, but it is a much larger unit 64 MB by default.

  • JAVA线程池管理及分布式HADOOP调度框架搭建

    JAVA线程池管理及分布式HADOOP调度框架搭建平时的开发中线程是个少不了的东西,比如tomcat里的servlet就是线程,没有线程我们如何提供多用户访问呢?不过很多刚开始接触线程的开发攻城师却在这个上面吃了不少苦头。怎么做一套简便的线程开发模式框架让大家从单线程开发快速转入多线程开发,这确实是个比较难搞的工程。