Hadoop序列化-------总结-白红宇

Hadoop序列化-------总结

阅读量：6914 次

发布时间：2019-06-27

本文共 1036 字，大约阅读时间需要 3 分钟。

1.序列化：

1.1序列化（serialization）是指将内存中的对象转化为字节流

1.2反序列化（Deserialization）是序列化的逆过程，将字节流转化为内存中对象（结构化对象）。

1.3java中序列化是实现Serializable接口（java.io.serializable

2.Hadoop中序列化：

2.1.实现Writable接口（该接口继承了serializable接口）

2.2hadoop中序列化的作用：

1.高效的使用存储空间

2.快速：读写数据的额外开销小

3.进程之间的通信

4.永久存储

2.3hadoop节点之间的通信

节点1（消息序列化为二进制流）---------》节点2（二进制流反序列化为消息）

2.4Writable接口

1.是根据DataInput和DataOutput实现的简单，有效的序列化对象

2.MapReduce中的key，value（自定义的数据类型）必须实现Writable接口

3.MapReduce中的key必须实现WritableComparable接口（MR默认且只能对key进行排序）

4.常见的Writable实现类

Writable实现 java基本类型

Text String

BooleanWritable boolean

ByteWritable byte

.... .....

2.5自定义的数据类型

class KpiWritable implements Writable{

Long f1;

Long f2;

/**

* 上下字段的顺序必须一致：序列化和反序列化中字段的顺序

* @param in

* @throws IOException

@Override

//readFiles是把输入流字节反序列化

public void readFields(DataInput in) throws IOException {

this.f1= in.readLong();

this.f2= in.readLong();

}

@Override

//write是把每个对象序列化到输出流

public void write(DataOutput out) throws IOException {

out.writeLong(f1);

out.writeLong(f2);

}

转载于:https://blog.51cto.com/hellowode/1367730

你可能感兴趣的文章

Linux后门入侵检测工具，附bash漏洞解决方法

查看>>

微软的这项新技术证明深度学习还能更“深入”

查看>>

LoadRunner测试ajaxweb程序攻略

美国两大有线电视运营商达成无线服务合作 Verizon的大麻烦来了？

查看>>

Qt之QNetworkInterface

查看>>

Sentry 8.17.0 发布，Python 实时日志平台

《开源思索集》一开放源码是开源软件吗？ - 简书

查看>>

Ubuntu Touch将支持用户数据加密：目前暂无时间表

查看>>

《金蝶ERP—K/3标准财务模拟实训（11.X版）》——导读

查看>>

开发者必备：基于 Linux 生态的十大AI开源框架盘

查看>>

《基于ArcGIS的Python编程秘笈（第2版）》——2.10　更新图层的符号系统

查看>>

SAP的ABAP屏幕程序如何使用Table Control进行数据交互

查看>>

Visual Studio 将集成 Cordova 支持跨平台开发

查看>>

这些方法助你优化 Android 启动速度

查看>>

《简明电路分析》——2.4节单口网络

查看>>