2、client端按128mb的块切分文件。client将namenode返回的分配的可写的datanode列表和data数据一同发送给最近的第一个datanode节点,此后client端和namenode分配的多个datanode构成pipeline管道,client端向输出流对象中写数据。client每向第一个datanode写入一个packet,这个packet便会直接在pipeline里传给第二个、第三个…datanode。
3、每个datanode写完一个块后,会返回确认信息。
4、写完数据,关闭输输出流。发送完成信号给namenode。
