




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、實(shí)驗(yàn)2 熟悉常用的HDFS操作實(shí)驗(yàn)手冊(cè)實(shí)驗(yàn)2熟悉常用的HDFS操作1 實(shí)驗(yàn)?zāi)康?.理解HDFS在Hadoop體系結(jié)構(gòu)中的角色;2.熟練使用HDFS操作常用的Shell命令;3.熟悉HDFS操作常用的Java API。2 實(shí)驗(yàn)平臺(tái)操作系統(tǒng):LinuxHadoop版本:2.6.0或以上版本JDK版本:1.6或以上版本Java IDE:Eclipse3 實(shí)驗(yàn)內(nèi)容和要求1. 編程實(shí)現(xiàn)以下指定功能,并利用Hadoop提供的Shell命令完成相同任務(wù):提示:1) 部分Shell命令的參數(shù)路徑只能是本地路徑或者HDFS路徑。2) 若Shell命令的參數(shù)既可以是本地路徑,也可以是HDFS路徑時(shí),務(wù)必注意區(qū)分。
2、為保證操作正確,可指定路徑前綴 hdfs:/ 或者 file:/3) 注意區(qū)分相對(duì)路徑與絕對(duì)路徑4) 具體命令的說明可參考教材或 /docs/stable/hadoop-project-dist/hadoop-common/FileSystemShell.html(1) 向HDFS中上傳任意文本文件,如果指定的文件在HDFS中已經(jīng)存在,由用戶指定是追加到原有文件末尾還是覆蓋原有的文件;Shell命令:檢查文件是否存在: ./hdfs dfs -test -e text.txt(執(zhí)行完這一句不會(huì)輸出結(jié)果,需要繼續(xù)輸入命令" echo $?&
3、quot;)追加命令: ./hdfs dfs -appendToFile local.txt text.txt覆蓋命令1: ./hdfs dfs -copyFromLocal -f local.txt text.txt覆蓋命令2: ./hdfs dfs -cp -f file:/home/hadoop/local.txt text.txt也可以使用如下命令實(shí)現(xiàn):(如下代碼可視為一行代碼,在終端中輸入第一行代碼后,直到輸入 fi 才會(huì)真正執(zhí)行):if $(./hdfs dfs -test -e text.txt);then $(./hdfs dfs -appendToFile local.txt
4、 text.txt);else $(./hdfs dfs -copyFromLocal -f local.txt text.txt);fiJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Configuration conf, String path) throws IOException FileSystem fs =
5、FileSystem.get(conf); return fs.exists(new Path(path); /* * 復(fù)制文件到指定路徑 * 若路徑已存在,則進(jìn)行覆蓋 */ public static void copyFromLocalFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path localPath = new Path(localFilePath); Path remote
6、Path = new Path(remoteFilePath); /* fs.copyFromLocalFile 第一個(gè)參數(shù)表示是否刪除源文件,第二個(gè)參數(shù)表示是否覆蓋 */ fs.copyFromLocalFile(false, true, localPath, remotePath); fs.close(); /* * 追加文件內(nèi)容 */ public static void appendToFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException FileSystem f
7、s = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); /* 創(chuàng)建一個(gè)文件讀入流 */ FileInputStream in = new FileInputStream(localFilePath); /* 創(chuàng)建一個(gè)文件輸出流,輸出的內(nèi)容將追加到文件末尾 */ FSDataOutputStream out = fs.append(remotePath); /* 讀寫文件內(nèi)容 */ byte data = new byte1024; int read = -1; while ( (read = in.read(d
8、ata) > 0 ) out.write(data, 0, read); out.close(); in.close(); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String localFilePath = "/home/hadoop/text.txt" / 本地路
9、徑String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑String choice = "append" / 若文件存在則追加到文件末尾/String choice = "overwrite" / 若文件存在則覆蓋try /* 判斷文件是否存在 */Boolean fileExists = false;if (HDFSApi.test(conf, remoteFilePath) fileExists = true;System.out.println(remoteFilePat
10、h + " 已存在."); else System.out.println(remoteFilePath + " 不存在.");/* 進(jìn)行處理 */if ( !fileExists) / 文件不存在,則上傳HDFSApi.copyFromLocalFile(conf, localFilePath, remoteFilePath);System.out.println(localFilePath + " 已上傳至 " + remoteFilePath); else if ( choice.equals("overwrite&q
11、uot;) ) / 選擇覆蓋HDFSApi.copyFromLocalFile(conf, localFilePath, remoteFilePath);System.out.println(localFilePath + " 已覆蓋 " + remoteFilePath); else if ( choice.equals("append") ) / 選擇追加HDFSApi.appendToFile(conf, localFilePath, remoteFilePath);System.out.println(localFilePath + "
12、 已追加至 " + remoteFilePath); catch (Exception e) e.printStackTrace();(2) 從HDFS中下載指定文件,如果本地文件與要下載的文件名稱相同,則自動(dòng)對(duì)下載的文件重命名;Shell命令:if $(./hdfs dfs -test -e file:/home/hadoop/text.txt);then $(./hdfs dfs -copyToLocal text.txt ./text2.txt); else $(./hdfs dfs -copyToLocal text.txt ./text.txt); fiJava代碼:imp
13、ort org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 下載文件到本地 * 判斷本地路徑是否已存在,若已存在,則自動(dòng)進(jìn)行重命名 */ public static void copyToLocal(Configuration conf, String remoteFilePath, String localFilePath) throws IOException FileSystem fs = FileSystem.get(c
14、onf); Path remotePath = new Path(remoteFilePath); File f = new File(localFilePath); /* 如果文件名存在,自動(dòng)重命名(在文件名后面加上 _0, _1 .) */ if (f.exists() System.out.println(localFilePath + " 已存在."); Integer i = 0; while (true) f = new File(localFilePath + "_" + i.toString(); if (!f.exists() loca
15、lFilePath = localFilePath + "_" + i.toString(); break; System.out.println("將重新命名為: " + localFilePath); / 下載文件到本地 Path localPath = new Path(localFilePath); fs.copyToLocalFile(remotePath, localPath); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = n
16、ew Configuration(); conf.set("","hdfs:/localhost:9000");String localFilePath = "/home/hadoop/text.txt" / 本地路徑String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑try HDFSApi.copyToLocal(conf, remoteFilePath, localFilePath);System.out.println(
17、"下載完成"); catch (Exception e) e.printStackTrace();(3) 將HDFS中指定文件的內(nèi)容輸出到終端中;Shell命令:./hdfs dfs -cat text.txtJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 讀取文件內(nèi)容 */ public static void cat(Configuration conf, String r
18、emoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); FSDataInputStream in = fs.open(remotePath); BufferedReader d = new BufferedReader(new InputStreamReader(in); String line = null; while ( (line = d.readLine() != null ) System.out.print
19、ln(line); d.close(); in.close(); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑try System.out.println("
20、;讀取文件: " + remoteFilePath);HDFSApi.cat(conf, remoteFilePath);System.out.println("n讀取完成"); catch (Exception e) e.printStackTrace();(4) 顯示HDFS中指定的文件的讀寫權(quán)限、大小、創(chuàng)建時(shí)間、路徑等信息;Shell命令:./hdfs dfs -ls -h text.txtJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;impo
21、rt java.io.*;import java.text.SimpleDateFormat;public class HDFSApi /* * 顯示指定文件的信息 */ public static void ls(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); FileStatus fileStatuses = fs.listStatus(remotePa
22、th); for (FileStatus s : fileStatuses) System.out.println("路徑: " + s.getPath().toString(); System.out.println("權(quán)限: " + s.getPermission().toString(); System.out.println("大小: " + s.getLen(); /* 返回的是時(shí)間戳,轉(zhuǎn)化為時(shí)間日期格式 */ Long timeStamp = s.getModificationTime(); SimpleDateForma
23、t format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); String date = format.format(timeStamp); System.out.println("時(shí)間: " + date); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs
24、:/localhost:9000");String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑try System.out.println("讀取文件信息: " + remoteFilePath);HDFSApi.ls(conf, remoteFilePath);System.out.println("n讀取完成"); catch (Exception e) e.printStackTrace();(5) 給定HDFS中某一個(gè)目錄,輸出該目錄下的所有文件的讀寫權(quán)限、大小
25、、創(chuàng)建時(shí)間、路徑等信息,如果該文件是目錄,則遞歸輸出該目錄下所有文件相關(guān)信息;Shell命令:./hdfs dfs -ls -R -h /user/hadoopJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;import java.text.SimpleDateFormat;public class HDFSApi /* * 顯示指定文件夾下所有文件的信息(遞歸) */ public static void lsDir(Configuration
26、conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new Path(remoteDir); /* 遞歸獲取目錄下的所有文件 */ RemoteIterator<LocatedFileStatus> remoteIterator = fs.listFiles(dirPath, true); /* 輸出每個(gè)文件的信息 */ while (remoteIterator.hasNext() FileStatus s = remoteIterator.
27、next(); System.out.println("路徑: " + s.getPath().toString(); System.out.println("權(quán)限: " + s.getPermission().toString(); System.out.println("大小: " + s.getLen(); /* 返回的是時(shí)間戳,轉(zhuǎn)化為時(shí)間日期格式 */ Long timeStamp = s.getModificationTime(); SimpleDateFormat format = new SimpleDateFormat
28、("yyyy-MM-dd HH:mm:ss"); String date = format.format(timeStamp); System.out.println("時(shí)間: " + date); System.out.println(); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localho
29、st:9000");String remoteDir = "/user/hadoop" / HDFS路徑try System.out.println("(遞歸)讀取目錄下所有文件的信息: " + remoteDir);HDFSApi.lsDir(conf, remoteDir);System.out.println("讀取完成"); catch (Exception e) e.printStackTrace();(6) 提供一個(gè)HDFS內(nèi)的文件的路徑,對(duì)該文件進(jìn)行創(chuàng)建和刪除操作。如果文件所在目錄不存在,則自動(dòng)創(chuàng)建目錄;She
30、ll命令:if $(./hdfs dfs -test -d dir1/dir2);then $(./hdfs dfs -touchz dir1/dir2/filename); else $(./hdfs dfs -mkdir -p dir1/dir2 && hdfs dfs -touchz dir1/dir2/filename); fi刪除文件:./hdfs dfs -rm dir1/dir2/filenameJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;impo
31、rt java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Configuration conf, String path) throws IOException FileSystem fs = FileSystem.get(conf); return fs.exists(new Path(path); /* * 創(chuàng)建目錄 */ public static boolean mkdir(Configuration conf, String remoteDir) throws IOException F
32、ileSystem fs = FileSystem.get(conf); Path dirPath = new Path(remoteDir); boolean result = fs.mkdirs(dirPath); fs.close(); return result; /* * 創(chuàng)建文件 */ public static void touchz(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Pa
33、th(remoteFilePath); FSDataOutputStream outputStream = fs.create(remotePath); outputStream.close(); fs.close(); /* * 刪除文件 */ public static boolean rm(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); boolean
34、 result = fs.delete(remotePath, false); fs.close(); return result; /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteFilePath = "/user/hadoop/input/text.txt" / HDFS路徑
35、String remoteDir = "/user/hadoop/input" / HDFS路徑對(duì)應(yīng)的目錄try /* 判斷路徑是否存在,存在則刪除,否則進(jìn)行創(chuàng)建 */if ( HDFSApi.test(conf, remoteFilePath) ) HDFSApi.rm(conf, remoteFilePath); / 刪除System.out.println("刪除路徑: " + remoteFilePath); else if ( !HDFSApi.test(conf, remoteDir) ) / 若目錄不存在,則進(jìn)行創(chuàng)建HDFSApi.mkdi
36、r(conf, remoteDir);System.out.println("創(chuàng)建文件夾: " + remoteDir);HDFSApi.touchz(conf, remoteFilePath);System.out.println("創(chuàng)建路徑: " + remoteFilePath); catch (Exception e) e.printStackTrace();(7) 提供一個(gè)HDFS的目錄的路徑,對(duì)該目錄進(jìn)行創(chuàng)建和刪除操作。創(chuàng)建目錄時(shí),如果目錄文件所在目錄不存在則自動(dòng)創(chuàng)建相應(yīng)目錄;刪除目錄時(shí),由用戶指定當(dāng)該目錄不為空時(shí)是否還刪除該目錄;Shell
37、命令:創(chuàng)建目錄:./hdfs dfs -mkdir -p dir1/dir2刪除目錄(如果目錄非空則會(huì)提示not empty,不執(zhí)行刪除):./hdfs dfs -rmdir dir1/dir2強(qiáng)制刪除目錄:./hdfs dfs -rm -R dir1/dir2Java代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Config
38、uration conf, String path) throws IOException FileSystem fs = FileSystem.get(conf); return fs.exists(new Path(path); /* * 判斷目錄是否為空 * true: 空,false: 非空 */ public static boolean isDirEmpty(Configuration conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new
39、 Path(remoteDir); RemoteIterator<LocatedFileStatus> remoteIterator = fs.listFiles(dirPath, true); return !remoteIterator.hasNext(); /* * 創(chuàng)建目錄 */ public static boolean mkdir(Configuration conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new Path(re
40、moteDir); boolean result = fs.mkdirs(dirPath); fs.close(); return result; /* * 刪除目錄 */ public static boolean rmDir(Configuration conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new Path(remoteDir); /* 第二個(gè)參數(shù)表示是否遞歸刪除所有文件 */ boolean result = fs.delete(dir
41、Path, true); fs.close(); return result; /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteDir = "/user/hadoop/input" / HDFS目錄Boolean forceDelete = false; / 是否強(qiáng)制刪除try
42、/* 判斷目錄是否存在,不存在則創(chuàng)建,存在則刪除 */if ( !HDFSApi.test(conf, remoteDir) ) HDFSApi.mkdir(conf, remoteDir); / 創(chuàng)建目錄System.out.println("創(chuàng)建目錄: " + remoteDir); else if ( HDFSApi.isDirEmpty(conf, remoteDir) | forceDelete ) / 目錄為空或強(qiáng)制刪除HDFSApi.rmDir(conf, remoteDir);System.out.println("刪除目錄: " + r
43、emoteDir); else / 目錄不為空System.out.println("目錄不為空,不刪除: " + remoteDir); catch (Exception e) e.printStackTrace();(8) 向HDFS中指定的文件追加內(nèi)容,由用戶指定內(nèi)容追加到原有文件的開頭或結(jié)尾;Shell命令:追加到文件末尾:./hdfs dfs -appendToFile local.txt text.txt追加到文件開頭:(由于沒有直接的命令可以操作,方法之一是先移動(dòng)到本地進(jìn)行操作,再進(jìn)行上傳覆蓋):./hdfs dfs -get text.txtcat text
44、.txt >> local.txt./hdfs dfs -copyFromLocal -f text.txt text.txtJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Configuration conf, String path) throws IOException FileSystem fs =
45、FileSystem.get(conf); return fs.exists(new Path(path); /* * 追加文本內(nèi)容 */ public static void appendContentToFile(Configuration conf, String content, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); /* 創(chuàng)建一個(gè)文件輸出流,輸出的內(nèi)容將追加到文件末尾 */ F
46、SDataOutputStream out = fs.append(remotePath); out.write(content.getBytes(); out.close(); fs.close(); /* * 追加文件內(nèi)容 */ public static void appendToFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(re
47、moteFilePath); /* 創(chuàng)建一個(gè)文件讀入流 */ FileInputStream in = new FileInputStream(localFilePath); /* 創(chuàng)建一個(gè)文件輸出流,輸出的內(nèi)容將追加到文件末尾 */ FSDataOutputStream out = fs.append(remotePath); /* 讀寫文件內(nèi)容 */ byte data = new byte1024; int read = -1; while ( (read = in.read(data) > 0 ) out.write(data, 0, read); out.close(); in
48、.close(); fs.close(); /* * 移動(dòng)文件到本地 * 移動(dòng)后,刪除源文件 */ public static void moveToLocalFile(Configuration conf, String remoteFilePath, String localFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); Path localPath = new Path(localFilePath); fs.move
49、ToLocalFile(remotePath, localPath); /* * 創(chuàng)建文件 */ public static void touchz(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); FSDataOutputStream outputStream = fs.create(remotePath); outputStream.close(); fs
50、.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteFilePath = "/user/hadoop/text.txt" / HDFS文件String content = "新追加的內(nèi)容n"String choice = "after" /追加到文件末尾/String choice = "before" / 追加到文件開頭try /* 判斷文件是否存在 */if ( !HDFSApi.test(conf, remoteFilePath) ) System.out.println("文件不存在: " + remoteFilePath); else if ( choice.equals("after") ) / 追加在文件末尾HDFSApi.app
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 研發(fā)中心場(chǎng)委托招聘合作協(xié)議
- 茶具研發(fā)與生產(chǎn)合作協(xié)議
- 財(cái)務(wù)離職保密及競(jìng)業(yè)限制合同范本
- 餐飲連鎖品牌特許經(jīng)營區(qū)域保護(hù)協(xié)議書
- 特色餐廳廚房設(shè)計(jì)與施工承包合同
- 產(chǎn)業(yè)園區(qū)場(chǎng)合作經(jīng)營與產(chǎn)業(yè)布局協(xié)議
- 跨境電商跨境支付反欺詐風(fēng)險(xiǎn)管理合同
- 旅游景區(qū)場(chǎng)地轉(zhuǎn)租管理服務(wù)協(xié)議
- 回流洗腸護(hù)理操作規(guī)范
- 2025年企業(yè)安全協(xié)議
- 羊肚菌種植項(xiàng)目可行性研究報(bào)告
- 衛(wèi)健系統(tǒng)2025年上半年安全生產(chǎn)工作總結(jié)
- 麻精藥品規(guī)范化管理與使用
- 廬江縣2024-2025學(xué)年四下數(shù)學(xué)期末達(dá)標(biāo)測(cè)試試題含解析
- 湘教版地理中考總復(fù)習(xí)教案
- 高中英語新課標(biāo)3000詞匯表(新高考)
- 2025年個(gè)人房貸還款合同格式
- 2025年度老舊小區(qū)改造工程施工合同交底范本
- 2025年福建廈門市翔安市政集團(tuán)水務(wù)管理有限公司招聘筆試參考題庫附帶答案詳解
- 江蘇2024年江蘇海事職業(yè)技術(shù)學(xué)院招聘11人(第三批)筆試歷年參考題庫附帶答案詳解
- 2025年綿陽燃?xì)饧瘓F(tuán)有限公司招聘筆試參考題庫含答案解析
評(píng)論
0/150
提交評(píng)論