最想對媽媽說的話作文
1、有10個(gè)文件,每個(gè)文件1G,每個(gè)文件的每一行存放的都是用戶的query,每個(gè)文件的query都可能重復(fù)。要求你按照query的頻度排序。

hash映射:
1、順序讀取10個(gè)文件,按照hash(query)%10的結(jié)果將query寫入到另外10個(gè)文件(記為a0,a1,..a9)中。這樣新生成的文件每個(gè)的大小大約也1G(假設(shè)hash函數(shù)是隨機(jī)的)。
2、hash_map統(tǒng)計(jì):找一臺(tái)內(nèi)存在2G左右的機(jī)器,依次對(a0,a1,..a9)用hash_map(query, query_count)來統(tǒng)計(jì)每個(gè)query出現(xiàn)的次數(shù)。每個(gè)query出現(xiàn)一次,則count+1。
3、堆/快速/歸并排序:利用快速/堆/歸并排序按照出現(xiàn)次數(shù)進(jìn)行排序,將排序好的query和對應(yīng)的query_cout輸出到文件中,這樣得到了10個(gè)排好序的文件(記為b0,b1,..b9)。最后,對這10個(gè)文件進(jìn)行歸并排序(內(nèi)排序與外排序相結(jié)合)。
2、點(diǎn)評在和第三方網(wǎng)站合作的過程中,需要在由點(diǎn)評頁面跳轉(zhuǎn)到對方頁面的鏈接中加入信息來記錄點(diǎn)評自己的一些信息,例如用戶信息(包括id和識(shí)別串)、平臺(tái)(PC、WAP、APP等)、訪問時(shí)間等,但是對方只能保留一個(gè)由大寫字母和數(shù)字組成的字符串(長度小于等于128個(gè)字符,越短越好)來標(biāo)識(shí)這樣一次訪問,之后會(huì)將該字符串回傳給點(diǎn)評。請為這個(gè)需求設(shè)計(jì)一對加密解密函數(shù),函數(shù)原型如下:
struct DianPingInfo {
uint_32 userId, string userString, /pic/p>
Date viewTime, /pic/p>
uint_8 platform
};
string encode(uinit_32 userId, string userString, Date viewTime, short platform);
DianPingInfo decode(string);
可供編碼的字符需要大寫字母和數(shù)字總共有26+10=36個(gè),那么只能編碼5個(gè)bit,需要將編碼前的5個(gè)字節(jié)編碼為8個(gè)字節(jié)。其實(shí)考慮到算法的簡單,可以只編碼4個(gè)bit,那就是每個(gè)字節(jié)用兩個(gè)字節(jié)編碼,這樣只需要使用大寫字母而不用數(shù)字。比如 一個(gè)字節(jié)是'a' ASCII碼為0x61,二進(jìn)制為01100001,拆分為兩個(gè)4bit為0110和0001,然后都加上'A',就編碼成為了G和B。這一方式的缺點(diǎn)在于浪費(fèi)一半空間
3、場景:
考察目的:linux文件系統(tǒng)
管理員有一臺(tái)普通的pc 機(jī)器,已安裝linux操作系統(tǒng)(如:centos 6.5)。管理員告訴你,在 /data 目錄下 只有1個(gè)100MB 大小的文件。他要求你找到這個(gè)文件并將它拷貝到 /home 目錄下。
問題:
1,由于不知道文件名,只知道文件大小。你能通過使用哪些 linux工具去找到這個(gè)文件?
2,找到該文件后,使用什么linux 命令去完成文件拷貝?
3,進(jìn)行拷貝操作時(shí),系統(tǒng)提示:沒有權(quán)限。你需要檢查哪些地方?
4,進(jìn)行拷貝時(shí),系統(tǒng)提示:磁盤滿,無法寫入。你需要使用什么linux命令,檢查哪些地方?
5,你估計(jì)完成這個(gè)文件拷貝需要多長時(shí)間?寫出你認(rèn)為對拷貝時(shí)間影響比較大的因素,越多越好。
1、ls -lhs 會(huì)顯示 文件大小、讀寫執(zhí)行權(quán)限、用戶組歸屬及文件名等信息
或者直接使用find命令 find /data -size 100M
2、cp /data/test /home
3、需要查看該文件的用戶組權(quán)限,使用 ll 命令查看該文件所有者信息,添加該用戶為該文件的歸屬組
使用chown和chgrp 可以修改文件用戶組權(quán)限
4、df -h /home
查看目的地址可以空間情況,如果可用空間不足則需要將文件拷貝到其他地方,或者將其他可以空間新掛載/home下
5、cp傳輸速度大約是8M/s,傳輸時(shí)間大約為10s +
影響因素:
1)緩存。測試以前要先把分區(qū)卸載掉,然后加載。這樣才沒有緩存了。包括目錄。
如果有緩存文件和目錄,速度差別特別大。
2)還要看文件在磁盤的位置。磁盤還有一個(gè)尋道時(shí)間平均9m/s.
3)如果是網(wǎng)絡(luò)傳輸,還需要考慮網(wǎng)絡(luò)延時(shí)、網(wǎng)絡(luò)帶寬等問題。
4)另外如果有加密的話,加密算法不同會(huì)明顯影響傳輸時(shí)間,越弱的加密算法傳輸速度越快
5)壓縮問題,壓縮會(huì)降低傳輸速度
【最想對媽媽說的話作文】相關(guān)文章:
最想對父母說的話優(yōu)秀作文通用03-19
我想對媽媽說的話作文07-17
對媽媽說的話作文(精選32篇)12-27
想對媽媽說的話作文(精選30篇)11-22
想對媽媽說的話作文(精選32篇)12-25
想對媽媽說的話作文(精選27篇)05-13
想對媽媽說的話作文(通用35篇)12-25
想對媽媽說的話作文(通用20篇)05-10
對媽媽說的話作文500字(精選21篇)09-30
- 相關(guān)推薦