思而學教育網推薦百度招聘筆試題目精選集合!
一,簡答題(本題共30分)
1. 當前計算機系統一般會采用層次結構來存儲數據,請介紹下典型的計算機存儲系統一般
分為哪幾個層次,為什么采用分層存儲數據能有效提高程序的執行效率?(10分)
2. Unix/Linux系統的僵尸進程是如何產生的?有什么危害?如何避免?(10)
3. 簡述Unix/Linux系統中使用socket庫編寫服務器程序的流程,請分別用對應的socket
通信函數表示。
二,算法與程序設計題(本題共45分)
1, 使用C/C++語言寫一個函數,實現字符串的反轉,要求不能用任何系統函數,且時間復
雜度最小。函數原型是:char reverse_str(char str)(15分)
2, 給定一個如下輸入格式的字符串,(1,(2,3),(4,(5,6),7))括號內的元素可以是
數字,也可以另一個括號,請實現一個算法消除嵌套的括號。比如把上面的表達式變成:(1,2,3,4,5,6,7),如果表達式有誤請報錯。(15分)
3, 相似度計算用于衡量對象之間的相似程度,在數據挖據,自然語言處理中使一個基礎性
計算,在廣告檢索服務中往往也會判斷網民檢索Query和廣告Adword的主題相似度。假設Query或者Adword的主題屬性定義為一個長度為10000的浮點數據Pr[10000](稱之為主題概率數組),其中Pr[i]表示Query或者Adword屬于主題Id為i的概率,而Query和Adword的相似度簡化定義為兩者主題概率數組的內積,即sim(Query,Adword)=sum(QueryPr[i]AdwordPr[i])(0<==i<10000).在實際應用場景中,由于大多數主題的概率都為0,所以主題概率數組往往比較稀疏,在實現時會以一個緊湊型數組topic_info_t[]的方式保存,其中100<=數組大小<=1000,并按照topic_id遞增排列,0<=topic_id<10000,0
現在給出Query的topic_info_t數組和N(N>=5000)個Adwords的 topic_info-t數組,現要求出Query與Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i& query_topic_info, Const vector adwords_topic_info[], Int adwords_number);
編寫代碼求時間復雜度最低的算法,并給出時間復雜度分析。(15分)
三,系統設計題(本題共25分)
在企業中,對生產數據進行分析具有很重要的意義。但是生產數據通常不能直接用于數據分析,通常需要進行抽取,轉換和加載,也就是業界常識的ETL
相關文章推薦:
應對微軟公司筆試的絕招
愛立信往年筆試真題
谷歌2015招聘筆試試題心得與答案分享
移動筆試題目精選