2021年百度数据挖掘工程师面试题

小编:管理员 1135阅读 2021.06.17

第1题:


简答(30分)

1.【C/C++】Const作用于变量、函数、类分别有什么特性(10分)

2.内存分配中堆和栈的区各是什么?在什么时候回忆分配?(10分)

3.如何判定训练处的模型过拟合?(10分)



第2题:


算法与程序设计题(45分)

1.假设有一个数组,里面有10个元素inta[10]={0,1,2,3,4,5,6,7,8,9},请写一个算法,得到a数组的一个随机排列,要求时间复杂度尽量小,可以使用random函数,例如输出的随机序列可以使:3 6 2 4 5 1 8 9 0 (15分)

2.对于logistic regession 问题(prob(t|x)=1/(1+exp(w*x+b))且labely=0或1)请给出loss function和权重w的更新公式及推导(15分)



第3题:


系统设计题

假设我们有3个箱子,分别是红色,蓝色和绿色,在红色箱子中有3个苹果,4个橘子,3个柠檬,在蓝色箱子中有1个苹果,1个橘子和0个柠檬,在绿色箱子中有3个苹果,3个橘子和4个柠檬。如果我们选择箱子的概率是红色0.2,蓝色0.2,绿色0.6,并且选择一个箱子后,以均匀的概率随机移除一个水果,那么移除苹果的概率是多少?请给出步骤(10分)

如果我们发现移除的水果是橘子,那么这个橘子来自绿色箱子的概率是多少?请给出步骤(15分)



关联标签: